計算機視覺研究中, 目標檢測 是一個比分類更困難的領域,我們將回顧它的歷史和最近的發展。 在深度學習時代之前,像 HOG 和特征金字塔這樣的手工特性被廣泛用于獲取圖像中的定位信號。 然而,這些方法通常不能很好地擴展到通用的目標檢測,所以大多數的應用僅限于 人臉識別 或者行人檢測。
一共搜集了65篇2D目標檢測論文,涉及:通用目標檢測、旋轉目標檢測、Few-shot/自監督/半監督/無監督目標檢測等方向。 最新! CVPR 2021 視覺Transformer論文大盤點(43篇)
由于低分辨率低,像素有限,小目標檢測很困難。 例如,通過只看下圖上的目標,人類甚至很難識別這些物體。 然而,通過考慮到它位于天空中的背景,這個物體可以被識別為鳥類。 因此,我們認為,解決這個問題的關鍵取決于我們如何將上下文作為額外信息來幫助檢測小目標。
有研究員提出了一種利用上下文的目標檢測方法來提高檢測小目標的精度。 該方法通過連接多尺度特征,使用了來自不同層的附加特征作為上下文。 研究員還提出了具有注意機制的目標檢測,它可以關注圖像中的目標,并可以包括來自目標層的上下文信息。 實驗結果表明,該方法在檢測小目標方面的精度高于傳統的SSD框架。 下圖顯示了SSD框架無法檢測到小目標時的案例情況。