作者:Nathan Zhao
編譯:ronghuaiyang
導(dǎo)讀
在本文中,我們將討論目標(biāo)檢測模型和Objectness的基礎(chǔ)知識(shí)。
什么是物體檢測模型?
物體檢測模型本質(zhì)上,正如其名稱所示,檢測物體。這意味著給定一個(gè)圖像,它可以告訴你物體在哪里,以及這個(gè)物體是什么。例如,在上面的圖像中,我們有許多物體,并且使用物體檢測模型,我們已經(jīng)檢測出不同的物體在圖像中的位置。
這類模型有很多應(yīng)用。舉幾個(gè)例子,物體檢測在以下方面很有用:
自動(dòng)駕駛汽車,可以檢測到乘客、其他車輛、紅綠燈和停車標(biāo)志。
安保,模型可以探測到公共區(qū)域的槍支或炸彈,并向附近的警察報(bào)警。
總的來說,這類模型非常有用,在過去幾年里,機(jī)器學(xué)習(xí)社區(qū)已經(jīng)對(duì)它們進(jìn)行了大量的研究。
物體檢測中區(qū)域建議的介紹
首先,讓我們了解一下物體檢測模型是如何工作的。首先,我們必須給出一個(gè)物體的建議位置。我們把這個(gè)建議的位置稱為我們感興趣的區(qū)域,通常顯示在一個(gè)邊界框(也稱為圖像窗口)中。根據(jù)物體檢測模型的類型,我們可以通過許多不同的方式來實(shí)現(xiàn)這一點(diǎn)。
樸素方法:我們將圖像分割成多個(gè)部分,并對(duì)每個(gè)部分進(jìn)行分類。這種方法效率低下是因?yàn)楸仨殞?duì)每個(gè)生成的窗口應(yīng)用分類網(wǎng)絡(luò)(CNN),導(dǎo)致計(jì)算時(shí)間長。
滑動(dòng)窗口方法:我們預(yù)先確定好窗口比例(或“錨”),然后滑過圖像。對(duì)于每個(gè)窗口,我們處理它并繼續(xù)滑動(dòng)。與樸素方法類似,這種方法生成的窗口較多,處理時(shí)間也比較長。
選擇性搜索:使用顏色相似度,紋理相似度,和一些其他的圖像細(xì)節(jié),我們可以用算法將圖像分割成區(qū)域。雖然選擇性搜索算法本身是耗時(shí)的,但這使得分類網(wǎng)絡(luò)的應(yīng)用需求較少。
區(qū)域建議網(wǎng)絡(luò):我們創(chuàng)建一個(gè)單獨(dú)的網(wǎng)絡(luò)來確定圖像中感興趣的區(qū)域。這使得我們的模型工作得更快,但也使得我們最終模型的準(zhǔn)確性依賴于多個(gè)網(wǎng)絡(luò)。
上面列出的這些不同選項(xiàng)之間有一些區(qū)別,但一般來說,當(dāng)我們加快網(wǎng)絡(luò)的處理時(shí)間時(shí),我們往往會(huì)犧牲模型的準(zhǔn)確性。
區(qū)域建議機(jī)制的主要問題是,如果建議的區(qū)域不包含物體,那么你的分類網(wǎng)絡(luò)也會(huì)去分類這個(gè)區(qū)域,并給出一個(gè)錯(cuò)誤的標(biāo)記。
那么,什么是Objectness?
Objectness本質(zhì)上是物體存在于感興趣區(qū)域內(nèi)的概率的度量。如果我們Objectness很高,這意味著圖像窗口可能包含一個(gè)物體。這允許我們快速地刪除不包含任何物體的圖像窗口。
如果一幅圖像具有較高的Objectness,我們期望它具有:
在整個(gè)圖像中具有唯一性
物體周圍有嚴(yán)格的邊界
與周圍環(huán)境的外觀不同
例如,在上面的圖像中,我們期望紅色框具有較低的Objectness,藍(lán)色框具有中等的Objectness,綠色框具有較高的Objectness。這是因?yàn)榫G色的框“緊密”地圍繞著我們的物體,而藍(lán)色的框則很松散,而紅色的框根本不包含任何物體。
我們?nèi)绾味攘縊bjectness?
有大量的參數(shù)影響圖像窗口的objectness。
多尺度顯著性:這本質(zhì)上是對(duì)圖像窗口的外觀獨(dú)特性的度量。與整個(gè)圖像相比,框中唯一性像素的密度越高,該值就越高。
顏色對(duì)比度:框內(nèi)像素與建議圖像窗口周圍區(qū)域的顏色對(duì)比度越大,該值越大。
邊緣密度:我們定義邊緣為物體的邊界,這個(gè)值是圖像窗口邊界附近的邊緣的度量值。一個(gè)有趣的算法可以找到這些邊緣:https://cv-tricks.com/opencv-dnn/edge-detection-hed/。
超像素跨越:我們定義超像素是幾乎相同顏色的像素團(tuán)。如果該值很高,則框內(nèi)的所有超像素只包含在其邊界內(nèi)。
超像素區(qū)域以不同顏色顯示。請(qǐng)注意,框內(nèi)的超像素大部分不會(huì)泄漏到圖像窗口之外。因此,這個(gè)“超素跨界”值將會(huì)很高。
以上參數(shù)值越高,objectness越高。試著將上述參數(shù)與我們前面列出的具有高objectness的圖像的期望聯(lián)系起來。
英文原文:https://medium.com/@zhao.nathan/understanding-objectness-in-object-detection-models-5d8c9d032488
本文轉(zhuǎn)自:AI公園,作者:Nathan Zhao,編譯:ronghuaiyang,
轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。
審核編輯:何安
-
物體檢測
+關(guān)注
關(guān)注
0文章
8瀏覽量
9349
發(fā)布評(píng)論請(qǐng)先 登錄
YOLO5目標(biāo)檢測方案-基于米爾RK3576開發(fā)板
廣和通發(fā)布端側(cè)目標(biāo)檢測模型FiboDet
知識(shí)分享 | 使用MXAM進(jìn)行AUTOSAR模型的靜態(tài)分析:Embedded Coder與TargetLink模型
潤和軟件“潤知“知識(shí)處理大模型榮登“2025中國大模型TOP30”榜單
AIcube1.4目標(biāo)檢測模型導(dǎo)入yolotxt格式數(shù)據(jù)集后一直顯示數(shù)據(jù)正在解析,為什么?
使用aicube進(jìn)行目標(biāo)檢測識(shí)別數(shù)字項(xiàng)目的時(shí)候,在評(píng)估環(huán)節(jié)卡住了,怎么解決?
【VisionFive 2單板計(jì)算機(jī)試用體驗(yàn)】在 VisionFive 2 上為目標(biāo)檢測準(zhǔn)備軟件環(huán)境并運(yùn)行 MobileNet-SSD 模型
基于FPGA的SSD目標(biāo)檢測算法設(shè)計(jì)
大模型在半導(dǎo)體行業(yè)的應(yīng)用可行性分析
請(qǐng)問嘉楠平臺(tái)k230訓(xùn)練的跌倒檢測模型里面的設(shè)置是怎么樣的?
基于LockAI視覺識(shí)別模塊:C++目標(biāo)檢測
基于LockAI視覺識(shí)別模塊:C++目標(biāo)檢測
目標(biāo)檢測模型和Objectness的知識(shí)
評(píng)論