2015年,YOLO之后,另外一個(gè)直接回歸的方法SSD,以state-of-the-art的檢測(cè)效果和檢測(cè)效率橫空出世;
SSD,single shot multibox detector
直接看下圖吧,可以看出,YOLO是在卷積層后加了FC,然后預(yù)估2*7*7共49個(gè)位置98BBox;而SSD顯著的不同就是多尺度:1) 多尺度的feature map上提取特征,通過(guò)3*3的卷積核,保證特征的細(xì)粒度和豐富性; 2) 多尺度f(wàn)eature map上抽取anchor,每張圖共有7308個(gè)BBox,遠(yuǎn)大于YOLO的98;
上圖中,Conv4_3上面的Conv: 3*3(4*(classes+4)),前面的3*3是卷積核,后面的4是每個(gè)點(diǎn)的有4個(gè)anchor,所以這一層共有38*38*4個(gè)BBox,把7個(gè)卷積層加起來(lái),一共就是7308個(gè)BBox;
另外,每個(gè)正例BBox學(xué)習(xí)的并不是絕對(duì)位置或者相對(duì)grid的位置,而是相對(duì)于ground truch的偏移,如下圖:
因此,其loss function包括兩部分,分類的confidence+回歸相對(duì)ground truth的位置偏移,如下:
在VOC和COCO上的效果
1. 準(zhǔn)確率上:VOC達(dá)到最高80%,COCO這個(gè)小物體也是最高26.8%;
2. 速度上,500尺寸下,SSD和YOLO基本持平,20幀,但是mAP高10點(diǎn);
另外,16年的YOLOv2在檢測(cè)效果和速度上更高一層,在效果保持state-of-the-art的基礎(chǔ)上,F(xiàn)PS能達(dá)到50+,是SSD的2倍+,但是!小物體檢測(cè)依然是YOLO的短板,COCO上的依然低于SSD5個(gè)百分點(diǎn),如下:
SSD: Single Shot MultiBox DetectorWei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg
-
SSD
+關(guān)注
關(guān)注
21文章
3120瀏覽量
122308 -
voc
+關(guān)注
關(guān)注
0文章
111瀏覽量
16215
發(fā)布評(píng)論請(qǐng)先 登錄
神經(jīng)網(wǎng)絡(luò)的初步認(rèn)識(shí)
自動(dòng)駕駛中常提的卷積神經(jīng)網(wǎng)絡(luò)是個(gè)啥?
CNN卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)原理及在MCU200T上仿真測(cè)試
NMSIS神經(jīng)網(wǎng)絡(luò)庫(kù)使用介紹
構(gòu)建CNN網(wǎng)絡(luò)模型并優(yōu)化的一般化建議
卷積運(yùn)算分析
在Ubuntu20.04系統(tǒng)中訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗(yàn)
CICC2033神經(jīng)網(wǎng)絡(luò)部署相關(guān)操作
液態(tài)神經(jīng)網(wǎng)絡(luò)(LNN):時(shí)間連續(xù)性與動(dòng)態(tài)適應(yīng)性的神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)的并行計(jì)算與加速技術(shù)
基于FPGA的SSD目標(biāo)檢測(cè)算法設(shè)計(jì)
【嘉楠堪智K230開發(fā)板試用體驗(yàn)】01 Studio K230開發(fā)板Test2——手掌,手勢(shì)檢測(cè),字符檢測(cè)
卷積神經(jīng)網(wǎng)絡(luò)如何監(jiān)測(cè)皮帶堵料情況 #人工智能
無(wú)刷電機(jī)小波神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)子位置檢測(cè)方法的研究
自動(dòng)駕駛感知系統(tǒng)中卷積神經(jīng)網(wǎng)絡(luò)原理的疑點(diǎn)分析
卷積神經(jīng)網(wǎng)絡(luò)物體檢測(cè)SSD
評(píng)論