91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

卷積神經網絡 物體檢測 YOLOv2

倩倩 ? 來源:三姐的哥 ? 2020-04-17 15:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

繼2015的YOLO后,2016年作者對YOLO升級到YOLO2,另外一個版本YOLO9000是基于wordtree跨數據集達到檢測9000個分類,卷積層模型稱為darknet-19,達到速度和效果的雙提升,文章里充滿了作者的自豪,也值得自豪;

作者正視了YOLO的兩個大問題:回歸框不精準和召回不夠;一般的解決思路都是把網絡加深加寬,不過本文不屑,作者反而要通過優(yōu)化網絡學習在準確率不降的情況下提升精度和召回!

升級點

Batch Normalization:每個卷積層加了BN,正則都不要了,droupout也省了,過擬合也沒了,效果還好了,+2%mAP;

High Resolution Classifier - 高分辨率分類:模型訓練時經典做法都是先在ImageNet上pre-train,然而ImageNet上的圖片是低分辨率小于256*256的,而要檢測的圖片是高分辨率448*448的,這樣模型需要同時在高分辨的圖片上做fine-tune和檢測,所以作者提出了三步驟 1) 在ImageNet低分辨率上pre-train;2) 在高分辨率數據集上fine-tune;3) 在高分辨率數據集上檢測;使得模型更容易學習,+4%mAP

Convolution with Anchor Boxer - 加Anchor機制:YOLO是通過最后的全連接層直接預估絕對坐標,而FasterRCNN是通過卷積層預估相對坐標,作者認為這樣更容易學習,因此YOLOv2去掉了全連接層,在最后一層卷積層下采樣后用Anchor,yolo有7*7*2 = 98個框,而YOLOv2有超過1k的anchor,最終效果上雖然mAP略有下降3個千分點,但是召回提升7個百分點,值了!

Dimension Clusters - 維度聚類: Anchor的尺寸faster rcnn里人工選定的,YOLOv2通過k-mean聚類的方法,將訓練數據里gt的框進行聚類,注意這里不能直接用歐式距離,大框會比小框影響大,我們的目標是IOU,因此距離為: d(box, centroid) = 1 IOU(box, centroid);下圖是結果,左圖是k和IOU的trand-off,右圖是5個中心的框尺寸,明顯看出和人工指定的差異很大;

Direct location prediction - 直接預測位置:直接預測x,y會導致模型訓練不穩(wěn)定,本文預測如下tx,ty,tw,th,to,通過sigmolid歸一化到(0,1),結合dimension clusters,+5%mAP

Fine-Grained Freture - 細粒度特征:引入passthrough layer,將低維度特征傳遞給高維度,類似于resnet的shortcut,+1%mAP;

Multi-Scale Training - 多尺度訓練:這里的多尺度是圖片的尺寸,多了迫使模型適應更大范圍的尺寸,每隔一定的epoch就強制改變輸入圖片的尺寸;

效果

如下是在VOC數據集上效率(每秒處理幀數)和效果(mAP)空間里不同算法的變現,其中YOLOv2為藍色,有不同的trade-off,效率和效果都超過已有的方法;

如下是更多的實驗結果:

如下是COCO上的效果,看得出COCO數據集還是很難的,小物體上YOLO2依然是差一些;

YOLO9000: Better, Faster, Stronger

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4784

    瀏覽量

    98060
  • 數據集
    +關注

    關注

    4

    文章

    1236

    瀏覽量

    26196
  • voc
    voc
    +關注

    關注

    0

    文章

    110

    瀏覽量

    16191
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    神經網絡的初步認識

    日常生活中的智能應用都離不開深度學習,而深度學習則依賴于神經網絡的實現。什么是神經網絡?神經網絡的核心思想是模仿生物神經系統的結構,特別是大腦中神經
    的頭像 發(fā)表于 12-17 15:05 ?330次閱讀
    <b class='flag-5'>神經網絡</b>的初步認識

    自動駕駛中常提的卷積神經網絡是個啥?

    在自動駕駛領域,經常會聽到卷積神經網絡技術。卷積神經網絡,簡稱為CNN,是一種專門用來處理網格狀數據(比如圖像)的深度學習模型。CNN在圖像處理中尤其常見,因為圖像本身就可以看作是由像
    的頭像 發(fā)表于 11-19 18:15 ?2077次閱讀
    自動駕駛中常提的<b class='flag-5'>卷積</b><b class='flag-5'>神經網絡</b>是個啥?

    CNN卷積神經網絡設計原理及在MCU200T上仿真測試

    數的提出很大程度的解決了BP算法在優(yōu)化深層神經網絡時的梯度耗散問題。當x&gt;0 時,梯度恒為1,無梯度耗散問題,收斂快;當x&lt;0 時,該層的輸出為0。 CNN
    發(fā)表于 10-29 07:49

    NMSIS神經網絡庫使用介紹

    :   神經網絡卷積函數   神經網絡激活函數   全連接層函數   神經網絡池化函數   Softmax 函數   神經網絡支持功能
    發(fā)表于 10-29 06:08

    構建CNN網絡模型并優(yōu)化的一般化建議

    整個模型非常巨大。所以要想實現輕量級的CNN神經網絡模型,首先應該避免嘗試單層神經網絡。 2)減少卷積核的大小:CNN神經網絡是通過權值共
    發(fā)表于 10-28 08:02

    卷積運算分析

    的數據,故設計了ConvUnit模塊實現單個感受域規(guī)模的卷積運算. 卷積運算:不同于數學當中提及到的卷積概念,CNN神經網絡中的卷積嚴格意義
    發(fā)表于 10-28 07:31

    在Ubuntu20.04系統中訓練神經網絡模型的一些經驗

    構建卷積神經網絡模型 model = models.Sequential()model.add(layers.Conv2D(input_shape=(28, 28, 1), filters=4
    發(fā)表于 10-22 07:03

    CICC2033神經網絡部署相關操作

    讀取。接下來需要使用擴展指令,完成神經網絡的部署,此處僅對第一層卷積+池化的部署進行說明,其余層與之類似。 1.使用 Custom_Dtrans 指令,將權重數據、輸入數據導入硬件加速器內。對于權重
    發(fā)表于 10-20 08:00

    液態(tài)神經網絡(LNN):時間連續(xù)性與動態(tài)適應性的神經網絡

    1.算法簡介液態(tài)神經網絡(LiquidNeuralNetworks,LNN)是一種新型的神經網絡架構,其設計理念借鑒自生物神經系統,特別是秀麗隱桿線蟲的神經結構,盡管這種微生物的
    的頭像 發(fā)表于 09-28 10:03 ?1224次閱讀
    液態(tài)<b class='flag-5'>神經網絡</b>(LNN):時間連續(xù)性與動態(tài)適應性的<b class='flag-5'>神經網絡</b>

    神經網絡的并行計算與加速技術

    隨著人工智能技術的飛速發(fā)展,神經網絡在眾多領域展現出了巨大的潛力和廣泛的應用前景。然而,神經網絡模型的復雜度和規(guī)模也在不斷增加,這使得傳統的串行計算方式面臨著巨大的挑戰(zhàn),如計算速度慢、訓練時間長等
    的頭像 發(fā)表于 09-17 13:31 ?1129次閱讀
    <b class='flag-5'>神經網絡</b>的并行計算與加速技術

    【嘉楠堪智K230開發(fā)板試用體驗】01 Studio K230開發(fā)板Test2——手掌,手勢檢測,字符檢測

    這篇發(fā)完就繼續(xù)去整比賽了,后續(xù)看電賽上k230的發(fā)揮吧 之前的顏色識別和二維碼識別功能,類似于使用基礎工具進行圖像分析,適用于簡單任務,但在復雜場景下能力有限。 KPU(神經網絡處理器)則是
    發(fā)表于 07-10 09:45

    卷積神經網絡如何監(jiān)測皮帶堵料情況 #人工智能

    卷積神經網絡
    jf_60804796
    發(fā)布于 :2025年07月01日 17:08:42

    無刷電機小波神經網絡轉子位置檢測方法的研究

    MATLAB/SIMULINK工具對該方法進行驗證,實驗結果表明該方法在全程速度下效果良好。 純分享帖,點擊下方附件免費獲取完整資料~~~ *附件:無刷電機小波神經網絡轉子位置檢測方法的研究.pdf
    發(fā)表于 06-25 13:06

    RV1126 yolov8訓練部署教程

    YOLOv8 是 ultralytics 公司在 2023 年 1月 10 號開源的基于YOLOV5進行更新的 下一個重大更新版本,目前支持圖像分類、物體檢測和實例分割任務,鑒于Yolov
    的頭像 發(fā)表于 04-16 14:53 ?1458次閱讀
    RV1126 <b class='flag-5'>yolov</b>8訓練部署教程

    自動駕駛感知系統中卷積神經網絡原理的疑點分析

    背景 卷積神經網絡(Convolutional Neural Networks, CNN)的核心技術主要包括以下幾個方面:局部連接、權值共享、多卷積核以及池化。這些技術共同作用,使得CNN在圖像
    的頭像 發(fā)表于 04-07 09:15 ?848次閱讀
    自動駕駛感知系統中<b class='flag-5'>卷積</b><b class='flag-5'>神經網絡</b>原理的疑點分析