91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百度視覺(jué)團(tuán)隊(duì)在全球最大規(guī)模目標(biāo)檢測(cè)競(jìng)賽,中國(guó)團(tuán)隊(duì)從全球450多支參賽隊(duì)伍中脫穎而出

DPVg_AI_era ? 來(lái)源:未知 ? 作者:李倩 ? 2018-09-14 08:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在Google主辦的最大規(guī)模開(kāi)放圖像目標(biāo)檢測(cè)競(jìng)賽中,中國(guó)團(tuán)隊(duì)再次獲得冠軍。獲獎(jiǎng)技術(shù)采用了FPN,cascade-rcnn等最新的檢測(cè)算法,并面向復(fù)雜實(shí)際場(chǎng)景數(shù)據(jù)集對(duì)算法進(jìn)行了改進(jìn),模型性能實(shí)現(xiàn)了大幅提升。

眼睛是人類接觸外部世界的第一感官,對(duì)于機(jī)器而言,計(jì)算機(jī)視覺(jué)技術(shù)就是它們的“眼睛”。近日,百度視覺(jué)團(tuán)隊(duì)在全球最大規(guī)模目標(biāo)檢測(cè)競(jìng)賽Google AI Open Images-Object Detection Track中從全球450多支參賽隊(duì)伍中脫穎而出,獲得世界第一,并在ECCV 2018上進(jìn)行分享。

Google AI Open Images-Object Detection Track是大規(guī)模目標(biāo)檢測(cè)任務(wù)的權(quán)威挑戰(zhàn)賽事,由Google AI Research舉辦,賽事遵循 PASCAL VOC、ImageNet和COCO等賽事傳統(tǒng),但數(shù)據(jù)規(guī)模遠(yuǎn)大于這些賽事。

Open Images V4數(shù)據(jù)集

據(jù)介紹,大賽采用Google今年5月份發(fā)布的Open Images V4數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù)集,包含超過(guò)170萬(wàn)的圖片數(shù)據(jù),500個(gè)類別以及超過(guò)1200萬(wàn)物體框,數(shù)據(jù)沒(méi)有完全精細(xì)標(biāo)注,屬于弱監(jiān)督任務(wù),框選類別數(shù)目不均衡且有非常廣泛的類別分布,這更符合實(shí)際情況,也意味著參加競(jìng)賽的團(tuán)隊(duì)需要考慮到類別的分布,而不能統(tǒng)一對(duì)所有類別做處理,因此更具挑戰(zhàn)性。這項(xiàng)賽事有助于復(fù)雜模型的研究,同時(shí)對(duì)評(píng)估不同檢測(cè)模型的性能有積極的促進(jìn)作用。下圖為Open Image V4 與 MS COCO 和 ImageNet 檢測(cè)任務(wù)數(shù)據(jù)對(duì)比情況。

Open Image V4 與 MS COCO及ImageNet 檢測(cè)數(shù)據(jù)對(duì)比情況

與傳統(tǒng)的檢測(cè)數(shù)據(jù)集合相比,該賽事除了數(shù)據(jù)規(guī)模大、更真實(shí)之外,還存在一系列的挑戰(zhàn)。具體來(lái)說(shuō),主要集中在以下三個(gè)方面:

數(shù)據(jù)分布不均衡:最少的類別框選只有14個(gè),而最多的類別框選超過(guò)了140w,數(shù)據(jù)分布嚴(yán)重不均衡。

類別框數(shù)量分布

漏標(biāo)框:很多圖片存在只標(biāo)注主體類別,其他小物體或者非目標(biāo)物體沒(méi)有標(biāo)注出來(lái)。

漏標(biāo)注圖片舉例

尺度變化大:大部分物體框只占整個(gè)圖片的0.1以下,而有些框選卻占了整個(gè)圖片區(qū)域。如圖所示,Open Image V4集合存在更多的小物體,參賽者也會(huì)在檢測(cè)數(shù)據(jù)中遇到更大的挑戰(zhàn)。

框尺度大小分布對(duì)比

解決方案

在比賽過(guò)程中百度視覺(jué)團(tuán)隊(duì)采用了不同復(fù)雜度、不同骨架網(wǎng)絡(luò)進(jìn)行模型的訓(xùn)練,并對(duì)這些模型進(jìn)行融合。從整體方案框架來(lái)看,可分為Fast R-CNN和Faster R-CNN兩種不同的訓(xùn)練模式。Fast R-CNN版本是該團(tuán)隊(duì)研發(fā)的一套PaddlePaddle版本,在此基礎(chǔ)上Faster R-CNN加入了 FPN、Deformable、Cascade等最新的檢測(cè)算法,模型性能實(shí)現(xiàn)了大幅度的提升。

整體方案框架流程圖

骨架網(wǎng)絡(luò)為ResNet-101 的Fast R-CNN,模型收斂后可以達(dá)到0.481,在測(cè)試階段加入Soft NMS以及 Multi-Scale Testing策略,可以達(dá)到0.508。研究人員也嘗試了其他骨架網(wǎng)絡(luò)(dpn98,Inception-v4,Se-ResNext101),并把不同骨架網(wǎng)絡(luò)的檢測(cè)算法融合到一起,最終mAP可以達(dá)到0.546。在Proposal采樣階段,團(tuán)隊(duì)使用在不同位置進(jìn)行不同尺度的候選框生成,然后對(duì)這些框選進(jìn)行分類以及調(diào)整他們的位置。

Faster R-CNN: 采用這種框架可以達(dá)到略高于Fast R-CNN,mAP為0.495。在測(cè)試階段使用Soft NMS以及 Multi-Scale Testing策略后,性能達(dá)到0.525。

Deformable Convolutional Networks使用Soft NMS以及 Multi-Scale Testing策略前后,性能分別達(dá)到0.528及0.559。

Deformable Cascade R-CNN : 使用Soft NMS以及 Multi-Scale Testing策略前后,性能分別可以達(dá)到0.581和0.590.

簡(jiǎn)言之,在Fast R-CNN框架下,該團(tuán)隊(duì)采用了不同的骨架網(wǎng)絡(luò)進(jìn)行訓(xùn)練,而在Faster R-CNN框架下只使用了ResNet101這種骨架網(wǎng)絡(luò)進(jìn)行訓(xùn)練。在訓(xùn)練過(guò)程中,還通過(guò)不同的策略有效解決了各種技術(shù)問(wèn)題。詳情如下:

動(dòng)態(tài)采樣

Google Open Images V4 數(shù)據(jù)集大概有170w圖片,1220w框選,500個(gè)類別信息。最大的類別框選超過(guò)了140w,最小的類別只有14個(gè)框選,如果簡(jiǎn)單使用所有的圖片及框選,需要幾十天才能進(jìn)行模型訓(xùn)練,而且很難訓(xùn)練出來(lái)一個(gè)無(wú)偏的模型。因此,需要在訓(xùn)練過(guò)程中進(jìn)行動(dòng)態(tài)采樣,如果樣本數(shù)量多則減少采樣概率,而樣本數(shù)量少則增加采樣概率。研究人員分別進(jìn)行全集數(shù)據(jù)訓(xùn)練、固定框選子集訓(xùn)練、動(dòng)態(tài)采樣模型訓(xùn)練三種策略進(jìn)行。

全集數(shù)據(jù)訓(xùn)練:按照主辦方提供數(shù)據(jù)進(jìn)行訓(xùn)練,mAP達(dá)到0.50。

固定框選子集訓(xùn)練:線下固定對(duì)每個(gè)類別最多選擇1000個(gè)框,mAP達(dá)到0.53。

動(dòng)態(tài)采樣模型訓(xùn)練:對(duì)每個(gè)GPU、每個(gè)Epoch采用線上動(dòng)態(tài)采樣,每次采集的數(shù)據(jù)都不同,輪數(shù)達(dá)到一定數(shù)目后,整個(gè)全集的數(shù)據(jù)都能參與整體訓(xùn)練。最后mAp達(dá)到0.56。

動(dòng)態(tài)采樣策略

FPN

基于訓(xùn)練數(shù)據(jù)集的分析,研究人員發(fā)現(xiàn)其中500個(gè)類別的尺度有很大的差異。因此他們將FPN引入到檢測(cè)模型中,即利用多尺度多層次金字塔結(jié)構(gòu)構(gòu)建特征金字塔網(wǎng)絡(luò)。在實(shí)驗(yàn)中,他們以ResNet101作為骨干網(wǎng)絡(luò),在不同階段的最后一層添加了自頂向下的側(cè)連接。自頂向下的過(guò)程是向上采樣進(jìn)行的,水平連接是將上采樣的結(jié)果與自底向上生成的相同大小的feature map合并。融合后,對(duì)每個(gè)融合結(jié)果進(jìn)行3*3卷積以消除上采樣的混疊效應(yīng)。值得注意的是,F(xiàn)PN應(yīng)該嵌入到RPN網(wǎng)絡(luò)中,以生成不同的尺度特征并整合為RPN網(wǎng)絡(luò)的輸入。最終,引入FPN后的mAP可達(dá)到0.528。

Deformable Convolution Networks

該團(tuán)隊(duì)采用可變形卷積神經(jīng)網(wǎng)絡(luò)增強(qiáng)了CNNs的建模能力??勺冃尉矸e網(wǎng)絡(luò)的思想是在不需要額外監(jiān)督的情況下,通過(guò)對(duì)目標(biāo)任務(wù)的學(xué)習(xí),在空間采樣點(diǎn)上增加額外的偏移量模塊。同時(shí)將可變形卷積網(wǎng)絡(luò)應(yīng)用于以ResNet101作為骨架網(wǎng)絡(luò)的Faster R-CNN架構(gòu),并在ResNet101的res5a、5b、5c層之后應(yīng)用可變形卷積層,并將ROI Pooling層改進(jìn)為可變形位置敏感ROI Pooling層??勺冃尉矸e網(wǎng)絡(luò)的mAP性能為0.552。

Cascade R-CNN

比賽中,該團(tuán)隊(duì)使用級(jí)聯(lián)的R-CNN來(lái)訓(xùn)練檢測(cè)模型。除訓(xùn)練基本模型外,還使用包含五個(gè)尺度特征金字塔網(wǎng)絡(luò)(FPN)和3個(gè)尺度anchors的RPN網(wǎng)絡(luò)。此外,他們還訓(xùn)練了一個(gè)針對(duì)全類模型中表現(xiàn)最差的150類的小類模型,并對(duì)這150類的模型別進(jìn)行評(píng)估。得出的結(jié)論是,500類模型的MAP為0.477,而用150類單模型訓(xùn)練結(jié)果替換500類的后150類的結(jié)果,則模型的MAP提升為0.498。使用以上方法進(jìn)行訓(xùn)練的單尺度模型的性能為0.573。

Testing Tricks

在后處理階段,團(tuán)隊(duì)使Soft NMS和多尺度測(cè)試的方法。用Soft NMS的方法代替NMS后,在不同模型上有0.5-1.3點(diǎn)的改進(jìn),而Multi-Scale Testing在不同模型上則有0.6-2個(gè)點(diǎn)的提升。

模型融合

對(duì)于每個(gè)模型,該團(tuán)隊(duì)在NMS后預(yù)測(cè)邊界框。來(lái)自不同模型的預(yù)測(cè)框則使用一個(gè)改進(jìn)版的NMS進(jìn)行合并,具體如下:

給每個(gè)模型一個(gè)0~1之間的標(biāo)量權(quán)重。所有的權(quán)重總和為1;

從每個(gè)模型得到邊界框的置信分?jǐn)?shù)乘以它對(duì)應(yīng)的權(quán)重;

合并從所有模型得到的預(yù)測(cè)框并使用NMS,此外,除此之外,研究人員采用不同模型的分?jǐn)?shù)疊加的方式代替只保留最高分模型,在這個(gè)步驟中IOU閾值為0.5。

其實(shí),不論是在學(xué)術(shù)圈還是工業(yè)界,大規(guī)模目標(biāo)檢測(cè)都是計(jì)算機(jī)視覺(jué)極為重要的基礎(chǔ)技術(shù)。通過(guò)這一技術(shù),軟硬件應(yīng)用產(chǎn)品可以深度定位圖片中的物體位置以及類別,并用于新零售、通用多物品識(shí)別等場(chǎng)景。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 百度
    +關(guān)注

    關(guān)注

    9

    文章

    2377

    瀏覽量

    94881
  • 計(jì)算機(jī)視覺(jué)

    關(guān)注

    9

    文章

    1715

    瀏覽量

    47630

原文標(biāo)題:【ECCV 2018】谷歌AI超大規(guī)模圖像競(jìng)賽,中國(guó)團(tuán)隊(duì)獲目標(biāo)檢測(cè)冠軍

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    長(zhǎng)城汽車斬獲2025年中國(guó)青年科技創(chuàng)新“揭榜掛帥”擂臺(tái)賽一等獎(jiǎng)

    動(dòng)力電池安全預(yù)警與健康管理領(lǐng)域的突破性技術(shù)成果,全國(guó)參賽隊(duì)伍脫穎而出,成功斬獲青年科技人
    的頭像 發(fā)表于 12-18 13:54 ?377次閱讀

    優(yōu)秀作品專訪|把“國(guó)產(chǎn)芯”情懷寫進(jìn)團(tuán)隊(duì)DNA:2025嵌賽FPGA競(jìng)賽紫光同創(chuàng)杯全國(guó)總決賽“最佳工程獎(jiǎng)”作品展示

    ”共吸引926學(xué)生隊(duì)伍報(bào)名參賽,同比增長(zhǎng)50%,成功登頂參賽隊(duì)伍第一寶座!作為紫光同創(chuàng)高校生態(tài)合作伙伴,小眼睛科技連續(xù)4年為賽事提供全程技術(shù)支持和指導(dǎo)服務(wù),助力高
    的頭像 發(fā)表于 12-08 08:03 ?636次閱讀
    優(yōu)秀作品專訪|把“國(guó)產(chǎn)芯”情懷寫進(jìn)<b class='flag-5'>團(tuán)隊(duì)</b>DNA:2025嵌賽FPGA<b class='flag-5'>競(jìng)賽</b>紫光同創(chuàng)杯全國(guó)總決賽“最佳工程獎(jiǎng)”作品展示

    openDACS 2025 開(kāi)源EDA與芯片賽項(xiàng) 賽題七:基于大模型的生成式原理圖設(shè)計(jì)

    參賽隊(duì)伍需要選擇不同類型的案例來(lái)驗(yàn)證所設(shè)計(jì)的系統(tǒng)的效果。案例類型的劃分標(biāo)準(zhǔn)由參賽隊(duì)伍自定,但需闡述劃分標(biāo)準(zhǔn)的合理性 案例的復(fù)雜:某些PCB設(shè)計(jì)具有復(fù)雜的外圍電路和較大規(guī)模的元器件數(shù)
    發(fā)表于 11-13 11:49

    TI杯2025年全國(guó)大學(xué)生電子設(shè)計(jì)競(jìng)賽總測(cè)評(píng)圓滿落幕

    ,最終共產(chǎn)生 404 全國(guó)一等獎(jiǎng)隊(duì)伍、1150 全國(guó)二等獎(jiǎng)隊(duì)伍。其中,由郭蘭鑫、武文琦和王昊三位本科生組成的江南大學(xué)參賽隊(duì),憑借“簡(jiǎn)易自
    的頭像 發(fā)表于 11-04 09:53 ?972次閱讀

    利用NVIDIA DOCA GPUNetIO技術(shù)提升MoE模型推理性能

    第三屆 NVIDIA DPU 中國(guó)黑客松競(jìng)賽,我們見(jiàn)證了開(kāi)發(fā)者與 NVIDIA 網(wǎng)絡(luò)技術(shù)的深度碰撞。 23
    的頭像 發(fā)表于 09-23 15:25 ?1028次閱讀

    基于NVIDIA BlueField DPU的5G UPF數(shù)據(jù)面加速方案

    第三屆 NVIDIA DPU 黑客松競(jìng)賽,我們見(jiàn)證了開(kāi)發(fā)者與 NVIDIA 網(wǎng)絡(luò)技術(shù)的深度碰撞。 23
    的頭像 發(fā)表于 09-04 11:26 ?1217次閱讀

    NVIDIA助力Axio團(tuán)隊(duì)打造全新DPU數(shù)據(jù)面開(kāi)發(fā)框架

    第三屆 NVIDIA DPU 黑客松競(jìng)賽,我們見(jiàn)證了開(kāi)發(fā)者與 NVIDIA 網(wǎng)絡(luò)技術(shù)的深度碰撞。 23
    的頭像 發(fā)表于 08-30 15:58 ?1459次閱讀

    第九屆集創(chuàng)賽龍芯職業(yè)技能杯圓滿收官

    第九屆全國(guó)大學(xué)生集成電路創(chuàng)新創(chuàng)業(yè)大賽(集創(chuàng)賽)——龍芯職業(yè)技能杯于近日?qǐng)A滿收官。本屆賽事吸引了來(lái)自28所高校的59精英隊(duì)伍同臺(tái)競(jìng)技,參賽規(guī)模突破200人。經(jīng)過(guò)激烈角逐,最終6
    的頭像 發(fā)表于 08-28 15:02 ?1113次閱讀

    第六屆TE Connectivity AI Cup全球競(jìng)賽圓滿收官

    近日,全球行業(yè)技術(shù)領(lǐng)先企業(yè)TE Connectivity(以下簡(jiǎn)稱“TE”)主辦的第六屆TE AI Cup全球競(jìng)賽,
    的頭像 發(fā)表于 08-25 14:13 ?0次閱讀

    40個(gè)項(xiàng)目脫穎而出!2025英特爾人工智能大賽圓滿收官,下一個(gè)AI應(yīng)用浪潮開(kāi)啟

    8月16日,2025英特爾人工智能創(chuàng)新大賽決賽暨頒獎(jiǎng)典禮深圳舉行。英特爾副總裁、中國(guó)軟件技術(shù)事業(yè)部總經(jīng)理李映表示:“此次大賽,來(lái)自全國(guó)2817年青隊(duì)伍
    的頭像 發(fā)表于 08-22 10:56 ?7632次閱讀
    40個(gè)項(xiàng)目<b class='flag-5'>脫穎而出</b>!2025英特爾人工智能大賽圓滿收官,下一個(gè)AI應(yīng)用浪潮開(kāi)啟

    利用NVIDIA DPU重塑網(wǎng)絡(luò)安全格局

    第三屆 NVIDIA DPU 黑客松競(jìng)賽,我們見(jiàn)證了開(kāi)發(fā)者與 NVIDIA 網(wǎng)絡(luò)技術(shù)的深度碰撞。 23
    的頭像 發(fā)表于 08-20 14:31 ?1339次閱讀

    2025中國(guó)大學(xué)生工程實(shí)踐與創(chuàng)新能力大賽即將舉辦

    備受矚目的 2025 年中國(guó)大學(xué)生工程實(shí)踐與創(chuàng)新能力大賽國(guó)賽已進(jìn)入倒計(jì)時(shí)階段,經(jīng)過(guò)各省級(jí)選拔賽的激烈比拼與層層篩選,眾多優(yōu)秀參賽隊(duì)伍脫穎而出,成功晉級(jí)全國(guó)決賽。這些精英團(tuán)隊(duì)將于 8 月
    的頭像 發(fā)表于 08-07 09:10 ?1603次閱讀

    中國(guó)兩大高校團(tuán)隊(duì)斬獲第六屆TE Connectivity AI Cup全球競(jìng)賽桂冠

    中國(guó)上海,2025年8月4日 ——近日,全球行業(yè)技術(shù)領(lǐng)先企業(yè)TE Connectivity(以下簡(jiǎn)稱“TE”)主辦的第六屆TE AI Cup全球競(jìng)
    的頭像 發(fā)表于 08-05 15:03 ?1068次閱讀
    <b class='flag-5'>中國(guó)</b>兩大高校<b class='flag-5'>團(tuán)隊(duì)</b>斬獲第六屆TE Connectivity AI Cup<b class='flag-5'>全球</b><b class='flag-5'>競(jìng)賽</b>桂冠

    斬獲國(guó)家級(jí)獎(jiǎng)項(xiàng)!拓維信息助力廣東聯(lián)通打造全棧信創(chuàng)辦公解決方案

    近日,2025數(shù)字中國(guó)創(chuàng)新大賽信創(chuàng)賽道華南賽區(qū)獲獎(jiǎng)名單出爐,由拓維信息與廣東聯(lián)通聯(lián)合打造的《全面“信創(chuàng)化、智能化、移動(dòng)化”數(shù)智辦公解決方案》憑借卓越的技術(shù)前瞻性與場(chǎng)景落地能力,數(shù)
    的頭像 發(fā)表于 05-21 19:51 ?1403次閱讀
    斬獲國(guó)家級(jí)獎(jiǎng)項(xiàng)!拓維信息助力廣東聯(lián)通打造全棧信創(chuàng)辦公解決方案

    2025集創(chuàng)賽紫光同創(chuàng)杯賽直播預(yù)告|提供400套板卡支持,參賽隊(duì)伍速來(lái)申請(qǐng)!

    B站直播鏈接:https://live.bilibili.com/22034884本次紫光同創(chuàng)杯將提供400套板卡的支持參賽隊(duì)伍可以自行選擇借用或租用一、板卡借用紫光同創(chuàng)將提供250套盤古
    的頭像 發(fā)表于 04-14 09:53 ?1176次閱讀
    2025集創(chuàng)賽紫光同創(chuàng)杯賽直播預(yù)告|提供400套板卡支持,<b class='flag-5'>參賽隊(duì)伍</b>速來(lái)申請(qǐng)!