91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

COCO單模型測(cè)試取得新紀(jì)錄:60.6 AP

新機(jī)器視覺(jué) ? 來(lái)源:新智元 ? 作者:袁路 ? 2021-06-23 16:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著注意力機(jī)制在自然語(yǔ)言處理和計(jì)算機(jī)視覺(jué)等多個(gè)人工智能領(lǐng)域風(fēng)靡,計(jì)算機(jī)視覺(jué)領(lǐng)域刷榜之爭(zhēng)可謂是進(jìn)入白熱化階段。

近期大量工作刷新現(xiàn)有各項(xiàng)任務(wù)SOTA:前腳谷歌剛在圖像識(shí)別ImageNet上準(zhǔn)確度超過(guò)90,緊接著微軟又在目標(biāo)檢測(cè)COCO上AP超過(guò)60。

在一篇CVPR 2021 論文中,來(lái)自微軟的研究者提出多重注意力機(jī)制統(tǒng)一目標(biāo)檢測(cè)頭方法Dynamic Head, 可插拔特性提高多種目標(biāo)檢測(cè)框架的性能。

在Transformer骨干和額外數(shù)據(jù)加持下,COCO單模型測(cè)試取得新紀(jì)錄:60.6 AP。

方法概述

本文首先對(duì)現(xiàn)有目標(biāo)檢測(cè)頭的改進(jìn)工作進(jìn)行了總結(jié),發(fā)現(xiàn)近期方法主要通過(guò)三個(gè)不同的角度出發(fā)進(jìn)行目標(biāo)檢測(cè)性能的提升:

尺度感知:目標(biāo)尺度的差異對(duì)應(yīng)了不同尺度的特征,改進(jìn)不同級(jí)的表達(dá)能力可以有效提升目標(biāo)檢測(cè)器的尺度感知能力;

空間位置:不相似目標(biāo)形狀的不同幾何變換對(duì)應(yīng)了特征的不同空間位置,改進(jìn)不同空間位置的表達(dá)能力可以有效提升目標(biāo)檢測(cè)器的空間位置感知能力;

多任務(wù):目標(biāo)表達(dá)與任務(wù)的多樣性對(duì)應(yīng)了不同通道特征,改進(jìn)不同通道的表達(dá)能力可以有效提升目標(biāo)檢測(cè)的任務(wù)感知能力。

本文提出一種新穎的動(dòng)態(tài)頭框架,它采用多注意力機(jī)制將不同的目標(biāo)檢測(cè)頭進(jìn)行統(tǒng)一。

通過(guò)特征層次之間的注意力機(jī)制用于尺度感知,空間位置之間的注意力機(jī)制用于空間感知,輸出通道內(nèi)的注意力機(jī)制用于任務(wù)感知,該方法可以在不增加計(jì)算量的情況顯著提升模型目標(biāo)檢測(cè)頭的表達(dá)能力。

為了達(dá)成以上目的,本文對(duì)特征金字塔進(jìn)行重構(gòu),將不同層級(jí)的特征統(tǒng)一到一個(gè)3D張量,并發(fā)現(xiàn)在不同維度引入注意力機(jī)制可以提高對(duì)尺度,空間位置和多任務(wù)的感知能力。

因此上述方向可以統(tǒng)一到一個(gè)高效注意力學(xué)習(xí)問(wèn)題中。本文也是首個(gè)嘗試采用多注意力機(jī)制將三個(gè)維度組合構(gòu)建統(tǒng)一頭并最大化其性能的工作。

作者將注意力函數(shù)轉(zhuǎn)換為三個(gè)序列子注意力函數(shù)來(lái)解決傳統(tǒng)注意力函數(shù)在高維度導(dǎo)致計(jì)算量激增的問(wèn)題。

每個(gè)注意力函數(shù)僅聚焦一個(gè)維度:基于SE模塊的尺度自注意函數(shù)π_L, 基于可變形卷積的空間自注意函數(shù)π_S 和 基于動(dòng)態(tài)ReLU激活函數(shù)的多任務(wù)的自注意函數(shù)π_C。

作者將三種自注意函數(shù)進(jìn)行堆疊,形成一個(gè)可輕易插拔的模塊DyHead,并將其應(yīng)用于多種目標(biāo)檢測(cè)框架中。

實(shí)驗(yàn)結(jié)果

作者首先分析了的計(jì)算效率。當(dāng)采用6個(gè)模塊時(shí),模型性能提升達(dá)到最大,而計(jì)算量提升相比骨干網(wǎng)絡(luò)可以忽略。

作者將DyHead集成到不同檢測(cè)器進(jìn)行性能對(duì)比,發(fā)現(xiàn)所提DyHead可以一致性提升所有主流目標(biāo)檢測(cè)器性能:1.2~3.2AP,展示了優(yōu)異的可插拔擴(kuò)展性能。

在與其他目標(biāo)檢測(cè)方法的對(duì)比中,所提方案以較大的優(yōu)勢(shì)超越了流行方案。相比僅采用多尺度尋覽的方法,所提方案僅需2x訓(xùn)練即可取得新的SOTA指標(biāo)52.3AP。相對(duì)于谷歌提出的EfficientDet與SpineNet,所提方法訓(xùn)練時(shí)間更少(僅1/20);

當(dāng)同時(shí)采用多尺度訓(xùn)練與測(cè)試時(shí),所提方法取得了新的SOTA指標(biāo)54.0AP,以1.3AP指標(biāo)優(yōu)于此前最佳。

當(dāng)引入更優(yōu)異的Transformer骨干網(wǎng)絡(luò)、以及通過(guò)類似于谷歌自我學(xué)習(xí)方法生成的額外偽框的ImageNet數(shù)據(jù)后,所提方案取得了COCO新的記錄:60.6 AP,成為首個(gè)超過(guò)60的單模型方法。

責(zé)任編輯:lq6

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:刷新記錄! CVPR2021全新目標(biāo)檢測(cè)機(jī)制達(dá)到SOTA!

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    喜訊 | 凌科DL28系列連接器榮獲「第二十四屆(2025)深圳企業(yè)創(chuàng)新紀(jì)錄」殊榮

    凌科喜獲三項(xiàng)大獎(jiǎng)近日,凌科電氣榮獲三項(xiàng)殊榮:第二十四屆(2025)深圳企業(yè)創(chuàng)新紀(jì)錄(DL28系列連接器);2025粵港澳大灣區(qū)企業(yè)創(chuàng)新力榜單(高成長(zhǎng)創(chuàng)新榜);深圳工匠培育示范單位(復(fù)審)。本次三獎(jiǎng)
    的頭像 發(fā)表于 02-05 18:00 ?503次閱讀
    喜訊 | 凌科DL28系列連接器榮獲「第二十四屆(2025)深圳企業(yè)創(chuàng)<b class='flag-5'>新紀(jì)錄</b>」殊榮

    阿里巴巴發(fā)布通義千問(wèn)旗艦推理模型Qwen3-Max-Thinking

    今天,我們正式發(fā)布千問(wèn)旗艦推理模型Qwen3-Max-Thinking,創(chuàng)下數(shù)項(xiàng)權(quán)威評(píng)測(cè)全球新紀(jì)錄
    的頭像 發(fā)表于 01-27 15:47 ?393次閱讀
    阿里巴巴發(fā)布通義千問(wèn)旗艦推理<b class='flag-5'>模型</b>Qwen3-Max-Thinking

    單模光纖理論速率是多少

    單模光纖理論傳輸速率可達(dá)100Gbps,且未來(lái)可通過(guò)技術(shù)升級(jí)進(jìn)一步提升。以下是對(duì)單模光纖理論速率的詳細(xì)解釋: 一、單模光纖的基本特性 傳輸模式:單模光纖僅允許單一光模式傳播,減少了信號(hào)
    的頭像 發(fā)表于 01-27 09:55 ?129次閱讀

    海外首發(fā)即告售罄,韶音OpenFit Pro創(chuàng)新紀(jì)錄!中國(guó)智造標(biāo)桿再獲全球認(rèn)可

    %,新客增長(zhǎng)率突破100%,創(chuàng)下韶音在海外市場(chǎng)的銷售新紀(jì)錄。這一成績(jī)不僅反映出全球消費(fèi)者對(duì)韶音產(chǎn)品的高度認(rèn)可,也印證了韶音在全球市場(chǎng)上日益增長(zhǎng)的影響力與號(hào)召力。
    的頭像 發(fā)表于 01-14 17:31 ?823次閱讀

    晶科能源創(chuàng)下n型TOPCon太陽(yáng)能電池效率新紀(jì)錄

    來(lái)源:維度網(wǎng) 中國(guó)晶科能源公司宣布其n型TOPCon太陽(yáng)能電池轉(zhuǎn)換效率達(dá)到27.79%,該成果已獲得德國(guó)哈默爾恩太陽(yáng)能研究所獨(dú)立驗(yàn)證。這一太陽(yáng)能電池效率新紀(jì)錄較該公司今年6月公布的27.02%有所
    的頭像 發(fā)表于 12-22 17:24 ?665次閱讀

    深入剖析AP61200/AP61201/AP61202/AP61203同步降壓轉(zhuǎn)換器

    深入剖析AP61200/AP61201/AP61202/AP61203同步降壓轉(zhuǎn)換器 在電子設(shè)計(jì)領(lǐng)域,電源管理芯片的選擇至關(guān)重要,它直接影響著整個(gè)系統(tǒng)的性能和穩(wěn)定性。今天,我們就來(lái)深入
    的頭像 發(fā)表于 12-17 18:20 ?3328次閱讀

    晶科能源第31次打破電池效率和組件功率世界紀(jì)錄

    效率和組件功率世界紀(jì)錄。 本次刷新紀(jì)錄得益于晶科能源在TOPCon基礎(chǔ)核心技術(shù)上的一系列前瞻性布局與深耕。該技術(shù)采用新型鈍化接觸技術(shù),通過(guò)復(fù)合鈍化材料和工藝開(kāi)發(fā)及優(yōu)化,實(shí)現(xiàn)了對(duì)電池表面的全面高效鈍化,有效抑制載流子復(fù)合損失。并使用超低光學(xué)寄生
    的頭像 發(fā)表于 11-24 15:00 ?563次閱讀

    速騰聚創(chuàng)月交付激光雷達(dá)破12萬(wàn)臺(tái),創(chuàng)造行業(yè)新紀(jì)錄

    速騰聚創(chuàng)近日宣布,公司在2025年10月實(shí)現(xiàn)了激光雷達(dá)單月交付量突破12萬(wàn)臺(tái)的里程碑,創(chuàng)下全球激光雷達(dá)行業(yè)的新紀(jì)錄。這一突破性成績(jī)標(biāo)志著智能駕駛核心零部件正式邁入大規(guī)模商業(yè)化應(yīng)用的新階段。尤為
    的頭像 發(fā)表于 11-11 18:43 ?1793次閱讀

    四芯單模光纜和六芯單模光纜有什么不同呢

    四芯單模光纜與六芯單模光纜的核心差異體現(xiàn)在光纖芯數(shù)、傳輸容量、應(yīng)用場(chǎng)景、成本效益及擴(kuò)展性五個(gè)方面,具體分析如下: 一、光纖芯數(shù):物理結(jié)構(gòu)的直接差異 四芯單模光纜內(nèi)置4根單模光纖,每根光
    的頭像 發(fā)表于 11-11 10:28 ?677次閱讀

    如何在vivadoHLS中使用.TLite模型

    (ap_uint<8> input[INPUT_HEIGHT][INPUT_WIDTH][INPUT_CHANNELS], ...){ // 定義模型輸入和輸出變量 hls
    發(fā)表于 10-22 06:29

    Siumulink模型測(cè)試典型問(wèn)題分享——模型層級(jí)設(shè)計(jì)不合理

    典型測(cè)試問(wèn)題分享-模型層級(jí)設(shè)計(jì)不合理 問(wèn)題描述: ?重點(diǎn)功能與非重點(diǎn)功能混合,導(dǎo)致測(cè)試層級(jí)選擇困難。 ?模型未體現(xiàn)層級(jí)劃分,結(jié)構(gòu)平鋪導(dǎo)致層級(jí)圈復(fù)雜度異常。 ?部分計(jì)算/判斷/賦值等結(jié)構(gòu)
    的頭像 發(fā)表于 09-20 12:31 ?2971次閱讀
    Siumulink<b class='flag-5'>模型</b><b class='flag-5'>測(cè)試</b>典型問(wèn)題分享——<b class='flag-5'>模型</b>層級(jí)設(shè)計(jì)不合理

    比亞迪仰望U9工程測(cè)試車打破全球電車極速紀(jì)錄

    近日,仰望汽車宣布,仰望U9工程測(cè)試車在德國(guó)ATP測(cè)試場(chǎng)實(shí)現(xiàn)472.41km/h的最高時(shí)速成績(jī),打破全球電車極速紀(jì)錄,此舉是中國(guó)自主品牌首次在該領(lǐng)域問(wèn)鼎世界。
    的頭像 發(fā)表于 08-27 10:32 ?1058次閱讀

    模型捉蟲行家MV:致力全流程模型動(dòng)態(tài)測(cè)試

    隨著基于模型設(shè)計(jì)(MBD)開(kāi)發(fā)量的增長(zhǎng),其對(duì)應(yīng)的測(cè)試需求也顯著提升。此前,在《您的模型診斷專家MI:助力把好模型質(zhì)量關(guān)》一文中詳述了模型靜態(tài)
    的頭像 發(fā)表于 07-09 16:37 ?885次閱讀
    <b class='flag-5'>模型</b>捉蟲行家MV:致力全流程<b class='flag-5'>模型</b>動(dòng)態(tài)<b class='flag-5'>測(cè)試</b>

    多模光纖可以接單模

    多模光纖不能直接連接單模光纖,強(qiáng)行連接會(huì)導(dǎo)致信號(hào)無(wú)法正常傳輸,甚至可能損壞設(shè)備。以下是具體原因及解決方案: 一、多模與單模光纖的核心差異 二、直接連接的風(fēng)險(xiǎn) 光信號(hào)無(wú)法耦合 多模光纖的芯徑遠(yuǎn)大于單模
    的頭像 發(fā)表于 04-09 10:19 ?4413次閱讀
    多模光纖可以接<b class='flag-5'>單模</b>嗎

    愛(ài)立信攜手Telstra、高通刷新5G上行鏈路速度紀(jì)錄

    愛(ài)立信、Telstra、高通近日攜手創(chuàng)下5G上行鏈路516 Mbps速度新紀(jì)錄,成為目前在商用Sub-6GHz 5G SA現(xiàn)網(wǎng)實(shí)現(xiàn)的最高上行鏈路速度。
    的頭像 發(fā)表于 03-26 16:31 ?1.3w次閱讀