91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

比CNN表現(xiàn)更好,CV領(lǐng)域全新卷積操作OctConv厲害在哪里?

電子工程師 ? 來(lái)源:YXQ ? 2019-04-24 11:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

CNN卷積神經(jīng)網(wǎng)絡(luò)問(wèn)世以來(lái),在計(jì)算機(jī)視覺(jué)領(lǐng)域備受青睞,與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)相比,其參數(shù)共享性和平移不變性,使得對(duì)于圖像的處理十分友好,然而,近日由Facebook AI、新家坡國(guó)立大學(xué)、360人工智能研究院的研究人員提出的一種新的卷積操作OctConv使得在圖像處理性能方面得到了重大突破與提升,OctConv和CNN中的卷積有什么不同呢?

論文下載地址:

https://arxiv.org/pdf/1904.05049.pdf

CNN網(wǎng)絡(luò)中的卷積層主要用來(lái)提取圖像特征,如下圖所示,利用卷積核(也稱濾波器)對(duì)輸入圖像的每個(gè)像素進(jìn)行卷積操作得到特征圖,由于圖像中相鄰像素的特征相似性,卷積核橫掃每個(gè)位置,獨(dú)立的存儲(chǔ)自己的特征描述符,忽略空間上的一致性,使得特征圖在空間維度上存在大量的冗余。

圖1 普通卷積操作示意圖

OctConv主要基于于處理多空間頻率的特征映射并減少空間冗余的問(wèn)題提出的。

原文地址:

https://export.arxiv.org/pdf/1904.05049

下面文摘菌將從論文的四個(gè)部分展開對(duì)OctConv原理的闡述。

Why?—OctConv之誕生

文章摘要(Abstract)部分指出,在自然圖像中,信息以不同的頻率傳輸,其中高頻率通常以細(xì)節(jié)進(jìn)行編碼,而較低頻率通常以總體結(jié)構(gòu)進(jìn)行編碼,同理卷積層的輸出可以看做不同頻率的信息混合,在論文中,研究者提出通過(guò)頻率對(duì)特征融合圖進(jìn)行分解,并設(shè)計(jì)出了一種新的Octave卷積(OctConv)操作,旨在存儲(chǔ)和處理在空間上變化緩慢的較低分辨率的特征圖,從而降低內(nèi)存和計(jì)算成本。與現(xiàn)存的多尺度方法不同,OctConv是一種單一、通用、即插即用的卷積單元,可以直接代替普通卷積,而無(wú)需調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)。

OctConv與那些用于構(gòu)建更優(yōu)拓?fù)浠蛘邷p少分組或深度卷積中信道冗余的方法是正交和互補(bǔ)的。

實(shí)驗(yàn)表明,通過(guò)使用OctConv替代普通卷積,能很好的提高語(yǔ)音和圖像識(shí)別任務(wù)中的精度,同時(shí)降低內(nèi)存和計(jì)算成本,一個(gè)配備有OctConv的ResNet-152能夠以僅僅22.2 GFLOP在ImageNet數(shù)據(jù)集上達(dá)到82.5%的top-1分類準(zhǔn)確率。

What?—初探OctConv

論文Introduction(介紹)部分基于CNN現(xiàn)存的空間維度冗余問(wèn)題引出了下圖:

圖2 論文思路闡述圖

(a)動(dòng)機(jī):研究表明,自然圖像可以分解為低空間頻率和高空間頻率兩部分;

(b)卷積層的輸出圖也可以根據(jù)空間頻率進(jìn)行分解和分組;

(c)所提出的多頻特征表示將平滑變化的低頻映射存儲(chǔ)字低分辨率張量中,以減少空間冗余;

(d)所提出的OctConv直接作用于這個(gè)表示。它會(huì)更新每個(gè)組的信息,并進(jìn)一步支持組之間的信息交換。

具體解釋為:如圖 2(a) 所示,自然圖像可以分解為描述平穩(wěn)變化結(jié)構(gòu)的低空間頻率分量和描述快速變化的精細(xì)細(xì)節(jié)的高空間頻率分量。類似地,我們認(rèn)為卷積層的輸出特征映射也可以分解為不同空間頻率的特征,并提出了一種新的多頻特征表示方法,將高頻和低頻特征映射存儲(chǔ)到不同的組中,如圖 2(b) 所示。因此,通過(guò)相鄰位置間的信息共享,可以安全地降低低頻組的空間分辨率,減少空間冗余,如圖 2(c) 所示。

How?—再探OctConv

論文Method(方法)部分:octave feature 減少了空間冗余,比原始表示更加緊湊。然而,由于輸入特征的空間分辨率不同,傳統(tǒng)卷積不能直接對(duì)這種表示進(jìn)行操作。避免這個(gè)問(wèn)題的一種簡(jiǎn)單方法是將低頻部分上采樣到原始的空間分辨率,將它與連接起來(lái),然后進(jìn)行卷積,這將導(dǎo)致額外的計(jì)算和內(nèi)存開銷。為了充分利用緊湊的多頻特征表示,我們提出 Octave Convolution,它可以直接在分解張量X={XH,XL}上運(yùn)行,而不需要任何額外的計(jì)算或內(nèi)存開銷。

Octave Convolution的設(shè)計(jì)目標(biāo)是有效地處理相應(yīng)張量中的低頻和高頻分量,同時(shí)使得Octave特征表示的高頻分量和低頻分量之間能夠有效通信。設(shè)X,Y為分解輸入和輸出張量,那么輸出的高頻和低頻信號(hào)將由下式給出:

其中H→H,L→L表示自身的更新,L→H,H→L表示高頻與低頻分量之間的通信,如圖3所示綠色箭頭表示信息更新,紅色箭頭表示兩個(gè)頻率之間的信息交換。

圖3 Octave Convolution示意圖

同理,我們將卷積核分解為高頻和低頻W={WH,WL},WH=WH→H+WL→H;WL=WL→L+WH→L,如圖4所示:

圖3 Octave Convolution kernel示意圖

對(duì)于低頻特征所使用的低頻所占比例a的不同,當(dāng)a=0時(shí)(即沒(méi)有低頻成分),OctConv就會(huì)退化為普通卷積。經(jīng)過(guò)實(shí)驗(yàn)評(píng)估k×k Octave 卷積核與普通卷積核等價(jià),即二者具有完全相同的參數(shù)量。

To do—Just do it

論文的實(shí)驗(yàn)部分:研究人員驗(yàn)證了提出的Octave卷積對(duì)于2D和3D網(wǎng)絡(luò)的效能和效率,首先展示了ImageNet圖像分類的控制變量研究,然后將其與當(dāng)前最優(yōu)的方法進(jìn)行了比較。之后研究人員使用Kinetics-400和Kinetics-600數(shù)據(jù)集,展示了提出的OctConv也適用于3D CNN。

圖4 ImageNet上的控制變量結(jié)果圖

上表為論文中的表8,視頻中的動(dòng)作識(shí)別、控制變量研究結(jié)果統(tǒng)計(jì)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 計(jì)算機(jī)視覺(jué)

    關(guān)注

    9

    文章

    1715

    瀏覽量

    47625
  • cnn
    cnn
    +關(guān)注

    關(guān)注

    3

    文章

    355

    瀏覽量

    23417

原文標(biāo)題:比CNN表現(xiàn)更好,CV領(lǐng)域全新卷積操作OctConv厲害在哪里?

文章出處:【微信號(hào):BigDataDigest,微信公眾號(hào):大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    貼片都在哪里做的?

    你們貼片都在哪里做的?
    發(fā)表于 02-26 18:02

    請(qǐng)問(wèn)在哪里可以找到 VisionFive 2 上的 VPU?

    嗨,抱歉我的天真問(wèn)題。但是,VisionFive 2 上的 VPU 在哪里? 我注意到https://rvspace.org/en/project
    發(fā)表于 02-11 08:17

    自動(dòng)駕駛中常提的卷積神經(jīng)網(wǎng)絡(luò)是個(gè)啥?

    在自動(dòng)駕駛領(lǐng)域,經(jīng)常會(huì)聽到卷積神經(jīng)網(wǎng)絡(luò)技術(shù)。卷積神經(jīng)網(wǎng)絡(luò),簡(jiǎn)稱為CNN,是一種專門用來(lái)處理網(wǎng)格狀數(shù)據(jù)(比如圖像)的深度學(xué)習(xí)模型。CNN在圖像
    的頭像 發(fā)表于 11-19 18:15 ?2076次閱讀
    自動(dòng)駕駛中常提的<b class='flag-5'>卷積</b>神經(jīng)網(wǎng)絡(luò)是個(gè)啥?

    常用的百兆網(wǎng)絡(luò)變壓器與RJ45網(wǎng)口的參考連接電路有哪些,主要注意事項(xiàng)在哪里呢?

    Hqst華強(qiáng)盛(石門盈盛)電子導(dǎo)讀:一起來(lái)了解常用的百兆網(wǎng)絡(luò)變壓器與RJ45網(wǎng)口的參考連接電路有哪些,主要注意事項(xiàng)在哪里呢?
    的頭像 發(fā)表于 11-06 13:49 ?787次閱讀
    常用的百兆網(wǎng)絡(luò)變壓器與RJ45網(wǎng)口的參考連接電路有哪些,主要注意事項(xiàng)<b class='flag-5'>在哪里</b>呢?

    CNN卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)原理及在MCU200T上仿真測(cè)試

    CNN算法簡(jiǎn)介 我們硬件加速器的模型為L(zhǎng)enet-5的變型,網(wǎng)絡(luò)粗略分共有7層,細(xì)分共有13層。包括卷積,最大池化層,激活層,扁平層,全連接層。下面是各層作用介紹: 卷積層:提取特征?!安蝗?/div>
    發(fā)表于 10-29 07:49

    構(gòu)建CNN網(wǎng)絡(luò)模型并優(yōu)化的一般化建議

    整個(gè)模型非常巨大。所以要想實(shí)現(xiàn)輕量級(jí)的CNN神經(jīng)網(wǎng)絡(luò)模型,首先應(yīng)該避免嘗試單層神經(jīng)網(wǎng)絡(luò)。 2)減少卷積核的大?。?b class='flag-5'>CNN神經(jīng)網(wǎng)絡(luò)是通過(guò)權(quán)值共享的方式,利用卷積運(yùn)算從圖像中提取線性紋理。
    發(fā)表于 10-28 08:02

    卷積運(yùn)算分析

    的數(shù)據(jù),故設(shè)計(jì)了ConvUnit模塊實(shí)現(xiàn)單個(gè)感受域規(guī)模的卷積運(yùn)算. 卷積運(yùn)算:不同于數(shù)學(xué)當(dāng)中提及到的卷積概念,CNN神經(jīng)網(wǎng)絡(luò)中的卷積嚴(yán)格意義
    發(fā)表于 10-28 07:31

    發(fā)提問(wèn)貼在哪里輸入標(biāo)簽

    發(fā)提問(wèn)貼在哪里可以輸入標(biāo)簽呀
    發(fā)表于 09-14 11:30

    實(shí)現(xiàn)環(huán)境計(jì)算真正的瓶頸究竟在哪里

    20世紀(jì)90年代初,計(jì)算機(jī)科學(xué)家Mark Weiser提出了“泛在計(jì)算”的理念,其核心思想是讓技術(shù)融入日常生活環(huán)境中[1]。盡管智能家居組件、傳感器網(wǎng)絡(luò)和智能設(shè)備取得了進(jìn)展,但環(huán)境計(jì)算這一概念依然難以實(shí)現(xiàn)。如今,我們已經(jīng)擁有了硬件基礎(chǔ)和連接能力。那么,真正的瓶頸究竟在哪里
    的頭像 發(fā)表于 09-10 16:21 ?817次閱讀

    中光發(fā)布面向機(jī)器人領(lǐng)域全新感知產(chǎn)品矩陣

    8月8日,在北京舉辦的2025世界機(jī)器人大會(huì)上,奧中光以“靈機(jī)宜動(dòng)”為主題,發(fā)布面向機(jī)器人領(lǐng)域全新感知產(chǎn)品矩陣。其中,Pulsar ME450是國(guó)內(nèi)首款支持多種掃描模式的dToF 3D激光雷達(dá);Gemini 345Lg是專為
    的頭像 發(fā)表于 08-12 11:28 ?2152次閱讀

    請(qǐng)問(wèn)USB2CAN驅(qū)動(dòng)程序在哪里?

    USB2CAN驅(qū)動(dòng)程序在哪里?它沒(méi)有像說(shuō)明書中所說(shuō)的那樣附帶 SSCB 演示 GUI。CH341SER.exe 在哪里?我在您令人沮喪的支持網(wǎng)站上找不到它。我無(wú)法連接到我的 REF_SSCB_AC_DC_1PH_SiC
    發(fā)表于 07-24 07:09

    請(qǐng)問(wèn)在哪里可以找到 DFU HOST TOOL?

    DFU Host Tool 的鏈接似乎已關(guān)閉: 請(qǐng)您告訴我還可以在哪里找到該工具。
    發(fā)表于 05-20 06:51

    自動(dòng)駕駛感知系統(tǒng)中卷積神經(jīng)網(wǎng)絡(luò)原理的疑點(diǎn)分析

    背景 卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)的核心技術(shù)主要包括以下幾個(gè)方面:局部連接、權(quán)值共享、多卷積核以及池化。這些技術(shù)共同作用,使得CNN
    的頭像 發(fā)表于 04-07 09:15 ?846次閱讀
    自動(dòng)駕駛感知系統(tǒng)中<b class='flag-5'>卷積</b>神經(jīng)網(wǎng)絡(luò)原理的疑點(diǎn)分析

    STMHAL庫(kù)的USB每次插拔時(shí)識(shí)別位置在哪里?

    STMHAL庫(kù)的USB每次插拔時(shí)識(shí)別位置在哪里
    發(fā)表于 03-07 14:00

    如何使用MATLAB實(shí)現(xiàn)一維時(shí)間卷積網(wǎng)絡(luò)

    本文對(duì)一維卷積操作進(jìn)行介紹,包括一維擴(kuò)展卷積和一維因果卷積,以及 MATLAB 對(duì)一維卷積的支持情況。在最后通過(guò)一個(gè)實(shí)例演示如何在 MATL
    的頭像 發(fā)表于 03-07 09:15 ?2108次閱讀
    如何使用MATLAB實(shí)現(xiàn)一維時(shí)間<b class='flag-5'>卷積</b>網(wǎng)絡(luò)