婷婷五月天成人在线,国产美女久久毛片黄在线,91精品视频精品

目前在深度學習領(lǐng)域分類兩個派別，一派為學院派，研究強大、復雜的模型網(wǎng)絡和實驗方法，為了追求更高的性能；另一派為工程派，旨在將算法更穩(wěn)定、高效的落地在硬件平臺上，效率是其追求的目標。復雜的模型固然具有更好的性能，但是高額的存儲空間、計算資源消耗是使其難以有效的應用在各硬件平臺上的重要原因。所以，卷積神經(jīng)網(wǎng)絡日益增長的深度和尺寸為深度學習在移動端的部署帶來了巨大的挑戰(zhàn)，深度學習模型壓縮與加速成為了學術(shù)界和工業(yè)界都重點關(guān)注的研究領(lǐng)域之一。本文主要介紹深度學習模型壓縮和加速算法的三個方向，分別為加速網(wǎng)絡結(jié)構(gòu)設(shè)計、模型裁剪與稀疏化、量化加速。

I. 加速網(wǎng)絡設(shè)計

分組卷積

分組卷積即將輸入的feature maps分成不同的組（沿channel維度進行分組），然后對不同的組分別進行卷積操作，即每一個卷積核至于輸入的feature maps的其中一組進行連接，而普通的卷積操作是與所有的feature maps進行連接計算。分組數(shù)k越多，卷積操作的總參數(shù)量和總計算量就越少（減少k倍）。然而分組卷積有一個致命的缺點就是不同分組的通道間減少了信息流通，即輸出的feature maps只考慮了輸入特征的部分信息，因此在實際應用的時候會在分組卷積之后進行信息融合操作，接下來主要講兩個比較經(jīng)典的結(jié)構(gòu)，ShuffleNet[1]和MobileNet[2]結(jié)構(gòu)。

1) ShuffleNet結(jié)構(gòu)：

如上圖所示，圖a是一般的group convolution的實現(xiàn)效果，其造成的問題是，輸出通道只和輸入的某些通道有關(guān)，導致全局信息流通不暢，網(wǎng)絡表達能力不足。圖b就是shufflenet結(jié)構(gòu)，即通過均勻排列，把group convolution后的feature map按通道進行均勻混合，這樣就可以更好的獲取全局信息了。圖c是操作后的等價效果圖。在分組卷積的時候，每一個卷積核操作的通道數(shù)減少，所以可以大量減少計算量。

2)MobileNet結(jié)構(gòu)：

如上圖所示，mobilenet采用了depthwise separable convolutions的思想，采用depthwise (或叫channelwise)和1x1 pointwise的方法進行分解卷積。其中depthwise separable convolutions即對每一個通道進行卷積操作，可以看成是每組只有一個通道的分組卷積，最后使用開銷較小的1x1卷積進行通道融合，可以大大減少計算量。

分解卷積

分解卷積，即將普通的kxk卷積分解為kx1和1xk卷積，通過這種方式可以在感受野相同的時候大量減少計算量，同時也減少了參數(shù)量，在某種程度上可以看成是使用2k個參數(shù)模擬k*k個參數(shù)的卷積效果，從而造成網(wǎng)絡的容量減小，但是可以在較少損失精度的前提下，達到網(wǎng)絡加速的效果。

右圖是在圖像語義分割任務上取得非常好的效果的ERFNet[3]的主要模塊，稱為NonBottleNeck結(jié)構(gòu)借鑒自ResNet[4]中的Non-Bottleneck結(jié)構(gòu)，相應改進為使用分解卷積替換標準卷積，這樣可以減少一定的參數(shù)和計算量，使網(wǎng)絡更趨近于efficiency。

Bottleneck結(jié)構(gòu)

右圖為ENet[5]中的Bottleneck結(jié)構(gòu)，借鑒自ResNet中的Bottleneck結(jié)構(gòu)，主要是通過1x1卷積進行降維和升維，能在一定程度上能夠減少計算量和參數(shù)量。其中1x1卷積操作的參數(shù)量和計算量少，使用其進行網(wǎng)絡的降維和升維操作（減少或者增加通道數(shù)）的開銷比較小，從而能夠達到網(wǎng)絡加速的目的。

C.ReLU[7]結(jié)構(gòu)

C.ReLU來源于CNNs中間激活模式引發(fā)的。輸出節(jié)點傾向于是"配對的"，一個節(jié)點激活是另一個節(jié)點的相反面，即其中一半通道的特征是可以通過另外一半通道的特征生成的。根據(jù)這個觀察，C.ReLU減少一半輸出通道(output channels)的數(shù)量，然后通過其中一半通道的特征生成另一半特征，這里使用 negation使其變成雙倍，最后通過scale操作使得每個channel(通道)的斜率和激活閾值與其相反的channel不同。

SqueezeNet[8]結(jié)構(gòu)

SqueezeNet思想非常簡單，就是將原來簡單的一層conv層變成兩層:squeeze層+expand層，各自帶上Relu激活層。在squeeze層里面全是1x1的卷積kernel，數(shù)量記為S11;在expand層里面有1x1和3x3的卷積kernel，數(shù)量分別記為E11和E33，要求S11 < input map number。expand層之后將 1x1和3x3的卷積output feature maps在channel維度拼接起來。

神經(jīng)網(wǎng)絡搜索[18]

神經(jīng)結(jié)構(gòu)搜索（Neural Architecture Search，簡稱NAS）是一種自動設(shè)計神經(jīng)網(wǎng)絡的技術(shù)，可以通過算法根據(jù)樣本集自動設(shè)計出高性能的網(wǎng)絡結(jié)構(gòu)，在某些任務上甚至可以媲美人類專家的水準，甚至發(fā)現(xiàn)某些人類之前未曾提出的網(wǎng)絡結(jié)構(gòu)，這可以有效的降低神經(jīng)網(wǎng)絡的使用和實現(xiàn)成本。

NAS的原理是給定一個稱為搜索空間的候選神經(jīng)網(wǎng)絡結(jié)構(gòu)集合，用某種策略從中搜索出最優(yōu)網(wǎng)絡結(jié)構(gòu)。神經(jīng)網(wǎng)絡結(jié)構(gòu)的優(yōu)劣即性能用某些指標如精度、速度來度量，稱為性能評估，可以通過NAS自動搜索出高效率的網(wǎng)絡結(jié)構(gòu)。

本節(jié)主要介紹了模型模型設(shè)計的思路，同時對模型的加速設(shè)計以及相關(guān)缺陷進行分析?？偟膩碚f，加速網(wǎng)絡模型設(shè)計主要是探索最優(yōu)的網(wǎng)絡結(jié)構(gòu)，使得較少的參數(shù)量和計算量就能達到類似的效果。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴