在线观看岛国av,亚洲第一站精品久久久,一级黄片A片免费

在開發(fā)以卷積神經(jīng)網(wǎng)絡(luò)（CNN）為核心的機器學(xué)習(xí)模型時，我們通常會先使用固定的資源成本，構(gòu)建最初的模型，然后增加更多資源（層數(shù)）擴展模型，從而獲得更高的準確率。

著名的 CNN 模型 ResNet（深度殘差網(wǎng)絡(luò)），就可以用增加層數(shù)的方法從ResNet-18 擴展到 ResNet-200。谷歌的 GPipe 模型也通過將基線 CNN 擴展 4 倍，在 ImageNet 數(shù)據(jù)庫上達到84.3% 的準確率，力壓所有模型。

一般來說，模型的擴大和縮小都是任意增加 CNN 的深度或?qū)挾龋只蚴鞘褂梅直媛矢蟮膱D像進行訓(xùn)練和評估。雖然這些傳統(tǒng)方法提高準確率的效果不錯，但大多需要繁瑣的手動調(diào)整，還可能無法達到最佳性能。

因此，谷歌AI團隊最近提出了新的模型縮放方法“復(fù)合縮放（CompoundScaling）”和配套的EfficientNet 模型。他們使用復(fù)合系數(shù)和 AutoML 從多個維度均衡縮放 CNN，綜合考慮深度和寬度等參數(shù)，而不是只單純地考慮一個，使得模型的準確率和效率大幅提升，圖像識別的效率甚至可以大幅提升 10 倍。

這項新方法的根本優(yōu)勢在于實踐起來非常簡單，背后的原理很好理解，甚至讓人懷疑為什么沒有被更早發(fā)現(xiàn)。該研究成果以論文的形式被 ICML2019（國際機器學(xué)習(xí)大會）接收，名為 EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks。EfficientNet 模型的相關(guān)代碼和 TPU 訓(xùn)練數(shù)據(jù)也已經(jīng)在 GitHub 上開源。

尋找復(fù)合系數(shù)

為了弄清楚神經(jīng)網(wǎng)絡(luò)縮放之后的效果，谷歌團隊系統(tǒng)地研究了改變不同維度對模型的影響，維度參數(shù)包括網(wǎng)絡(luò)深度、寬度和圖像分辨率。

首先他們進行了柵格搜索（GridSearch）。這是一種窮舉搜索方法，可以在固定資源的限定下，列出所有參數(shù)之間的關(guān)系，顯示出改變某一種維度時，基線網(wǎng)絡(luò)模型會受到什么樣的影響。換句話說，如果只改變了寬度、深度或分辨率，模型的表現(xiàn)會發(fā)生什么變化。

圖 |以基線網(wǎng)絡(luò)為基礎(chǔ)，列出所有維度變化對模型的影響

綜合考慮所有情況之后，他們確定了每個維度最合適的調(diào)整系數(shù)，然后將它們一同應(yīng)用到基線網(wǎng)絡(luò)中，對每個維度都進行適當(dāng)?shù)目s放，并且確保其符合目標模型的大小和計算預(yù)算。

簡單來說，就是分別找到寬度、深度和分辨率的最佳系數(shù)，然后將它們組合起來一起放入原本的網(wǎng)絡(luò)模型中，對每一個維度都有所調(diào)整。從整體的角度縮放模型。

與傳統(tǒng)方法相比，這種復(fù)合縮放法可以持續(xù)提高模型的準確性和效率。在現(xiàn)有模型 MobileNet 和 ResNet 上的測試結(jié)果顯示，它分別提高了 1.4% 和 0.7% 的準確率。

高效的網(wǎng)絡(luò)架構(gòu)和性能

縮放模型的有效性也依賴于基線網(wǎng)絡(luò)（架構(gòu)）本身。

因為，為了進一步提高性能，谷歌 AI 團隊還使用了 AutoMLMNAS 框架進行神經(jīng)架構(gòu)搜索，優(yōu)化準確性和效率。AutoML 是一種可以自動設(shè)計神經(jīng)網(wǎng)絡(luò)的技術(shù)，由谷歌團隊在 2017 年提出，而且經(jīng)過了多次優(yōu)化更新。使用這種技術(shù)可以更簡便地創(chuàng)造神經(jīng)網(wǎng)絡(luò)。

由此產(chǎn)生的架構(gòu)使用了移動倒置瓶頸卷積（MBConv），類似于 MobileNetV2 和 MnasNet 模型，但由于計算力（FLOPS）預(yù)算增加，MBConv 模型體積略大。隨后他們多次縮放了基線網(wǎng)絡(luò)，組成了一系列模型，統(tǒng)稱為EfficientNets。

圖 |EfficientNet-B0 基線網(wǎng)絡(luò)架構(gòu)

為了測試其性能，研究人員與 ImageNet 上的其他現(xiàn)有 CNN 進行了比較。結(jié)果顯示，EfficientNet 在大多數(shù)情況下表現(xiàn)亮眼，比現(xiàn)有 CNN 的準確率和效率都高，還將參數(shù)大小和計算力降低了一個數(shù)量級。

比如 EfficientNet-B7 在 ImageNet 上達到的 Top-1 最高準確率是 84.4%，Top-5 準確率是 97.1%。在 CPU 推理上，它的體積比最好的 CNN 模型 GPipe 小 8.4 倍，但速度快了 6.1 倍。與廣泛使用的 ResNet-50 相比，EfficientNet-B4 使用了類似的計算力，但 Top-1 準確率從 76.3% 提升到了 82.6%。

圖 |參數(shù)使用量和 ImageNetTop-1 準確率對比

此外，EfficientNets 不僅在 ImageNet 上表現(xiàn)出眾，其能力還可以轉(zhuǎn)移到其它數(shù)據(jù)集上。

他們在 8 個流行的遷移學(xué)習(xí)數(shù)據(jù)集上測試了 EfficientNets。結(jié)果顯示，它在其中的 5 個上面都拿到了頂尖成績，例如在 CIFAR-100 上獲得了 91.7％的成績，在 Flowers 上獲得了 98.8％的成績，而且參數(shù)至少減少了一個數(shù)量級，甚至還可以最多減少 21 倍，說明 EfficientNets 具有很強的遷移能力。

谷歌 AI 團隊認為，EfficientNets 有望憑借簡單易操作的特點，成為未來計算機視覺任務(wù)的新基石。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴