91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌AI新方法可提升10倍圖像識別效率 關(guān)鍵還簡單易用

hl5C_deeptechch ? 來源:yxw ? 2019-06-06 11:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在開發(fā)以卷積神經(jīng)網(wǎng)絡(luò)(CNN)為核心的機器學(xué)習(xí)模型時,我們通常會先使用固定的資源成本,構(gòu)建最初的模型,然后增加更多資源(層數(shù))擴展模型,從而獲得更高的準確率。

著名的 CNN 模型 ResNet(深度殘差網(wǎng)絡(luò)),就可以用增加層數(shù)的方法從ResNet-18 擴展到 ResNet-200。谷歌的 GPipe 模型也通過將基線 CNN 擴展 4 倍,在 ImageNet 數(shù)據(jù)庫上達到84.3% 的準確率,力壓所有模型。

一般來說,模型的擴大和縮小都是任意增加 CNN 的深度或?qū)挾龋只蚴鞘褂梅直媛矢蟮膱D像進行訓(xùn)練和評估。雖然這些傳統(tǒng)方法提高準確率的效果不錯,但大多需要繁瑣的手動調(diào)整,還可能無法達到最佳性能。

因此,谷歌AI團隊最近提出了新的模型縮放方法“復(fù)合縮放(CompoundScaling)”和配套的EfficientNet 模型。他們使用復(fù)合系數(shù)和 AutoML 從多個維度均衡縮放 CNN,綜合考慮深度和寬度等參數(shù),而不是只單純地考慮一個,使得模型的準確率和效率大幅提升,圖像識別的效率甚至可以大幅提升 10 倍。

這項新方法的根本優(yōu)勢在于實踐起來非常簡單,背后的原理很好理解,甚至讓人懷疑為什么沒有被更早發(fā)現(xiàn)。該研究成果以論文的形式被 ICML2019(國際機器學(xué)習(xí)大會)接收,名為 EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks。EfficientNet 模型的相關(guān)代碼和 TPU 訓(xùn)練數(shù)據(jù)也已經(jīng)在 GitHub 上開源。

尋找復(fù)合系數(shù)

為了弄清楚神經(jīng)網(wǎng)絡(luò)縮放之后的效果,谷歌團隊系統(tǒng)地研究了改變不同維度對模型的影響,維度參數(shù)包括網(wǎng)絡(luò)深度、寬度和圖像分辨率。

首先他們進行了柵格搜索(GridSearch)。這是一種窮舉搜索方法,可以在固定資源的限定下,列出所有參數(shù)之間的關(guān)系,顯示出改變某一種維度時,基線網(wǎng)絡(luò)模型會受到什么樣的影響。換句話說,如果只改變了寬度、深度或分辨率,模型的表現(xiàn)會發(fā)生什么變化。

圖 |以基線網(wǎng)絡(luò)為基礎(chǔ),列出所有維度變化對模型的影響

綜合考慮所有情況之后,他們確定了每個維度最合適的調(diào)整系數(shù),然后將它們一同應(yīng)用到基線網(wǎng)絡(luò)中,對每個維度都進行適當(dāng)?shù)目s放,并且確保其符合目標模型的大小和計算預(yù)算。

簡單來說,就是分別找到寬度、深度和分辨率的最佳系數(shù),然后將它們組合起來一起放入原本的網(wǎng)絡(luò)模型中,對每一個維度都有所調(diào)整。從整體的角度縮放模型。

與傳統(tǒng)方法相比,這種復(fù)合縮放法可以持續(xù)提高模型的準確性和效率。在現(xiàn)有模型 MobileNet 和 ResNet 上的測試結(jié)果顯示,它分別提高了 1.4% 和 0.7% 的準確率。

高效的網(wǎng)絡(luò)架構(gòu)和性能

縮放模型的有效性也依賴于基線網(wǎng)絡(luò)(架構(gòu))本身。

因為,為了進一步提高性能,谷歌 AI 團隊還使用了 AutoMLMNAS 框架進行神經(jīng)架構(gòu)搜索,優(yōu)化準確性和效率。AutoML 是一種可以自動設(shè)計神經(jīng)網(wǎng)絡(luò)的技術(shù),由谷歌團隊在 2017 年提出,而且經(jīng)過了多次優(yōu)化更新。使用這種技術(shù)可以更簡便地創(chuàng)造神經(jīng)網(wǎng)絡(luò)。

由此產(chǎn)生的架構(gòu)使用了移動倒置瓶頸卷積(MBConv),類似于 MobileNetV2 和 MnasNet 模型,但由于計算力(FLOPS)預(yù)算增加,MBConv 模型體積略大。隨后他們多次縮放了基線網(wǎng)絡(luò),組成了一系列模型,統(tǒng)稱為EfficientNets。

圖 |EfficientNet-B0 基線網(wǎng)絡(luò)架構(gòu)

為了測試其性能,研究人員與 ImageNet 上的其他現(xiàn)有 CNN 進行了比較。結(jié)果顯示,EfficientNet 在大多數(shù)情況下表現(xiàn)亮眼,比現(xiàn)有 CNN 的準確率和效率都高,還將參數(shù)大小和計算力降低了一個數(shù)量級。

比如 EfficientNet-B7 在 ImageNet 上達到的 Top-1 最高準確率是 84.4%,Top-5 準確率是 97.1%。在 CPU 推理上,它的體積比最好的 CNN 模型 GPipe 小 8.4 倍,但速度快了 6.1 倍。與廣泛使用的 ResNet-50 相比,EfficientNet-B4 使用了類似的計算力,但 Top-1 準確率從 76.3% 提升到了 82.6%。

圖 |參數(shù)使用量和 ImageNetTop-1 準確率對比

此外,EfficientNets 不僅在 ImageNet 上表現(xiàn)出眾,其能力還可以轉(zhuǎn)移到其它數(shù)據(jù)集上。

他們在 8 個流行的遷移學(xué)習(xí)數(shù)據(jù)集上測試了 EfficientNets。結(jié)果顯示,它在其中的 5 個上面都拿到了頂尖成績,例如在 CIFAR-100 上獲得了 91.7% 的成績,在 Flowers 上獲得了 98.8% 的成績,而且參數(shù)至少減少了一個數(shù)量級,甚至還可以最多減少 21 倍,說明 EfficientNets 具有很強的遷移能力。

谷歌 AI 團隊認為,EfficientNets 有望憑借簡單易操作的特點,成為未來計算機視覺任務(wù)的新基石。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6255

    瀏覽量

    111713
  • 圖像識別
    +關(guān)注

    關(guān)注

    9

    文章

    534

    瀏覽量

    40124
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40431

    瀏覽量

    302052

原文標題:谷歌 AI 新方法:可提升 10 倍圖像識別效率,關(guān)鍵還簡單易用

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    使用NORDIC AI的好處

    提升能效,適合音頻、圖像和高采樣率傳感器等更重的 AI 負載。[Axon NPU 技術(shù)頁] 模型更小、更快、更省電 Neuton 模型相較 TensorFlow Lite:* 內(nèi)存占用
    發(fā)表于 01-31 23:16

    用于窄帶匹配高速射頻ADC的全新方法

    本期,為大家?guī)淼氖恰队糜谡瓗ヅ涓咚偕漕l ADC 的全新方法》,介紹了一種用于窄帶匹配高速射頻 ADC 的全新方法,以解決高中間頻率系統(tǒng)中 ADC 前端窄帶匹配的設(shè)計難題,可在 ADC 額定帶寬內(nèi)應(yīng)用,能提升 ADC 性能、減
    的頭像 發(fā)表于 01-04 15:56 ?6929次閱讀
    用于窄帶匹配高速射頻ADC的全<b class='flag-5'>新方法</b>

    AI算法開發(fā),SpeedDP打輔助!不止10效率

    。而那些能夠帶來10工作效率AI自然能夠輕松取代人類。當(dāng)然這也是相對的,不是每個領(lǐng)域都適用,廚師再快,也無法讓實物快10
    的頭像 發(fā)表于 11-20 18:09 ?707次閱讀
    <b class='flag-5'>AI</b>算法開發(fā),SpeedDP打輔助!不止<b class='flag-5'>10</b><b class='flag-5'>倍</b><b class='flag-5'>效率</b>

    連鎖門店AI智能復(fù)核巡店方案-解放人工審核壓力 InfiSight智睿視界

    AI復(fù)核」專為連鎖門店巡檢設(shè)計,利用AI圖像識別技術(shù)自動審核門店自檢圖片與打分表真實性。系統(tǒng)智能識別冷藏柜溫度、操作臺清潔、垃圾處理等3
    的頭像 發(fā)表于 09-15 16:10 ?911次閱讀
    連鎖門店<b class='flag-5'>AI</b>智能復(fù)核巡店方案-解放人工審核壓力 InfiSight智睿視界

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    、Transformer 模型的后繼者 二、用創(chuàng)新方法實現(xiàn)深度學(xué)習(xí)AI芯片 1、基于開源RISC-V的AI加速器 RISC-V是一種開源、模塊化的指令集架構(gòu)(ISA)。優(yōu)勢如下: ①模塊化特性②標準接口③開源
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內(nèi)容總覽

    是展望未來的AGI芯片,并探討相關(guān)的發(fā)展和倫理話題。 各章的目錄名稱如下: 第1章 大模型浪潮下,AI芯片的需求與挑戰(zhàn)免費 第2章 實現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu) 第3章 AI
    發(fā)表于 09-05 15:10

    AI 芯片浪潮下,職場晉升新契機?

    芯片設(shè)計為例,從最初的架構(gòu)選型,到算法適配、性能優(yōu)化,每個環(huán)節(jié)都考驗著工程師的專業(yè)素養(yǎng)。在設(shè)計一款面向智能安防領(lǐng)域的 AI 芯片時,需要深入研究安防場景下圖像識別算法的特點,針對性地優(yōu)化芯片架構(gòu),提升
    發(fā)表于 08-19 08:58

    華怡豐推出ISC-B/C系列圖像識別傳感器

    在工業(yè)自動化領(lǐng)域,精準、高效的視覺檢測是提升生產(chǎn)效率關(guān)鍵。華怡豐全新推出的ISC-B/C系列圖像識別傳感器集高精度定位、測量算法與先進圖像
    的頭像 發(fā)表于 08-15 11:36 ?1784次閱讀
    華怡豐推出ISC-B/C系列<b class='flag-5'>圖像識別</b>傳感器

    火車車號圖像識別系統(tǒng)如何應(yīng)對不同光照條件下的識別問題?

    在鐵路運輸管理中,準確識別火車車號是實現(xiàn)自動化車輛管理的關(guān)鍵環(huán)節(jié)。然而,實際應(yīng)用場景中復(fù)雜多變的光照條件給車號識別帶來了巨大挑戰(zhàn)?,F(xiàn)代火車車號圖像識別系統(tǒng)通過多項技術(shù)創(chuàng)新,有效解決了這
    的頭像 發(fā)表于 07-15 11:37 ?865次閱讀
    火車車號<b class='flag-5'>圖像識別</b>系統(tǒng)如何應(yīng)對不同光照條件下的<b class='flag-5'>識別</b>問題?

    【嘉楠堪智K230開發(fā)板試用體驗】01 Studio K230開發(fā)板Test2——手掌,手勢檢測,字符檢測

    K210 的 13.7 以上,同時保持高計算效率(利用率超過 70%)。這意味著它能處理更復(fù)雜模型或更多并發(fā)任務(wù)。 KPU 是 CanMV K230 的專用視覺處理引擎,賦予開發(fā)板強大的實時圖像識別
    發(fā)表于 07-10 09:45

    無刷直流電機反電勢過零檢測新方法

    新方法。在三相采樣等效電路上分別并聯(lián)一組三極管控制的電阻分壓開關(guān)電路,參考電機轉(zhuǎn)速線性調(diào)節(jié)控制信號占空比,以此控制三極管通斷,從而調(diào)節(jié)電阻分樂開關(guān)電路阻值,可以避免高速時反電勢幅值高于檢測電路供電電壓
    發(fā)表于 06-26 13:50

    AI視覺識別收銀稱:水果生鮮店的“智能店員”

    僅耗時費力,容易出現(xiàn)人為錯誤。而生鮮自動識別稱重收銀一體機、AI視覺識別收銀秤、生鮮稱重收銀秤和AI生鮮
    的頭像 發(fā)表于 06-07 10:19 ?820次閱讀
    <b class='flag-5'>AI</b>視覺<b class='flag-5'>識別</b>收銀稱:水果生鮮店的“智能店員”

    手持終端集裝箱識別系統(tǒng)的圖像識別技術(shù)

    行業(yè)提供了更靈活、精準的管理工具。 一、技術(shù)核心:OCR+AI深度融合 現(xiàn)代手持終端系統(tǒng)采用多模態(tài)圖像識別技術(shù),結(jié)合深度學(xué)習(xí)算法,快速捕捉并解析集裝箱號碼。其技術(shù)優(yōu)勢體現(xiàn)在: 1. 復(fù)雜環(huán)境適應(yīng)性:通過動態(tài)曝光補償和
    的頭像 發(fā)表于 04-03 10:49 ?776次閱讀

    岸橋箱號識別系統(tǒng)如何工作?揭秘AI圖像識別技術(shù)!

    在港口自動化升級的浪潮中,AI岸橋識別系統(tǒng)憑借前沿的圖像識別技術(shù),成為提升碼頭作業(yè)效率的“智慧之眼”。那么,這套系統(tǒng)如何實現(xiàn)集裝箱信息的精準
    的頭像 發(fā)表于 04-02 09:45 ?809次閱讀