91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

超越 Mask-RCNN:谷歌大腦的AI,自己寫了個目標(biāo)檢測AI

MqC7_CAAI_1981 ? 來源:YXQ ? 2019-04-25 17:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌大腦的Quoc Le團(tuán)隊(duì),用神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索 (NAS) ,發(fā)現(xiàn)了一個目標(biāo)檢測模型。長這樣:

看不清請把手機(jī)橫過來

它的準(zhǔn)確率速度都超過了大前輩Mask-RCNN;也超過了另外兩只行業(yè)精英:FPN和SSD。

模型叫做NAS-FPN。大佬Quoc Le說,它的長相完全在想象之外,十分前衛(wèi):

喜訊發(fā)布一日,已收獲600顆心

AI的腦洞果然和人類不一樣。對比一下,目標(biāo)檢測界的傳統(tǒng)方法FPN (特征金字塔網(wǎng)絡(luò)) 長這樣:

谷歌大腦說,雖然網(wǎng)絡(luò)架構(gòu)搜索 (NAS) 并不算新穎,但他們用的搜索空間與眾不同。

怎么搜出來?

在NAS-FPN出現(xiàn)之前,地球上最強(qiáng)大的目標(biāo)檢測模型,架構(gòu)都是人類手動設(shè)計的。

這是Mask-RCNN的成果

NAS是一種自動調(diào)參的方法,調(diào)的不是訓(xùn)練超參數(shù),是網(wǎng)絡(luò)架構(gòu)超參數(shù):比如網(wǎng)絡(luò)多少層、每層都是什么算子、卷積層里的過濾器大小等等。

它可以在許多許多不同的架構(gòu)里,快速找到性能最好的那一個。

所以,要把目標(biāo)檢測的常用架構(gòu)FPN(特征金字塔網(wǎng)絡(luò)) 和NAS結(jié)合起來,發(fā)現(xiàn)那只最厲害的AI。

但問題是搜索空間太大,特征橫跨許多不同的尺度。

于是,團(tuán)隊(duì)基于RetinaNet框架,設(shè)計了一個新的搜索空間:

這里,一個FPN是由許多的“合并單元 (Merging Cells) ”組成的。

是要把輸入的不同尺度/分辨率的特征層,合并到RetinaNet的表征里去。

具體怎樣合并?這是由一個RNN控制器來決定的,經(jīng)過四個步驟:

一是,從輸入里任選一個特征層;

二是,從輸入里再選一個特征層;

三是,選擇輸出的特征分辨率;

四是,選擇一種二進(jìn)制運(yùn)算,把兩個特征層 (用上一步選定的分辨率) 合并起來。

第四步有兩種運(yùn)算可選,一種是加和 (sum) ,一種是全局池化 (Global Pooling) 。兩個都是簡單、高效的運(yùn)算,不會附加任何帶訓(xùn)練的參數(shù)。

一個Cell就這樣合并出來了,但這只是中間結(jié)果。把它加到剛才的輸入列表里,和其他特征層排在一起。

然后,就可以重新選兩個特征層,重復(fù)上面的步驟一、二、四,保持分辨率不變。

(團(tuán)隊(duì)說,如果要避免選到相同分辨率的兩個特征層,就不要用步長8。2和4是比較合適的步長。)

就這樣,不停地生成新的Cell。

停止搜索的時候,最后生成的5個Cell,會組成“被選中的FPN”出道。

那么問題來了,搜索什么時候能停?

不是非要全部搜索完,隨時都可以退出。反正分辨率是不變的,F(xiàn)PN是可以隨意擴(kuò)展的。

團(tuán)隊(duì)設(shè)定了Early Exit (提前退出) 機(jī)制,用來權(quán)衡速度和準(zhǔn)確率。

最終發(fā)布NAS-FPN的,是AI跑了8,000步之后,選取最末5個Cell生成的網(wǎng)絡(luò)?;仡櫼幌拢?/p>

看不清請把手機(jī)橫過來

從原始FPN (下圖a) 開始,它走過的路大概是這樣的:

跑得越久,生成的網(wǎng)絡(luò)就越蜿蜒。

模型怎么樣?

NAS-FPN可以依托于各種骨架:MobileNet,ResNet,AmoebaNet……

團(tuán)隊(duì)選擇的是AmoebaNet骨架。

那么,用COCO test-dev數(shù)據(jù)集,和那些強(qiáng)大的前輩比一比高清大圖檢測效果。

比賽結(jié)果發(fā)布:

看不清請把手機(jī)橫過來

NAS-FPN拿到了48.3的AP分,超過了Mask-RCNN,并且用時更短 (右邊第二列是時間) 。

另外一場比賽,是移動檢測 (320x320) ,NAS-FPN的輕量版本,跑在MobileNet2骨架上:

超過了厲害的前輩SSD輕量版,雖然,還是沒有趕上YOLOv3

YOLOv3過往成果展

不過,打敗Mask-RCNN已經(jīng)是值得慶祝的成就了。

One More Thing

NAS既然如此高能,應(yīng)該已經(jīng)搜索過很多東西了吧?

谷歌大腦的另一位成員David Ha列出了7種

1) 基于CNN的圖像分類器,2)RNN,3) 激活函數(shù),4) SGD優(yōu)化器,5) 數(shù)據(jù)擴(kuò)增,6) Transformer,7) 目標(biāo)檢測。

并發(fā)射了直擊靈魂的提問:下一個被搜的會是什么?

他的同事摘得了最佳答案:NAS啊

NAS

論文傳送門:https://arxiv.org/pdf/1904.07392.pdf

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6255

    瀏覽量

    111891
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40651

    瀏覽量

    302307

原文標(biāo)題:超越Mask-RCNN:谷歌大腦的AI,自己寫了個目標(biāo)檢測AI

文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學(xué)會】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    沒有AI大腦,別叫全屋智能

    打破偽智能困境,美的為家裝上AI大腦MevoX
    的頭像 發(fā)表于 03-16 09:13 ?887次閱讀
    沒有<b class='flag-5'>AI</b><b class='flag-5'>大腦</b>,別叫全屋智能

    論馬斯克的預(yù)言:AI使人類邊緣化

    呈指數(shù)級爆炸增長,在這種級別的AI面前,人類的智能總和將顯得微不足道,從而導(dǎo)致人類被邊緣化。 合理性 技術(shù)發(fā)展趨勢角度:從當(dāng)前技術(shù)發(fā)展來看,AI確實(shí)在不斷進(jìn)步,如科研團(tuán)隊(duì)完成的果蠅“數(shù)字大腦”嫁接
    發(fā)表于 03-14 05:27

    當(dāng)谷歌自己發(fā)電,AI 系統(tǒng)會回到基礎(chǔ)工程嗎?

    2026年,谷歌開始自己發(fā)電。這不是能源布局,這是系統(tǒng)焦慮。當(dāng)全球算力頂端的公司,把注意力轉(zhuǎn)向電力,意味著一信號——AI的瓶頸,正在下沉。 不再只是芯片,不再只是參數(shù)。而是系統(tǒng)能否
    的頭像 發(fā)表于 02-12 15:59 ?2470次閱讀
    當(dāng)<b class='flag-5'>谷歌</b><b class='flag-5'>自己</b>發(fā)電,<b class='flag-5'>AI</b> 系統(tǒng)會回到基礎(chǔ)工程嗎?

    使用NORDIC AI的好處

    Nordic 的 Edge AI 主要有以下幾個好處(基于官方資料總結(jié)): 極低功耗、延長電池壽命 在本地運(yùn)行 AI,減少無線傳輸次數(shù),而無線收發(fā)是最耗電的部分。設(shè)備只需上傳“結(jié)果/事件”,而不是
    發(fā)表于 01-31 23:16

    純4G?血版AI小智產(chǎn)品方案 #小智AI #AI方案商 #4G通話 #AI終端產(chǎn)品

    AI
    不太正經(jīng)的攻城獅
    發(fā)布于 :2025年12月21日 14:36:55

    瑞芯微SOC智能視覺AI處理器

    能力。核心升級: 增加了高規(guī)格的視頻編碼能力,支持H.264/H.265格式的4K@60fps編碼。目標(biāo): 解決了RK1126只能“分析”不能“錄制”的短板,成為一集視頻采集、AI智能分析、高質(zhì)量編碼錄制于一體的完整解決方案。
    發(fā)表于 12-19 13:44

    VS680 HDMI AI分析解決方案 #目標(biāo)識別 #視頻翻譯 #AI #芯片

    AI
    深蕾半導(dǎo)體
    發(fā)布于 :2025年11月12日 10:29:33

    【CPKCOR-RA8D1】AI人臉檢測

    在瑞薩 RA8D1 開發(fā)板上集成 AI 人臉檢測功能 1. 項(xiàng)目概述 該項(xiàng)目是根據(jù)官方AI人臉檢測代碼,在官方顯示屏顯示代碼的基礎(chǔ)上進(jìn)行修改而得。由于本人實(shí)力有限,最后的結(jié)果并不理想,
    發(fā)表于 10-29 17:59

    谷歌AlphaEarth和維智時空AI大模型的核心差異

    谷歌AlphaEarth和維智時空AI大模型在技術(shù)理念上存在諸多共性,但兩者在目標(biāo)尺度、數(shù)據(jù)來源、技術(shù)實(shí)現(xiàn)和應(yīng)用模式上存在顯著差異。
    的頭像 發(fā)表于 10-22 14:50 ?985次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    解決人類智能無法解決的復(fù)雜問題。實(shí)現(xiàn)AGI的AI相關(guān)研究機(jī)構(gòu)和企業(yè)的主要目標(biāo)。 一、生成式AI點(diǎn)燃AGI之火 CHatGPT就是已經(jīng)取得成功的生成式AI技術(shù)。很多人都充滿了信心,相信不
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    AI被賦予了人的智能,科學(xué)家們希望在沒有人類的引導(dǎo)下,AI自主的提出科學(xué)假設(shè),諾貝爾獎級別的假設(shè)哦。 AI驅(qū)動科學(xué)被認(rèn)為是科學(xué)發(fā)現(xiàn)的第五范式了,與實(shí)驗(yàn)科學(xué)、理論科學(xué)、計算科學(xué)、數(shù)據(jù)驅(qū)
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+化學(xué)或生物方法實(shí)現(xiàn)AI

    21世紀(jì)是生命科學(xué)的世紀(jì),生物技術(shù)的潛力將比電子技術(shù)更深遠(yuǎn)----- 里卡多-戈蒂爾 半導(dǎo)體實(shí)現(xiàn)AI應(yīng)該沒什么疑問了吧?化學(xué)、生物怎么實(shí)現(xiàn)AI呢? 生物大腦是一由無數(shù)神經(jīng)元通過突觸連
    發(fā)表于 09-15 17:29

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導(dǎo)體芯片技術(shù)加以實(shí)現(xiàn)。 而大腦是一由無數(shù)神經(jīng)元通過突觸連接而成
    發(fā)表于 09-06 19:12

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    創(chuàng)新、應(yīng)用創(chuàng)新、系統(tǒng)創(chuàng)新五部分,接下來一一解讀。 算法創(chuàng)新 在深度學(xué)習(xí)AI芯片的創(chuàng)新上,書中圍繞大模型與Transformer算法的算力需求,提出了一系列架構(gòu)與方法創(chuàng)新,包括存內(nèi)計算技術(shù)、基于開源
    發(fā)表于 07-28 13:54

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗(yàn)】+ 入門篇學(xué)習(xí)

    工程、RAG技術(shù)、和AI Agent是3重要方面。其中AI Agent作為2024年最新興的技術(shù)領(lǐng)域,具備很好的應(yīng)用前景,本書對零基礎(chǔ)小白普及和應(yīng)用AI Agent有著很好的指導(dǎo)作用
    發(fā)表于 05-02 09:26