91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI環(huán)境探索模型升級(jí) 縮小搜索范圍效率更高

工程師鄧生 ? 來源:VentureBeat,arXiv ? 作者:VentureBeat,arXiv ? 2021-02-13 10:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,卡內(nèi)基·梅隆大學(xué)、臉書等機(jī)構(gòu)的研究人員提出了一個(gè)新的AI環(huán)境探索模型。這個(gè)新模型綜合了傳統(tǒng)環(huán)境探索模型和基于學(xué)習(xí)方法的環(huán)境探索模型的優(yōu)點(diǎn),更簡(jiǎn)單和不易出錯(cuò)。

這項(xiàng)研究已經(jīng)發(fā)表在學(xué)術(shù)網(wǎng)站arXiv上,論文標(biāo)題為《利用主動(dòng)神經(jīng)SLAM學(xué)習(xí)探索環(huán)境(Learning To Explore Using Active Neural SLAM)》。

論文鏈接:https://arxiv.org/pdf/2004.05155.pdf

e99e0ec582ba4f7fa20273f9c12cfe50.png

一、ANS模型:真實(shí)模擬探索環(huán)境

導(dǎo)航能力是智能代理的核心能力之一。導(dǎo)航任務(wù)有許多形式,比如點(diǎn)目標(biāo)任務(wù)指導(dǎo)航到特定的坐標(biāo),語義導(dǎo)航任務(wù)指導(dǎo)航到去特定場(chǎng)景或?qū)ο蟮穆窂健?/p>

不論哪一種任務(wù),在未知環(huán)境中導(dǎo)航的核心問題都是如何高效地探索盡可能多的環(huán)境。這樣才能擴(kuò)大在未知環(huán)境中找到目標(biāo)的機(jī)會(huì),或者在有限的時(shí)間里有效地預(yù)映射環(huán)境。

傳統(tǒng)的探索模型原理是用傳感器觀察幾何體。之后有研究者提出了基于學(xué)習(xí)的導(dǎo)航模型,該模型依據(jù)RGB圖像直接推測(cè)出幾何體。

基于學(xué)習(xí)的導(dǎo)航策略通過端到端(end-to-end)訓(xùn)練神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),可以處理原始的傳感器數(shù)據(jù),直接輸出代理該執(zhí)行的操作。這種策略有3個(gè)優(yōu)勢(shì):

1、提高了輸入方式選擇的靈活性;

2、提高顯式狀態(tài)估計(jì)誤差的穩(wěn)健性;

3、通過學(xué)習(xí)掌握真實(shí)世界的結(jié)構(gòu)規(guī)律性,使代理更有目的性地行動(dòng)

理論上端到端的學(xué)習(xí)策略有上述優(yōu)勢(shì),但也有局限性。

首先,純粹從數(shù)據(jù)中學(xué)習(xí)映射、狀態(tài)評(píng)估、路徑規(guī)劃可能會(huì)非常昂貴。因此,以往的端到端學(xué)習(xí)依賴于模仿學(xué)習(xí)和以百萬計(jì)的經(jīng)驗(yàn)框架。

其次,以往針對(duì)端到端學(xué)習(xí)策略的研究缺乏真實(shí)性。比如使用的是合成室內(nèi)環(huán)境數(shù)據(jù)庫SUNC、簡(jiǎn)化了代理動(dòng)作、運(yùn)行環(huán)境去除了傳感器噪音等。

從表現(xiàn)來說,端到端的學(xué)習(xí)策略也往往比不需要任何學(xué)習(xí)的傳統(tǒng)方法差。

為了解決全面端到端學(xué)習(xí)的局限性,卡內(nèi)基·梅隆大學(xué)、臉書、伊利諾大學(xué)厄巴納-香檳分校的研究人員推出了“主動(dòng)神經(jīng)即時(shí)定位與地圖構(gòu)建(ANS,Active Neural SLAM)模型”。

實(shí)驗(yàn)設(shè)計(jì)上,研究人員盡量使模型訓(xùn)練環(huán)境更真實(shí),用到了生境模擬器和兩個(gè)基于真實(shí)情景的數(shù)據(jù)庫(Gibson和Matterport),不限制代理的動(dòng)作,還模擬了傳感器噪音。

二、縮小搜索范圍,兼顧搜索性能和效率

本項(xiàng)研究中,導(dǎo)航模型的任務(wù)是在固定時(shí)間內(nèi)覆蓋最大范圍。覆蓋范圍定義為地圖中已知被穿越的總面積。

ANS模型包括一個(gè)學(xué)習(xí)神經(jīng)即時(shí)定位與地圖構(gòu)建(SLAM,Simultaneous localization and mapping)模塊,一個(gè)全局策略(global policy)和一個(gè)局部策略(local policy)。它們通過地圖和一個(gè)分析路徑規(guī)劃器相連。

層次化和模塊化的設(shè)計(jì)和分析規(guī)劃的使用,大大減小了訓(xùn)練過程中的搜索范圍,同時(shí)提高了性能和樣本效率。

6892cb08fa96435096077975972be52b.png

▲模型示意圖

訓(xùn)練過程中,學(xué)習(xí)神經(jīng)SLAM模塊產(chǎn)生自由空間地圖,并依據(jù)輸入的RGB圖像和運(yùn)動(dòng)傳感器數(shù)據(jù)預(yù)測(cè)代理的姿勢(shì)。SLAM模塊的學(xué)習(xí)提升了輸入方式的靈活性。

全局策略利用代理的姿勢(shì)來占據(jù)自由空間地圖,并把學(xué)習(xí)現(xiàn)實(shí)世界環(huán)境布局的結(jié)構(gòu)性規(guī)則作為長(zhǎng)期目標(biāo)。全局策略可以探索真實(shí)世界環(huán)境的布局。

長(zhǎng)期目標(biāo)可以為局部策略生成短期目標(biāo)。局部策略通過學(xué)習(xí),直接從RGB圖像中映射出代理應(yīng)該做出的動(dòng)作,呈現(xiàn)可視化反饋。

b09b041196c7490e96e6507cc0027fcf.png

▲模型運(yùn)行過程示意圖

三、ANS模型能探索更大范圍,比基線模型性能優(yōu)秀

利用Gibson訓(xùn)練集,研究人員完成了對(duì)ANS模型的訓(xùn)練,運(yùn)行了1000萬幀探索任務(wù)的所有基線。結(jié)果如下表。

67dfc6baa75e4e77aef35bd9bbeed207.png

運(yùn)行結(jié)果基于模型在14個(gè)未知場(chǎng)景中994次運(yùn)行的結(jié)果進(jìn)行平均。與最佳基線的24.863m^2/0.789相比,模型的覆蓋率為32.701m^2/0.948。這個(gè)數(shù)值說明,與基線相比,ANS模型在窮盡探索上更有效。

研究人員還對(duì)比了模型和基線在較大訓(xùn)練集、較小訓(xùn)練集、全部Gibson訓(xùn)練集中的運(yùn)行效果。

6a0dd40111dc4fa5a43813b64198aa89.png

較小訓(xùn)練集中,ANS模型能在500步探索完未知環(huán)境,而基線運(yùn)行1000步后仍只探索了位置環(huán)境的85~90%(上圖中)。

較大訓(xùn)練集中,隨著情節(jié)的發(fā)展,ANS模型與基線之間的差距會(huì)擴(kuò)大(上圖左)。

基線模型中,代理經(jīng)常只探索局部區(qū)域,這說明它們無法記住長(zhǎng)期視野的探索區(qū)域,不能進(jìn)行長(zhǎng)期規(guī)劃。相比之下,ANS采用全局策略,可以記憶探索過的區(qū)域,有效地規(guī)劃并實(shí)現(xiàn)長(zhǎng)期目標(biāo)。

受到結(jié)果鼓舞,研究人員用ANS模型部署了一個(gè)環(huán)境探索機(jī)器人。通過調(diào)整攝相機(jī)的高度和垂直視野,并匹配棲息地模擬器,機(jī)器人成功探索出一個(gè)公寓的生活區(qū)域。

a9f4b3437ebe4b7a982c82e203c4137b.gif

結(jié)語:ANS模型效率更高,未來或有更多應(yīng)用

ANS導(dǎo)航模型克服了之前的基于端對(duì)端學(xué)習(xí)策略的缺陷,基于更真實(shí)的數(shù)據(jù)庫進(jìn)行訓(xùn)練,最終探索效率有所提升。

研究人員認(rèn)為這個(gè)模型在未來或許會(huì)有更多應(yīng)用?!拔磥恚珹NS模型可以擴(kuò)展到復(fù)雜的語義任務(wù),比如語義目標(biāo)導(dǎo)航和回答具體問題,這將創(chuàng)建出一個(gè)能捕獲對(duì)象語義屬性的地圖?!?/p>

另外,這個(gè)模型也可以與先前的本地化工作結(jié)合,在此前創(chuàng)建的地圖中重新定位,使之后的導(dǎo)航更高效。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39820

    瀏覽量

    301491
  • 搜索
    +關(guān)注

    關(guān)注

    0

    文章

    70

    瀏覽量

    17003
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3755

    瀏覽量

    52121
  • SLAM
    +關(guān)注

    關(guān)注

    24

    文章

    457

    瀏覽量

    33336
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    模型 ai coding 比較

    序 我主要用途是 ai coding,從各種渠道獲取到了很多 不同的大模型排序 最多的是 opus 4.6 > k2.5 > glm5 >
    發(fā)表于 02-19 13:43

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個(gè)AI模型怎么搞,知識(shí)盲區(qū)
    發(fā)表于 10-14 07:14

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    實(shí)例,從而保持高計(jì)算效率。 2、Q算法 Q項(xiàng)目將大模型功能與A*和Q-learning等復(fù)雜算法結(jié)合,進(jìn)一步推動(dòng)了AI領(lǐng)域的蓬勃發(fā)展,標(biāo)志著向AGI方向邁出了重要的一步。 可能達(dá)到的高度: 自主學(xué)習(xí)
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    是一種快速反應(yīng)能力,是直接的感知;靈感是一種通過思考和探索獲得的創(chuàng)造性想法,是一種創(chuàng)意。 AI怎么模擬直覺與靈感呢?四、AI代替人類的假說 這可能嗎? 用機(jī)器來生成假說: 1、直接生成 生成式
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的未來:提升算力還是智力

    持續(xù)發(fā)展體現(xiàn)在: 1、收益遞減 大模型的基礎(chǔ)的需要極大的算力,這首先源于昂貴的高性能AI芯片,然后是寶貴的電力、水等與環(huán)境相關(guān)的資源。 收益遞減體現(xiàn)在: ①模型大小 ②訓(xùn)練數(shù)據(jù)量 ③訓(xùn)
    發(fā)表于 09-14 14:04

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導(dǎo)體芯片技術(shù)加以實(shí)現(xiàn)。 而大腦是一個(gè)由無數(shù)神經(jīng)元通過突觸連接而成的復(fù)雜網(wǎng)絡(luò),是極其復(fù)雜和精密的。大腦在本質(zhì)上就是一臺(tái)濕潤(rùn)的軟組織
    發(fā)表于 09-06 19:12

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+內(nèi)容總覽

    AI芯片:科技探索與AGI愿景》這本書是張臣雄所著,由人民郵電出版社出版,它與《AI芯片:前沿技術(shù)與創(chuàng)新未來》一書是姊妹篇,由此可見作者在AI芯片領(lǐng)域的功力和造詣。 作者畢業(yè)于上海交
    發(fā)表于 09-05 15:10

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級(jí)

    核心網(wǎng)絡(luò)支撐。未來,隨著1.6T光模塊的落地,睿海光電將進(jìn)一步推動(dòng)數(shù)據(jù)中心向更高性能、更智能化演進(jìn),攜手全球伙伴開啟AI新時(shí)代。 睿海光電——AI網(wǎng)絡(luò)升級(jí)的可靠伙伴!
    發(fā)表于 08-13 19:01

    【書籍評(píng)測(cè)活動(dòng)NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    DeepSeek,大模型應(yīng)用密集出現(xiàn)、頻繁升級(jí),這讓作者意識(shí)到有必要撰寫一本新的AI芯片圖書,以緊跟時(shí)代步伐、介紹新興領(lǐng)域和最新動(dòng)向。 這就是《AI芯片:前沿技術(shù)與創(chuàng)新未來》的姊妹篇—
    發(fā)表于 07-28 13:54

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】第三章:探索 DeepSeek - V3 技術(shù)架構(gòu)的奧秘

    數(shù)據(jù)中挖掘有價(jià)值信息,這也讓我意識(shí)到架構(gòu)設(shè)計(jì)對(duì)模型性能起著根本性作用,是 AI 具備強(qiáng)大能力的 “骨骼” 支撐。 二、流水線并行 書中關(guān)于流水線并行的內(nèi)容,展現(xiàn)了提升計(jì)算效率的巧妙思路。簡(jiǎn)單流水線并行雖
    發(fā)表于 07-20 15:07

    AI模型推動(dòng)醫(yī)療行業(yè)智能化升級(jí)

    數(shù)據(jù)與智能算法,為醫(yī)療行業(yè)帶來診療效率與精度的革命性升級(jí)。2025年,中國(guó)醫(yī)療AI市場(chǎng)規(guī)模將破千億,占全球35%以上。AI醫(yī)療革命,已經(jīng)拉開序幕......
    的頭像 發(fā)表于 07-15 16:55 ?997次閱讀

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗(yàn)】+初品Agent

    模型落地的重要方向,也是AI技術(shù)的下一個(gè)風(fēng)口。 因此該書適于對(duì)AI感興趣的讀者,尤其是Agent的學(xué)習(xí)者與開發(fā)者,如想要提升工作效率的職場(chǎng)人、推動(dòng)企業(yè)
    發(fā)表于 04-22 11:51

    DevEco Studio AI輔助開發(fā)工具兩大升級(jí)功能 鴻蒙應(yīng)用開發(fā)效率再提升

    帶來了前所未有的智能問答體驗(yàn)。 RAG增強(qiáng)型與傳統(tǒng)生成式AI的關(guān)鍵差異: 圖2:DeepSeek模型增強(qiáng)RAG能力前后效果對(duì)比圖 升級(jí)點(diǎn)2:新增代碼解釋功能,提升初學(xué)者開發(fā)效率 針對(duì)
    發(fā)表于 04-18 14:43

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    應(yīng)用開發(fā)不用“等平臺(tái)”,徹底釋放開發(fā)效率模型接入自由度。 自DeepSeek橫空出世以來,這種更適合端側(cè)部署,回答效率更高效的訓(xùn)練模式快速引爆了A
    發(fā)表于 04-13 19:52

    適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)

    100Gbps,整體速率高達(dá)800Gbps。這意味著在AI模型訓(xùn)練過程中,服務(wù)器之間的數(shù)據(jù)傳輸速率更快,顯著提升訓(xùn)練效率。相比NRZ,PAM4在相同頻譜范圍內(nèi)可以承載雙倍數(shù)據(jù)量,從而提
    發(fā)表于 03-25 17:35