Google研究人員在GECCO 2020會議上,發(fā)布具有自注意力(Self-attention)瓶頸的人工智能代理AttentionAgent,研究人員運用不注意視盲(Inattentional Blindness),讓AttentionAgent具有選擇性注意力,能夠忽略不重要的細節(jié),相較于傳統(tǒng)方法,代理泛化學(xué)習(xí)參數(shù)少了1,000倍,可以更好地處理復(fù)雜的計算機視覺任務(wù)。
不注意視盲是一種人類心理現(xiàn)象,由于選擇性注意力,因此人們會漏看視野里部分東西,Google提到,這種選擇性注意機制,讓人們可以專注于重要的事物上,而不分心于無關(guān)緊要的細節(jié),他們相信這種機制可以讓人們濃縮感官信息,成為一種夠簡潔的形式,用于未來的決策上。
盡管選擇性注意力看起來像是種限制,但Google認為,從自然界觀察到的這種瓶頸,可用于改善機器學(xué)習(xí)設(shè)計,通過模仿讓人工智能學(xué)習(xí),生物能夠高性能解決任務(wù)的方法。過去的深度增強學(xué)習(xí),都讓人工智能代理能夠訪問完整的視覺輸入,而Google現(xiàn)在以注意力限制,來減少人工智能代理訪問視覺輸入,以提高系統(tǒng)性能,不只可以大幅減少需要的參數(shù),而且因為代理看不見部分視覺輸入,因此剛好能避掉那些可能造成混淆的內(nèi)容,而且查看代理把注意力集中在什么部分,還可以為其決策提供視覺的可解釋性。
過去也有類似的研究,利用稀疏性來限制輸入內(nèi)容,而AttentionAgent則是從人類的不注意視盲獲得靈感,當大腦付出努力參與任務(wù)時,大部分的注意力會集中在與任務(wù)相關(guān)的元素上,暫時對其他信號視而不見。為了要實現(xiàn)這件事,Google將輸入的圖像分割成幾個小區(qū)塊,然后修改自注意力架構(gòu)來模擬小區(qū)塊間的投票,選出重要的子集,AttentionAgent會忽略不重要的部分,僅利用重要區(qū)塊做決策。
關(guān)鍵要素除了視覺輸入的截取之外,關(guān)聯(lián)這些要素隨時間變化的能力也很重要,像是棒球比賽中的打者,必須利用視覺信號來連續(xù)關(guān)注棒球的位置,以預(yù)測能夠打擊到球的位置,AttentionAgent則會利用長短期記憶(LSTM)模型,從重要的視覺區(qū)塊中截取信息,并在每個時步?jīng)Q定一個行動,LSTM會關(guān)注輸入串行變化,并利用這項信息關(guān)注關(guān)鍵要素在不同時的演變。
重要區(qū)塊的可視化,可讓研究人員知道人工智能下決策的方法,并說明大多數(shù)的選擇,是合理且符合人類主動,可作為系統(tǒng)開發(fā)階段,好用的分析和調(diào)試工具,另外,Google提到,人工智能代理學(xué)會忽略非關(guān)核心任務(wù)的信息,因此經(jīng)修改還可以推廣應(yīng)用到小環(huán)境任務(wù)。
Google的這項研究,證明僅讓人工智能代理訪問重要的區(qū)塊,無視場景其余的部分,可以提升代理泛化(Generalize),用于解決其他任務(wù)能力,像是在VizDoom TakeCover環(huán)境接受訓(xùn)練的人工智能代理,也能夠在其他墻壁較高、地板貼圖不同,或是更多令人分心標志的環(huán)境下生存。
這樣的成果可以被應(yīng)用在自動駕駛上,應(yīng)用晴天資料集學(xué)習(xí)駕駛的代理,也能夠?qū)Ⅰ{駛技能轉(zhuǎn)移到晚上或是下雨天,AttentionAgent不僅能夠解決CarRacing-v0任務(wù),在其他惡劣環(huán)境中,也能達到相近的性能,泛化需要的參數(shù)比慣用的方法少1,000倍。
不過,即便AttentionAgent能夠適應(yīng)環(huán)境修改,仍有其限制,像是原本周圍都是綠地的賽車背景,一旦換成YouTube視頻便會失效,又或是更換成均勻的噪聲時,人工智能代理的注意力模塊便會失效,Google提到,他們用于選擇重要視覺區(qū)塊的方法仍不夠強健,不足以應(yīng)對更復(fù)雜的任務(wù),因此他們接下來會發(fā)展,能從視覺輸入截取有意義特征的方法。
責(zé)任編輯:tzh
-
人工智能
+關(guān)注
關(guān)注
1819文章
50164瀏覽量
266023 -
計算機視覺
+關(guān)注
關(guān)注
9文章
1715瀏覽量
47670 -
自動駕駛
+關(guān)注
關(guān)注
794文章
14920瀏覽量
180447
發(fā)布評論請先 登錄
Sutherland推出FinAI Hub,助力銀行與金融服務(wù)領(lǐng)域代理型人工智能的產(chǎn)業(yè)化進程
西井科技攜手同濟大學(xué) 三篇AI研究成果入選頂會ICLR 2026
奧比中光3D視覺技術(shù)賦能IROS 2025研究成果
重磅來襲!2026全球人工智能終端展暨第七屆深圳人工智能展覽會
挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器
挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!
南方電網(wǎng)公司在2025世界人工智能大會展出多項人工智能成果
NVIDIA展示機器人領(lǐng)域的研究成果
CES Asia 2025同期低空智能感知與空域管理技術(shù)論壇即將啟幕
Nullmax端到端自動駕駛最新研究成果入選ICCV 2025
后摩智能與高校合作研究成果榮獲ISCA 2025最佳論文獎
最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)
NVIDIA在ICRA 2025展示多項最新研究成果
佛山智能裝備院與華數(shù)機器人在具身智能工業(yè)機器人領(lǐng)域的研究成果
Google:人工智能代理技術(shù)的研究成果
評論