機(jī)器學(xué)習(xí)領(lǐng)域之間的知識(shí)遷移是現(xiàn)在AI中存在的一個(gè)重要問題。來自IBM Research的Kamil Rocki最近開發(fā)了一款“超級(jí)計(jì)算機(jī)”,每秒可處理10億幀,能幫助開發(fā)出更高效的機(jī)器學(xué)習(xí)算法和更強(qiáng)健的人工智能記憶。
總是有些聰明人,能解決那么棘手的問題。
機(jī)器學(xué)習(xí)算法能夠在最困難的棋盤游戲、經(jīng)典的電子游戲甚至一些現(xiàn)代游戲中戰(zhàn)勝人類。
但是它們?nèi)匀挥幸恍┖艽蟮木窒扌?,主要與“記憶”有關(guān)——或者更確切地說,與缺乏記憶有關(guān)。
在IBM Research從事人工智能研究的計(jì)算機(jī)科學(xué)家Kamil Rocki最近開發(fā)了一款“超級(jí)計(jì)算機(jī)”,用于從數(shù)千個(gè)虛擬Game Boy身上開發(fā)機(jī)器學(xué)習(xí)應(yīng)用程序。Rocki希望這個(gè)項(xiàng)目能幫助開發(fā)出更高效的機(jī)器學(xué)習(xí)算法和更強(qiáng)健的人工智能記憶。
不同ML領(lǐng)域間的知識(shí)遷移是難點(diǎn)
計(jì)算機(jī)科學(xué)家訓(xùn)練了一個(gè)人工神經(jīng)網(wǎng)絡(luò)(一種松散地以人腦為基礎(chǔ)的計(jì)算架構(gòu)),以便它能夠執(zhí)行特定的任務(wù),比如打敗特定的游戲。
然而,如果一個(gè)已經(jīng)掌握了俄羅斯方塊的神經(jīng)網(wǎng)絡(luò)想要學(xué)習(xí)一款更復(fù)雜的游戲,比如《超級(jí)馬里奧兄弟》,那么這個(gè)神經(jīng)網(wǎng)絡(luò)基本上是從零開始,無法利用它在俄羅斯方塊上的經(jīng)驗(yàn)更快地學(xué)習(xí)《超級(jí)馬里奧兄弟》。
Rocki的Game Boy計(jì)算集群是一個(gè)工具,他希望能夠借此幫助解決現(xiàn)在人工智能研究中的一個(gè)主要問題:機(jī)器學(xué)習(xí)領(lǐng)域之間的知識(shí)遷移。
2015年,谷歌的DeepMind證明了單個(gè)神經(jīng)網(wǎng)絡(luò)能夠掌握幾種不同的Atari 2600游戲。這是邁向神經(jīng)網(wǎng)絡(luò)記憶的一步,然而正如羅基在博客中描述他的“超級(jí)計(jì)算機(jī)”時(shí)所解釋的那樣,這些游戲在復(fù)雜性方面并沒有太大的差異。
《太空入侵者》的播放頻率為100MHz,是FPGA全速的四分之一。
在DeepMind的神經(jīng)網(wǎng)絡(luò)所掌握的大多數(shù)Atari游戲中,玩家與操縱桿的動(dòng)作及其在屏幕上的結(jié)果之間的關(guān)系都是通過即時(shí)反饋來明確的。
這與《波斯王子》(Prince of Persia)等游戲截然不同。在這些游戲中,玩家的行為可能不會(huì)立即產(chǎn)生反饋,而且屏幕上也不會(huì)一直顯示分?jǐn)?shù)。
Rocki在他的博客中解釋說,要用人工智能處理這些游戲,他覺得需要一個(gè)神經(jīng)網(wǎng)絡(luò),它必須能夠快速地進(jìn)行游戲,并且同時(shí)運(yùn)行幾個(gè)游戲。
Rocki寫道:“想象一下,你可以在百分之一的時(shí)間內(nèi)完成《波斯王子》,同時(shí)運(yùn)行10萬款游戲?!?/p>
神經(jīng)網(wǎng)絡(luò)還必須在一個(gè)游戲機(jī)上實(shí)現(xiàn)。
游戲機(jī)上有各種各樣的游戲可供選擇,這些游戲并不需要耗費(fèi)大量資源才能運(yùn)行,這樣才能測(cè)試它在更復(fù)雜游戲上使用先驗(yàn)知識(shí)的能力。
Rocki在他的研究中考慮了幾種不同的游戲機(jī),包括街機(jī)版的太空入侵者、Atari2600、任天堂娛樂系統(tǒng)(NES)和Game Boy Classic。
但問題是,這些系統(tǒng)中速度的峰值都是每秒3000幀。如果Rocki想真正提高機(jī)器學(xué)習(xí)的速度,他必須弄清楚如何在這些平臺(tái)上以每秒數(shù)億幀的速度運(yùn)行。
最終,Rocki決定使用Game Boy,因?yàn)樵撚螒驒C(jī)擁有超過1,000款可供選擇的游戲,在復(fù)雜性方面存在很多差異。 Game Boy Classic的160×144兩位(bit)彩色屏幕也易于處理,這使得運(yùn)行游戲的系統(tǒng)變得更加容易。
Rocki試圖根據(jù)自己的主觀判斷,通過游戲的復(fù)雜性來組織Game Boy游戲。像《太空入侵者》這樣的游戲在左邊,不那么復(fù)雜,而《Pokemon》和《波斯王子》則在右上角,更加復(fù)雜。
為此,Rocki在現(xiàn)場(chǎng)可編程門陣列(FPGA)中模擬了大多數(shù)游戲機(jī)核心的英特爾8080 CPU。FPGA是一種強(qiáng)大、專業(yè)的計(jì)算機(jī)芯片,可用于大規(guī)模模擬其他硬件。
例如,在最初的《太空入侵者》街機(jī)控制臺(tái)中使用的8080 CPU以每秒100萬次(1 MHz)的速度運(yùn)行。
然而,當(dāng)這個(gè)CPU在FPGA中模擬時(shí),它的時(shí)鐘頻率可高達(dá)400 MHz,這就像以每秒24,000幀的速度運(yùn)行游戲一樣。
不僅如此,單個(gè)FPGA一次可以模擬100個(gè)這樣的CPU,在單個(gè)FPGA芯片上每秒總共可以產(chǎn)生240萬幀。
Rocki在一封電子郵件中說,有1296個(gè)FPGA芯片連接在一起,每秒可以從數(shù)百個(gè)模擬Game Boys中產(chǎn)生大約10億幀。(理論上,這可以在50塊FPGA芯片上實(shí)現(xiàn),但Rocki說,他和同事們并沒有“把它們推到極限”。)
硬件加速的俄羅斯方塊,以100MHz的速度播放,大約是全速的四分之一。
正如Rocki在他的博客中所寫,使用他的Gameboy超級(jí)計(jì)算機(jī)進(jìn)行的測(cè)試到目前為止相當(dāng)成功。
他認(rèn)為這款工具是更廣泛的趨勢(shì)之一,在未來十年內(nèi)將AI算法與先進(jìn)的硬件解決方案相結(jié)合。
這可能最終會(huì)讓我們走上更強(qiáng)大的人工智能之路。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4839瀏覽量
108052 -
超級(jí)計(jì)算機(jī)
+關(guān)注
關(guān)注
2文章
483瀏覽量
43457 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
67文章
8560瀏覽量
137152
原文標(biāo)題:“Game Boy超級(jí)計(jì)算機(jī)”每秒處理10億幀,ML知識(shí)遷移不再是難題!
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
Neousys宸曜發(fā)布適用于狹小空間的經(jīng)濟(jì)型邊緣人工智能計(jì)算機(jī)
使用NVIDIA技術(shù)驅(qū)動(dòng)的超級(jí)計(jì)算機(jī)助力開放科學(xué)研究
奧士康召開DGX Spark AI超級(jí)計(jì)算機(jī)項(xiàng)目表彰大會(huì)
【作品合集】賽昉科技VisionFive 2單板計(jì)算機(jī)開發(fā)板測(cè)評(píng)
工業(yè)計(jì)算機(jī)的重要性
NVIDIA助力AI超級(jí)計(jì)算機(jī)Isambard-AI投入使用
自動(dòng)化計(jì)算機(jī)的功能與用途
【項(xiàng)目分享】Xii-Boy-Ultra 無線便攜式 Wii 游戲機(jī)
工業(yè)計(jì)算機(jī)與商用計(jì)算機(jī)的區(qū)別有哪些
NVIDIA驅(qū)動(dòng)的現(xiàn)代超級(jí)計(jì)算機(jī)如何突破速度極限并推動(dòng)科學(xué)發(fā)展
Blue Lion超級(jí)計(jì)算機(jī)將在NVIDIA Vera Rubin上運(yùn)行
NVIDIA技術(shù)賦能歐洲最快超級(jí)計(jì)算機(jī)JUPITER
NVIDIA助力全球最大量子研究超級(jí)計(jì)算機(jī)
工業(yè)計(jì)算機(jī)如何設(shè)計(jì)用于沖擊和振動(dòng)
一文帶你了解工業(yè)計(jì)算機(jī)尺寸
一款“超級(jí)計(jì)算機(jī)”用于從數(shù)千個(gè)虛擬Game Boy身上開發(fā)機(jī)器學(xué)習(xí)應(yīng)用程序
評(píng)論