在軟件和硅中復(fù)制人腦是人工智能(AI)研究的長期目標。雖然神經(jīng)形態(tài)芯片在能夠同時運行多個計算方面取得了重大進展,并且既能計算也能存儲數(shù)據(jù),但它們還遠未達到模擬大腦的能源效率。
人工智能計算是非常耗能的,但所消耗的能量大部分不是計算本身。能量密集型部分是在AI芯片內(nèi)的內(nèi)存和計算單元之間移動數(shù)據(jù)。為了解決這個問題,一組研究人員開發(fā)了一種新的內(nèi)存計算(CIM)芯片原型,消除了這種分離的需要。他們在8月17日發(fā)表在《自然》雜志上的論文中聲稱,其原型展示了現(xiàn)有人工智能平臺效率的兩倍。之所以稱為NeuRRAM,是因為它使用一種稱為電阻式隨機存取存儲器(RRAM)的RAM,這種48核RRAM-CIM硬件支持多種神經(jīng)網(wǎng)絡(luò)模型和架構(gòu)。
該論文的第一作者、斯坦福大學(xué)研究員Weier Wan表示,與傳統(tǒng)內(nèi)存相比,RRAM有很多優(yōu)點。其中之一是在同一硅片區(qū)域內(nèi)具有更高的容量,從而可以實現(xiàn)更大的AI模型。它也是非易失性的,意味著沒有電源泄漏。他補充說,這使得基于RRAM的芯片成為邊緣工作負載的理想選擇。研究人員設(shè)想,NeuRRAM芯片可以在低功耗的邊緣設(shè)備上有效地處理一系列復(fù)雜的人工智能應(yīng)用,而不依賴于與云的網(wǎng)絡(luò)連接。
為了設(shè)計NeuRRAM,團隊必須權(quán)衡效率、多功能性和準確性,而不犧牲其中任何一項。Wan說:“主要創(chuàng)新是我們使用了一種新型的模數(shù)轉(zhuǎn)換方案,因為這被認為是CIM芯片能源效率的主要瓶頸。我們發(fā)明了一種新的方案,它是基于感應(yīng)電壓,而以前的方案是基于感應(yīng)電流。電壓模式感應(yīng)還允許在單個計算周期內(nèi)提高RRAM陣列的并行性?!?/p>
他們還探索了一些新的體系結(jié)構(gòu),如可轉(zhuǎn)置神經(jīng)突觸陣列(TNSA),以靈活地控制數(shù)據(jù)流方向。Wan解釋道:“為了精確性,關(guān)鍵是算法和硬件協(xié)同設(shè)計。這基本上允許我們直接在這些AI模型中建模硬件特征?!边@反過來又允許算法適應(yīng)硬件非理想性并保持精確性。換言之,Wan總結(jié)道,他們優(yōu)化了整個堆棧,從設(shè)備到電路,從架構(gòu)到算法,設(shè)計出一款高效、通用、準確的芯片。
加州大學(xué)圣地亞哥分校研究員Gert Cauwenberghs是這篇論文的合著者之一,他說:“內(nèi)存計算的大多數(shù)進展都局限于軟件級的演示,基本上是使用一系列突觸。但在這里,我們將其放在堆棧的水平層。”
NeuRRAM在手寫數(shù)字識別任務(wù)中實現(xiàn)了99%的準確率,在圖像分類任務(wù)中達到了85.7%,在谷歌語音命令識別任務(wù)中達到84.7%,在圖像恢復(fù)任務(wù)中,圖像重建錯誤減少了70%。研究人員總結(jié)道:“這些結(jié)果可以與現(xiàn)有的數(shù)字芯片相媲美,這些數(shù)字芯片在相同的比特精度下進行計算,但可以大幅節(jié)省能源?!?/p>
將NeuRRAM與Intel的Loihi 2神經(jīng)形態(tài)芯片(800萬神經(jīng)元Pohoiki Beach系統(tǒng)的組成部分)進行比較,研究人員表示,他們的芯片具有更好的效率和密度。圣母大學(xué)(University of Notre Dame)另一位合著者兼研究員Siddharth Joshi補充道:“基本上,Loihi是一個標準的數(shù)字處理器,帶有SRAM庫和特定的可編程ISA(指令集)架構(gòu)。它們使用了一種更為von Neumann–ish式的架構(gòu),而我們的計算是在位線本身上進行的。”
最近的研究還認為,包括Loihi在內(nèi)的神經(jīng)形態(tài)芯片可能具有比AI更廣泛的應(yīng)用范圍,包括醫(yī)療和經(jīng)濟分析,以及量子計算需求。NeuRRAM的制造商同意這一觀點,認為內(nèi)存計算架構(gòu)是未來的發(fā)展方向。Cauwenberghs補充道,NeuRRAM的可擴展性在架構(gòu)方面表現(xiàn)得很好,“因為我們有這個并行的核心陣列,每個核心獨立進行計算,這就是我們?nèi)绾螌崿F(xiàn)具有任意連接的大型網(wǎng)絡(luò)的方法。”
研究人員表示,現(xiàn)在考慮商業(yè)化還為時過早。雖然他們認為芯片的高效硬件實現(xiàn)與內(nèi)存計算是一個成功的組合,但廣泛采用仍將取決于降低能效基準。
“我們正在繼續(xù)努力整合學(xué)習(xí)規(guī)則,”Cauwenberghs報告說,“這樣未來的版本將能夠通過RRAM技術(shù)的進步進行循環(huán)學(xué)習(xí),從而實現(xiàn)大規(guī)模的增量學(xué)習(xí)或產(chǎn)品學(xué)習(xí)。”Wan還補充道,為了實現(xiàn)商業(yè)化,RRAM技術(shù)必須更容易為芯片設(shè)計者所用。
-
芯片
+關(guān)注
關(guān)注
463文章
54054瀏覽量
466832 -
人工智能
+關(guān)注
關(guān)注
1818文章
50134瀏覽量
265741 -
RRAM
+關(guān)注
關(guān)注
0文章
29瀏覽量
21745
原文標題:新型AI芯片 其能效或是替代品的兩倍
文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
邊緣計算AI芯片企業(yè)愛芯元智港股上市
愛芯元智通過港交所聆訊,有望成為“中國邊緣AI芯片第一股”
P*V 系列溫度補償芯片衰減器:電子設(shè)計的理想選擇
深入剖析TMDS141:HDMI信號處理的理想選擇
TPD12S016:HDMI接口的理想伴侶芯片
拆解邊緣計算的真相:為什么行業(yè)都在押注 Linux?
如何加速實時工作負載
集創(chuàng)北方聯(lián)合發(fā)布首顆自研RRAM AMOLED顯示驅(qū)動芯片
替代LTC4413雙通道理想二極管負載電流2.6A
為何邊緣設(shè)備正成為AI的新重心
如何選擇合適的電源芯片
輕松上手邊緣AI:MemryX MX3+結(jié)合Orange Pi 5 Plus的C/C++實戰(zhàn)指南
芯馳科技成為理想星環(huán)OS首個本土車規(guī)MCU合作伙伴
如何選擇 邊緣計算服務(wù)器
RRAM的芯片成為邊緣工作負載的理想選擇
評論