英特爾首次展示了將神經(jīng)形態(tài)芯片Loihi與經(jīng)典計算和主流深度學習加速器進行比較的性能結(jié)果摘要。結(jié)果表明,盡管Loihi可能無法提供比其他前饋神經(jīng)網(wǎng)絡(luò)方法更多的優(yōu)勢,但對于其他工作負載(例如遞歸神經(jīng)網(wǎng)絡(luò))卻可以實現(xiàn)較大的延遲和功率效率增益。英特爾希望第一組定量結(jié)果將為開發(fā)適用于所有類型神經(jīng)形態(tài)硬件的正式神經(jīng)形態(tài)基準鋪平道路。
英特爾已經(jīng)將其Loihi芯片與其他計算架構(gòu)進行了基準測試(圖片來源:英特爾)
“經(jīng)過數(shù)十年的神經(jīng)形態(tài)研究,人們對令人驚嘆的AI功能,效率的巨大突破做出了許多承諾,但是很少有公開的定量結(jié)果來表明這是否是真實的,如果是的話,我們到底從哪里得到這些信息?有收獲嗎?”英特爾神經(jīng)形態(tài)研究主管Mike Davies告訴EE Times。
他繼續(xù)說:“這是我們研究計劃中的任務(wù),在我們試圖將技術(shù)迅速推向商業(yè)應用之前,我們正在采取一種有條不紊的,有條不紊的研究方法,在此我們首先要了解許多不同方向中的哪一個。就神經(jīng)科學的啟發(fā)而言,這實際上可以產(chǎn)生最令人信服的結(jié)果?!?/p>
深度學習比較
真的有可能在神經(jīng)形態(tài)芯片和其他計算硬件的結(jié)果之間進行有意義的比較嗎?通常會演示神經(jīng)形態(tài)硬件運行諸如尖峰神經(jīng)網(wǎng)絡(luò)之類的“外來”算法,這與深度學習中發(fā)現(xiàn)的算法類型非常不同。
戴維斯說:“關(guān)于神經(jīng)形態(tài)研究存在困惑,因為我們可以在像Loihi這樣的神經(jīng)形態(tài)芯片上運行的東西與這些深度學習模型的作用之間存在重疊。”“在多個方面,我們有多種方法可以從深度學習社區(qū)中提取學習內(nèi)容,并將其導入神經(jīng)形態(tài)世界。”
英特爾神經(jīng)形態(tài)研究社區(qū)(INRC)是一個由100多家使用英特爾Loihi硬件探索神經(jīng)形態(tài)計算的公司組成的社區(qū),作為這項工作的一部分,它能夠在Loihi上運行深度學習算法。算法可能是現(xiàn)有的以常規(guī)方式訓練的深度學習網(wǎng)絡(luò),然后轉(zhuǎn)換為Loihi可以使用的格式,因此可以對其進行基準測試。這是一種方法,但是實際上可以在Loihi上運行深度學習算法的其他幾種方法(下圖中的區(qū)域1)。
一種是使用反向傳播,它是使深度學習取得成功的一種算法技術(shù),因為它可以在訓練過程中對權(quán)重進行微調(diào)。經(jīng)常由神經(jīng)形態(tài)芯片(尖峰神經(jīng)網(wǎng)絡(luò))運行的網(wǎng)絡(luò)類型可以配制成數(shù)學上可微分的形式,允許應用反向傳播以優(yōu)化結(jié)果。
另一個選擇是嘗試在芯片上執(zhí)行反向傳播,這相當于當今(離線)訓練神經(jīng)網(wǎng)絡(luò)的方式,但是用于基于采集的數(shù)據(jù)在現(xiàn)場進行增量訓練。
神經(jīng)科學啟發(fā)的方法與機器學習之間的算法交叉。區(qū)域1代表深度學習。區(qū)域2是神經(jīng)形態(tài)算法,例如尖峰神經(jīng)網(wǎng)絡(luò)。區(qū)域3是目標-基于來自區(qū)域1和2的實驗方法的算法,這些算法已經(jīng)數(shù)學上形式化,因此可以應用于其他類型的問題。圖片:英特爾)
基準測試結(jié)果結(jié)果
英特爾在INRC成員發(fā)表的論文(以下)上繪制了性能(潛伏期和功耗)結(jié)果圖表,其中包括Loihi與CPU,GPU,Movidius神經(jīng)計算棒或IBM的Truemorph North Neuromorphic技術(shù)之間的量化比較。所有結(jié)果均適用于數(shù)據(jù)樣本一一到達(批大小為1)的應用,類似于實時生物系統(tǒng)。
Loihi系統(tǒng)與其他類型計算的實驗結(jié)果。標記的大小代表神經(jīng)網(wǎng)絡(luò)的相對大小(圖片來源:英特爾)
戴維斯說:“這些[數(shù)據(jù)點]中的每一個都需要大量的工作,這就是為什么迄今為止在神經(jīng)形態(tài)領(lǐng)域還沒有完成太多工作的原因?!薄耙@得這些測量值,找到正確的基線比較點并真正完成這項嚴格的工作非常困難。但是我們一直在敦促合作者做到這一點,因為擁有這樣的情節(jié)非常令人興奮?!?/p>
圖上每個點的大小代表網(wǎng)絡(luò)的大?。惠^大的標記使用更多的Loihi籌碼,最大的代表500多個籌碼)。將這些Loihi系統(tǒng)與單個計算子系統(tǒng)(單個CPU / GPU加上內(nèi)存)進行了比較。Davies說,要進行蘋果之間的比較并不容易,因為CPU可以添加DRAM來幫助擴展,而Loihi只能添加更多的Loihi芯片。
每個系統(tǒng)中是否可以有更多的計算芯片來改善CPU和GPU的性能?
戴維斯說:“對于這種規(guī)模的網(wǎng)絡(luò),這是不可能的?!薄鞍闯R?guī)標準,支配該圖的小數(shù)據(jù)點都是很小的網(wǎng)絡(luò)……總的來說,對于我們正在研究的問題類型,它們并不能很好地并行化。Loihi實現(xiàn)能夠很好??地擴展的原因是因為存在非常精細的規(guī)模并行性,并且神經(jīng)元之間的通信發(fā)生在微微秒的規(guī)模上,并且體系結(jié)構(gòu)能夠?qū)Υ诉M行處理。”
高度精細的并行通信是Loihi架構(gòu)的基礎(chǔ)。常規(guī)體系結(jié)構(gòu)將粗粒度的工作塊分開,以使工作負載并行化。對于深度學習,這通常是通過分批完成的。Davies說,這種技術(shù)在這里無濟于事,因為關(guān)鍵指標是處理單個數(shù)據(jù)樣本的延遲。
到目前為止獲得的結(jié)果的關(guān)鍵見解是,Loihi對于前饋網(wǎng)絡(luò)幾乎沒有提供性能優(yōu)勢,前饋網(wǎng)絡(luò)是一種廣泛用于主流深度學習的神經(jīng)網(wǎng)絡(luò),因為它們更容易在常規(guī)深度學習加速器硬件上進行訓練(見圖)下面)。
戴維斯說:“非常值得注意的是,數(shù)據(jù)點如此干凈地分離,前饋網(wǎng)絡(luò)提供的吸引力最小,在某些情況下,Loihi更糟。”
在Loihi系統(tǒng)上運行遞歸神經(jīng)網(wǎng)絡(luò)可獲得最大的收益,在該系統(tǒng)中,性能降低了1000到10,000倍,解決時間提高了100倍。
Loihi系統(tǒng)與其他類型的計算的實驗結(jié)果,突出顯示了哪些工作負載是前饋網(wǎng)絡(luò)。標記的大小代表神經(jīng)網(wǎng)絡(luò)的相對大?。▓D片來源:英特爾)
未來的基準測試
英特爾宣布打算將其用于此類工作的軟件開源,從而邁出了邁向神經(jīng)形態(tài)基準測試的第一步。將此代碼開源,將允許其他人在其神經(jīng)形態(tài)平臺上運行相同的工作負載,并降低進入神經(jīng)形態(tài)計算和INRC的障礙。
戴維斯說:“我們很高興能夠開始比較不同組的神經(jīng)形態(tài)芯片得到的結(jié)果?!薄暗菍ξ覀兌?,最初的工作重點是針對常規(guī)體系結(jié)構(gòu)進行基準測試,以了解我們應將什么放入神經(jīng)形態(tài)基準套件中,然后再用于推動神經(jīng)形態(tài)領(lǐng)域的進步?!?/p>
未來神經(jīng)形態(tài)基準測試的很大一部分是了解應包括哪些類型的算法。對于深度學習,候選人更為明顯– ResNet-50的使用如此廣泛,以至于它已成為事實上的基準。在神經(jīng)形態(tài)空間中沒有等效項,因為它更加分散,并且硬件更具算法特定性。
“我認為重要的是,我們要從這類新興的工作負載中建立實際的方法,正式的基準測試,在這些工作負載中,我們可以看到神經(jīng)形態(tài)硬件的好處,并在那里進行標準化。但是我認為這是下一步?!贝骶S斯說?!拔覀儺斎幌M谶@個方向上領(lǐng)導這一領(lǐng)域。為了使之成為可能,還需要進行進一步的融合,尤其是在軟件方面。”
通過這些結(jié)果,英特爾希望證明Loihi可以在一系列復雜的,困難的,以大腦為靈感的工作負載上提供巨大的性能提升,即使它尚不知道這些工作負載的外觀如何。
戴維斯說:“在英特爾,我們的目標比其他任何事情都重要,要確保這是各種各樣的工作負載。”“我們不打算制造用于約束滿足解決方案的點加速器,也不是機器人手臂操縱器。我們希望這是一種類似于CPU或GPU的新型計算機體系結(jié)構(gòu),但是如果優(yōu)化得當,它將固有地很好地運行各種大腦啟發(fā)的智能工作負載?!?br /> 編輯:hfy
-
英特爾
+關(guān)注
關(guān)注
61文章
10301瀏覽量
180463 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4838瀏覽量
107794 -
深度學習
+關(guān)注
關(guān)注
73文章
5599瀏覽量
124398 -
AI加速器
+關(guān)注
關(guān)注
1文章
73瀏覽量
9488
發(fā)布評論請先 登錄
脈沖神經(jīng)元模型的硬件實現(xiàn)
SNN加速器內(nèi)部神經(jīng)元數(shù)據(jù)連接方式
CICC2033神經(jīng)網(wǎng)絡(luò)部署相關(guān)操作
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+具身智能芯片
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+神經(jīng)形態(tài)計算、類腦芯片
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+化學或生物方法實現(xiàn)AI
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升算力還是智力
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學習AI芯片的創(chuàng)新方法與架構(gòu)
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內(nèi)容總覽
Andes晶心科技推出新一代深度學習加速器
Arm神經(jīng)技術(shù)是業(yè)界首創(chuàng)在 Arm GPU 上增添專用神經(jīng)加速器的技術(shù),移動設(shè)備上實現(xiàn)PC級別的AI圖形性能
【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》
革命性神經(jīng)形態(tài)微控制器 ?**Pulsar**? 的深度技術(shù)解讀
時識科技推出XyloAudio 3神經(jīng)形態(tài)開發(fā)套件
MAX78002帶有低功耗卷積神經(jīng)網(wǎng)絡(luò)加速器的人工智能微控制器技術(shù)手冊
神經(jīng)形態(tài)芯片作為AI加速器正式神經(jīng)形態(tài)基準鋪平道路
評論