91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI芯片領(lǐng)域好戲才剛開始

電子工程師 ? 來源:工程師曾玲 ? 2019-05-02 14:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

新型架構(gòu)能夠挖掘深度學(xué)習(xí)的巨大潛力。然而,到目前為止,只有一款AI芯片是完全符合描述和基準(zhǔn)測試的,它就是谷歌的TPU。即便如此,這一領(lǐng)域仍然正在蓬勃發(fā)展,相關(guān)的技術(shù)也開始逐漸明朗,比如模擬計算、新興內(nèi)存和封裝技術(shù)、以及一系列專門用于處理神經(jīng)網(wǎng)絡(luò)的技術(shù)等等。

對此,比利時魯汶大學(xué)Marian Verhelst教授表示:“這個領(lǐng)域涉及范圍很廣,包括每個層面的研究?!盫erhelst教授專門研究探索二元精密格式的芯片。她說,模擬計算很有用,特別是3到8位格式的模擬計算。

NVIDIA首席科學(xué)家、資深處理器研究員Bill Dally表示:“NVIDIA有多個和深度學(xué)習(xí)模擬計算相關(guān)的研究項目,但是到目前為止,還沒有一個項目可以轉(zhuǎn)化為產(chǎn)品?!彼a充說,有一些項目是需要數(shù)學(xué)神經(jīng)網(wǎng)絡(luò)的,生成的結(jié)果并不適合用于進(jìn)行模擬。

“過去那些被否定了的CPU新想法都被重新拿出來進(jìn)行探索,例如模擬計算、內(nèi)存處理器、晶圓級集成,”資深計算機(jī)研究員David Patterson這樣表示,他現(xiàn)在在谷歌工作?!拔移炔患按叵肟纯催@些激進(jìn)的想法是否奏效?!?/p>

“兩三年前,每個優(yōu)秀的計算機(jī)架構(gòu)師都會說——'我可以做到100倍速’。正因如此,我們看到大量解決方案已經(jīng)出現(xiàn),并且提供了各種功能上的改進(jìn),不斷逼近當(dāng)前技術(shù)的極限。” Chris Rowen表示,他曾經(jīng)是MIPS和Tensilica公司的聯(lián)合創(chuàng)始人,現(xiàn)在又創(chuàng)建了一家人工智能軟件公司BabbleLabs。

AI基準(zhǔn)測試遭遇初創(chuàng)公司冷落

處理器設(shè)計的復(fù)興給人們帶來的一大挫折就是漫長的等待。

去年5月,百度和谷歌公布了MLPerf基準(zhǔn),以一種公平的方式來衡量“幾十家”初創(chuàng)公司開發(fā)的芯片。該項目負(fù)責(zé)人Patterson表示:“結(jié)果有點令人失望,沒有一家初創(chuàng)公司提交第一個迭代的結(jié)果?!?/p>

“也許他們有戰(zhàn)略方面的考慮。但又不禁讓人懷疑,他們是不是在開發(fā)芯片的過程中遇到了問題,還是芯片性能沒有達(dá)到他們的預(yù)期,又或者是他們的軟件不夠成熟,無法很好地運行這些基準(zhǔn)測試?”

這個訓(xùn)練基準(zhǔn)測試采用了ResNet-50,第一個測試結(jié)果顯示,谷歌TPUv3在從8個芯片擴(kuò)展到256個芯片的過程中,性能擴(kuò)展幾乎可以達(dá)到100%,相比之下,NVIDIA Volta在從8個芯片擴(kuò)展到640個芯片的過程中,性能擴(kuò)展了大約27%。

Patterson解釋說,TPU之所以占據(jù)優(yōu)勢,是因為它可以作為多處理器在自己的網(wǎng)絡(luò)上運行。相比之下,NVIDIA Volta則是運行在x86集群上的。

Patterson希望未來MLPerf之于AI加速器就像Spec之于CPU。第二批訓(xùn)練結(jié)果預(yù)計將在今年晚些時候公布。針對數(shù)據(jù)中心和邊緣推理工作的MLPerf基準(zhǔn)測試也將在今年首次亮相。

與此同時,也有研究人員警告稱,AI芯片行業(yè)過于關(guān)注峰值性能?!拔覀冋J(rèn)為峰值性能沒有什么用,因為峰值性能沒有考慮到效率上的差異,”帝國理工學(xué)院Erwei Wang博士這樣表示,最近他和同事共同撰寫了一份關(guān)于人工智能加速器的研究報告。他指出,“人們應(yīng)該公布的是標(biāo)準(zhǔn)數(shù)據(jù)集和基準(zhǔn)測試的持續(xù)性能結(jié)果,以便更好地對比不同的架構(gòu)?!毕聢D為MLPerf在12月發(fā)布的初步結(jié)果采樣。

AI芯片領(lǐng)域好戲才剛開始

分析師:格局尚不明朗

有分析師抱怨說,包括Graphcore和Wave Computing等在內(nèi)的知名初創(chuàng)公司到目前為止都沒能提供性能數(shù)據(jù)。唯一的例外是Habana Labs。

The Linley Group分析師Linley Gwennap表示,該初創(chuàng)公司“似乎有一些真實的數(shù)據(jù),在白皮書中詳細(xì)說明其性能是NVIDIAGPU的3到5倍......但他們最初關(guān)注的是推理任務(wù),而非訓(xùn)練?!?/p>

對此,Moor Insights&Strategy分析師Karl Freund也指出,目前來自初創(chuàng)公司的性能數(shù)據(jù)確實“少得可憐”。

其中,Habana只是在采樣階段,Wave宣稱已有客戶采用,Graphcore表示會在4月之前出貨芯片產(chǎn)品,Groq可能會在4月北京舉行的一個活動上第一次亮相,其他初創(chuàng)公司則可能會于9月在舊金山舉行的一次活動上發(fā)布產(chǎn)品。

有幾家中國初創(chuàng)公司——例如Cambricon和Horizon Robotics,讓我們看到了一些希望,這些公司先于美國的同類企業(yè)進(jìn)入市場,專注于人工智能推理領(lǐng)域。

Freund表示:“由于目前在推理領(lǐng)域還沒有巨頭出現(xiàn),所以會掀起一股淘金熱,但我不知道是否有初創(chuàng)公司能夠在訓(xùn)練領(lǐng)域向NVIDIA GPU發(fā)起挑戰(zhàn),因為只是在一個產(chǎn)品周期內(nèi)你無法扭轉(zhuǎn)競爭形勢,企業(yè)需要可持續(xù)的領(lǐng)先地位。”

他說:“唯一一個真正在訓(xùn)練領(lǐng)域站穩(wěn)腳跟的是英特爾,英特爾已經(jīng)推出了Nervana芯片,他們正在等待合適的時機(jī),因為如果只是有一堆MAC和降低了的精度,立刻會被NVIDIA秒殺。他們需要解決內(nèi)存帶寬和擴(kuò)展問題。”

在這場競賽中,英特爾可以說是多管齊下。英特爾的一位AI軟件經(jīng)理表示,與他工作關(guān)系最緊密的,就是至強(qiáng)處理器和前蘋果及AMD GPU大師Raja Koduri設(shè)計的新GPU。

英特爾最新的Cascade Lake至強(qiáng)處理器中增添了很多新功能,用以加速人工智能。我們預(yù)計,英特爾將不再需要GPU或加速器,但也不會放棄與GPU和加速器在性能或效率方面的競爭。

而對于NVIDIA來說,他們正在將最新的12納米處理器封裝到各種工作站、服務(wù)器和機(jī)架系統(tǒng)中。有人說,NVIDIA在AI訓(xùn)練方面遙遙領(lǐng)先,甚至可以把7納米產(chǎn)品保留到2020年之后再推出。

除了,NVIDIA之外,許多大廠商也都在基于專有的互連技術(shù)、封裝技術(shù)、編程工具和其他技術(shù)構(gòu)建競爭生態(tài)系統(tǒng)。其中,英特爾涉及的技術(shù)領(lǐng)域最廣泛,包括專有的處理器互連、針對Optane DIMM的內(nèi)存協(xié)議、網(wǎng)絡(luò)框架、以及新興的EMIB和Foveros芯片封裝

AMD、Arm、IBM和Xilinx則圍繞CCIX(用于極速器的一種緩存一致性互連技術(shù))和GenZ(一種內(nèi)存鏈接技術(shù))進(jìn)行聯(lián)手。最近,英特爾還發(fā)布了一種針對加速器和內(nèi)存的更開放的處理器互連技術(shù)——CXL,但到目前為止,CXL仍然缺少對CCIX和GenZ的第三方支持。下圖為AI芯片初創(chuàng)公司列表。

AI芯片領(lǐng)域好戲才剛開始

數(shù)據(jù)中心試水DIY芯片

當(dāng)初創(chuàng)公司爭相在服務(wù)器系統(tǒng)中為自己的芯片占據(jù)一席之地的時候,一些企業(yè)卻在部署他們自己研發(fā)的加速器。

比如:谷歌已經(jīng)在使用第三代TPU,該版本采用了液體冷卻技術(shù),運行平穩(wěn);百度去年也宣布推出了自己的首款芯片;亞馬遜表示將在今年晚些時候推出首款芯片;Facebook正在組建一支半導(dǎo)體團(tuán)隊;阿里巴巴則在去年收購了一家處理器專業(yè)公司。

大多數(shù)廠商對其芯片的架構(gòu)和性能都非??量?。百度表示,將發(fā)布針對訓(xùn)練和推理任務(wù)的不同版本14納米“昆侖”芯片,可以提供260 TOPS性能,功耗為100 W,其中封裝了數(shù)千個核心,總內(nèi)存帶寬為512 GB/s。亞馬遜方面表示,Inferentia將實現(xiàn)數(shù)百TOPS的推理吞吐量,多個芯片聚合在一起可以實現(xiàn)數(shù)千TOPS性能。

“很多初創(chuàng)公司都是以面向超大規(guī)模數(shù)據(jù)中心售賣芯片為目標(biāo)開展業(yè)務(wù)的,而現(xiàn)在,這可能行不通了,”二級公有云服務(wù)商Packet公司首席執(zhí)行官Zac Smith這樣表示。

我們可能永遠(yuǎn)也看不到云計算巨頭設(shè)計芯片的拆解細(xì)節(jié),但是有一些公開信息描述了很多嵌入塊的情況。Linley Group分析師Mike Demler表示,這些嵌入塊展現(xiàn)了從改進(jìn)后的DSP和GPU模塊,到使用乘法累加數(shù)組,再到數(shù)據(jù)流體系結(jié)構(gòu)的演變,這種架構(gòu)將生成的信息從神經(jīng)網(wǎng)絡(luò)的一個層面?zhèn)鬟f到另一個層面。

三星最新公布的Samsung Exynos中的AI模塊一樣,很多芯片都轉(zhuǎn)向重度使用網(wǎng)絡(luò)修剪和量化技術(shù),運行8位和16位操作以優(yōu)化效率和網(wǎng)絡(luò)稀疏性。

對網(wǎng)絡(luò)進(jìn)行修剪將變得越來越重要。卷積神經(jīng)網(wǎng)絡(luò)(CNN)之父Yann LeCun表示,神經(jīng)網(wǎng)絡(luò)模型只會越變越大,這就要求性能越來越高。不過他指出,神經(jīng)網(wǎng)絡(luò)模型可以被極大程度上進(jìn)行修剪,特別是考慮到人類大腦最大限度上只被激活了2%。

他在最近一篇針對芯片設(shè)計人員的論文中,呼吁開發(fā)能夠處理極其稀疏網(wǎng)絡(luò)的芯片?!霸诖蠖鄶?shù)情況下,芯片單元都是處于關(guān)閉狀態(tài)的,事件驅(qū)動型的硬件具有一定的優(yōu)勢,如此一來,只有激活的單元才會消耗資源。”他這樣寫道。

“遞歸神經(jīng)網(wǎng)絡(luò)是最稀疏的,因此,使用細(xì)粒度修剪也是最有效的。有50%-90%的修剪都是針對CNN的,但是芯片設(shè)計人員要面對支持細(xì)粒度修剪不規(guī)則性和靈活性方面的挑戰(zhàn)?!钡蹏砉W(xué)院研究員Erwei Wang這樣表示。

減少權(quán)重數(shù)量和降低精度有助于減少內(nèi)存需求。Wang說,英特爾的至強(qiáng)芯片和其他很多芯片已經(jīng)在使用8位整數(shù)數(shù)據(jù)執(zhí)行推理任務(wù),而FPGA嵌入式芯片正在向4位甚至二進(jìn)制精度發(fā)展。

這么做是為了讓處理操作盡可能靠近內(nèi)存所在位置,避免片外訪問。理想情況下,這意味著能夠在寄存器內(nèi)部或者至少是在緩存內(nèi)部進(jìn)行計算。

LeCun甚至在他的論文中設(shè)想了一種將內(nèi)存和處理單元結(jié)合起來的可編程寄存器。

“為了讓深度學(xué)習(xí)系統(tǒng)具備推理能力,深度學(xué)習(xí)系統(tǒng)需要一種短期內(nèi)存作為情景內(nèi)存......這樣的內(nèi)存會變得非常普及,而且非常龐大,亟需硬件方面的支持。”他這樣寫道。下圖為根據(jù)研究員Erwei Wang及其同事最近對可編程架構(gòu)的研究調(diào)查現(xiàn)實,性能差異是很大的。

MAC單元之外所需的靈活性

如果必須遠(yuǎn)離芯片,那就把大量請求批量處理成幾個較大的請求,這已經(jīng)是一種很流行的技術(shù)。Patterson注意到谷歌最近發(fā)表了一篇論文,對于批量操作最理想大小的討論帶來了一些啟發(fā)。

Patterson表示:“如果你小心操作的話,會在某個區(qū)域內(nèi)得到最理想的加速,然后當(dāng)你增加批量處理規(guī)模的時候,就會發(fā)現(xiàn)收益出現(xiàn)遞減,然后在很多模型中都表現(xiàn)平平?!?/p>

LeCun在論文中警告說:“我們需要新的硬件架構(gòu),這些架構(gòu)在批量處理大小為1的時候可以高效運行。這意味著我們完全不需要依賴于矩陣產(chǎn)品作為最低層級的操作工具?!边@一理論無疑是對目前芯片核心的多架構(gòu)單元的某種終結(jié)。

鑒于現(xiàn)在還是深度學(xué)習(xí)的早期發(fā)展階段,最重要的指導(dǎo)方針是保持靈活性,以及在可編程性和性能之間尋求平衡。

“我們吸取到的教訓(xùn)是,神經(jīng)網(wǎng)絡(luò)是持續(xù)演化的,你無法對神經(jīng)網(wǎng)絡(luò)的維度做出假設(shè),但又希望在各個方面都能保持高效。”負(fù)責(zé)開發(fā)Eyeriss芯片的Vivienne Sze這樣表示。

Wang說,在深度學(xué)習(xí)發(fā)展演化的過程中,F(xiàn)PGA將發(fā)揮重要的作用,這就要求硬件具備靈活性。他看好Xilinx的Versal ACAP,這是一種FPGA與硬件的混合體。

Wang提出的LUTNet研究探索了如何在無需維護(hù)索引的前提下定制查找表,以作為處理細(xì)粒度修剪的推理核心。他表示,這將讓推理任務(wù)所需的芯片減少一半。

這可以說是一個新穎的想法,很多企業(yè)已經(jīng)在這方面進(jìn)行實踐。例如,東芝最近推出了一種ADAS加速器,其94.5平方毫米的芯片中封裝了4個Cortex-A53核心,2個Cortex-R4、4個DSP、8個專用加速器模塊。

總的來說,對于AI芯片領(lǐng)域,我們還有非常大的想象空間,可以說,好戲才剛剛開始。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11287

    瀏覽量

    225166
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107875
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39940

    瀏覽量

    301568
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    “智匯瀟湘 聚湖南”走進(jìn)武大,拓維信息引再出發(fā)!

    江城秋水闊,珞珈風(fēng)華濃。10月25日,拓維信息攜手TalkwebHouse科創(chuàng)孵化平臺,隨“智匯瀟湘聚湖南”系列行動走進(jìn)武漢大學(xué),以“AI×鴻蒙”創(chuàng)新生態(tài)和“就業(yè)+創(chuàng)業(yè)”雙通道模式招
    的頭像 發(fā)表于 10-27 19:00 ?431次閱讀
    “智匯瀟湘 <b class='flag-5'>才</b>聚湖南”走進(jìn)武大,拓維信息引<b class='flag-5'>才</b>再出發(fā)!

    鋇錸技術(shù)預(yù)測:未來工業(yè)AI發(fā)展的七大趨勢

    在過去的十年中,人工智能(AI)已經(jīng)深刻改變了人類社會的方方面面——從語音助手、圖像識別,到自動駕駛與大模型生成。但在工業(yè)領(lǐng)域AI 的浪潮剛開
    的頭像 發(fā)表于 10-23 11:56 ?285次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    AI大家都很了解了吧;AGI是什么呢? AGI:通用人工智能,可以再各個應(yīng)用領(lǐng)域都具備AI的處理能力。 AGI可以組成能夠24小時連續(xù)工作的優(yōu)秀員工隊伍,他們擁有比人類更強(qiáng)的能力和領(lǐng)導(dǎo)力,能夠
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用

    流體芯片AI計算平臺 ⑥基于AI的自主決策系統(tǒng) ⑦基于AI的自主學(xué)習(xí)系統(tǒng) 2、面臨的挑戰(zhàn) ①需要造就一個跨學(xué)科、全面性覆蓋的知識庫和科學(xué)基礎(chǔ)模型 ②需要解決信息不準(zhǔn)確和認(rèn)知偏差問題
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+化學(xué)或生物方法實現(xiàn)AI

    順序排列并存儲在毛細(xì)血管內(nèi)。 電石存儲器: 3、化學(xué)計算的總體現(xiàn)狀與前景 二、生物計算 1、用活細(xì)胞實現(xiàn)AI 作者第七章才會介紹類腦芯片,到時候我們再一起欣賞吧。 這里只是先給我們打了個基礎(chǔ)概念。 1
    發(fā)表于 09-15 17:29

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+半導(dǎo)體芯片產(chǎn)業(yè)的前沿技術(shù)

    為我們重點介紹了AI芯片在封裝、工藝、材料等領(lǐng)域的技術(shù)創(chuàng)新。 一、摩爾定律 摩爾定律是計算機(jī)科學(xué)和電子工程領(lǐng)域的一條經(jīng)驗規(guī)律,指出集成電路上可容納的晶體管數(shù)量每18-24個月會增加一倍
    發(fā)表于 09-15 14:50

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升算力還是智力

    持續(xù)發(fā)展體現(xiàn)在: 1、收益遞減 大模型的基礎(chǔ)的需要極大的算力,這首先源于昂貴的高性能AI芯片,然后是寶貴的電力、水等與環(huán)境相關(guān)的資源。 收益遞減體現(xiàn)在: ①模型大小 ②訓(xùn)練數(shù)據(jù)量 ③訓(xùn)練算法的優(yōu)化 2
    發(fā)表于 09-14 14:04

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    當(dāng)今社會,AI已經(jīng)發(fā)展很迅速了,但是你了解AI的發(fā)展歷程嗎?本章作者將為我們打開AI的發(fā)展歷程以及需求和挑戰(zhàn)的面紗。 從2017年開始生成式AI
    發(fā)表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    保持停滯的情況下,依照目前計算機(jī)的能耗效率,至少還需要30年的努力接近其水準(zhǔn),見圖1所示。 圖1 大腦與計算機(jī)的能量效率對比 圖2 類腦芯片的前瞻性研究領(lǐng)域AI濕件 為此,一些想
    發(fā)表于 09-06 19:12

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內(nèi)容總覽

    AI芯片:科技探索與AGI愿景》這本書是張臣雄所著,由人民郵電出版社出版,它與《AI芯片:前沿技術(shù)與創(chuàng)新未來》一書是姊妹篇,由此可見作者在AI
    發(fā)表于 09-05 15:10

    AI 芯片浪潮下,職場晉升新契機(jī)?

    職場、渴望在專業(yè)領(lǐng)域更進(jìn)一步的人來說,AI 芯片與職稱評審之間,實則有著千絲萬縷的聯(lián)系,為職業(yè)晉升開辟了新的路徑。 AI 芯片
    發(fā)表于 08-19 08:58

    【免費送書】AI芯片,從過去走向未來:《AI芯片:前沿技術(shù)與創(chuàng)新未來》

    步伐、介紹新興領(lǐng)域和最新動向?!⒓刺D(zhuǎn)參與活動↓↓↓【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿
    的頭像 發(fā)表于 07-29 08:06 ?1171次閱讀
    【免費送書】<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>,從過去走向未來:《<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>:前沿技術(shù)與創(chuàng)新未來》

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    DeepSeek,大模型應(yīng)用密集出現(xiàn)、頻繁升級,這讓作者意識到有必要撰寫一本新的AI芯片圖書,以緊跟時代步伐、介紹新興領(lǐng)域和最新動向。 這就是《AI
    發(fā)表于 07-28 13:54

    **【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合**

    【技術(shù)干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合 近期收到不少伙伴咨詢nRF54系列芯片的應(yīng)用與技術(shù)細(xì)節(jié),今天我們整理幾個核心問題與解答,帶你快速掌握如何在nRF54上部署
    發(fā)表于 04-01 00:00