91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是AI芯片“存儲(chǔ)墻”的解決方案?

SSDFans ? 來源:yxw ? 2019-06-18 15:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近剛剛看了唐杉博士的《AI芯片的“冷”與“熱”》,第一句就是“ 參加過去年硅谷的AI Hardware Summit的朋友,普遍反映這次在北京的會(huì)議沒有那么火了”。記得,自己在2016年威海參加中國體系結(jié)構(gòu)年會(huì)的時(shí)候,孫所也說了一句調(diào)侃的話:“現(xiàn)在的AI很火,大家都往那邊去,沒有人太關(guān)心體系結(jié)構(gòu)了,我要告訴那些追AI熱點(diǎn)的,它都死了三回了!” 的確,作為從小學(xué)馬列的中國人,我們最熟悉螺旋式上升的概念。對于計(jì)算和I/O來講,和中國經(jīng)濟(jì)調(diào)控一樣,都是“ 水多了加面,面多了加水”螺旋式上升。

Google在2017年發(fā)布了TPU V1之后,現(xiàn)在已經(jīng)有越來越多的AI startup的芯片出現(xiàn),大家基本上都是用標(biāo)準(zhǔn)的Resnet50,Googlenetv3 等網(wǎng)絡(luò)為benchmark, 一次一次地刷新性能和功耗比,個(gè)人覺得很有可能在一天,AI芯片的性能和功耗比在特定的imagenet的任務(wù)上超過人腦,現(xiàn)在AI在準(zhǔn)確率和性能上都超過了。對于AI的芯片來講,有一個(gè)指標(biāo)也是大家討論比較多的。Roofline model

Y軸是P,代表算力,用來FLOP/s來表示,現(xiàn)在新出的AI ASIC往往在FLOP/s并不發(fā)力,因?yàn)閺墓谋鹊慕嵌壬希懔隙ú皇窃礁咴胶?,而且大家都很難高過老黃的核彈。

代表了一個(gè)特定的計(jì)算平臺(tái)的peak performance,就是最大算力。

就是特定的計(jì)算平臺(tái)的I內(nèi)存/O帶寬,這個(gè)和該計(jì)算平臺(tái)使用的DDR類型有關(guān)。

X軸是I,代表計(jì)算強(qiáng)度,就是在一個(gè)Byte上的計(jì)算量。因?yàn)閷τ谝粋€(gè)特定的平臺(tái),我可以知道它的最大算力和帶寬,我們就可以知道它的最大的計(jì)算強(qiáng)度。

因此,和圖上顯示的一樣,在點(diǎn)(Imax,),這個(gè)計(jì)算平臺(tái)達(dá)到了完美。在它的左邊,說明memory受限,在它的右邊說明計(jì)算受限。

因?yàn)閷τ诿恳淮卧L存都是32位的Float Point,因此整個(gè)內(nèi)存的占用就是 260MB左右,而計(jì)算量是724MFLOPs,因此Alexnet的計(jì)算強(qiáng)度就是724/260=2.7 operation/byte。

對于一個(gè)特定的平臺(tái),比如老黃家的新的GTX2080Ti 系列來講:

對于計(jì)算性能,先不管老黃加各種Tensor Core,RTcore,從CUDA Core本身來講,他是100TLOP/s,

它的內(nèi)存帶寬如下:

因此,作為2080Ti, 它的Imax就是166Operation/Byte.

可能到這個(gè),就可以看出,對于Alex的2.7 來講,遠(yuǎn)遠(yuǎn)沒有達(dá)到2080ti的計(jì)算強(qiáng)度,主要是受限于內(nèi)存帶寬了。

在Google的TPU中,有一個(gè)圖經(jīng)常被大家引用。

大家基本上可以看到,google的Imax差不多在1000左右,基本上沒有什么網(wǎng)絡(luò)可以完全用滿TPU的peak performance。

怎么辦,內(nèi)存帶寬的解決方案就是HBM,HBM2, HBM3不斷加大帶寬。記得在2017年的CNCC上,謝源教授講,他在2010年左右提出了HBM的概念,他很快就看到了AMD,Nvidia以及Xilinx和Intel都在芯片上使用了HBM,證明了這條道路的正確性。他認(rèn)為目前應(yīng)該在AI芯片上擺脫這種”水多了加面,面多了加水“,in-memory 計(jì)算應(yīng)該是下一個(gè)方向。

這個(gè)就引出了在Memory+會(huì)議上來自平頭哥的段立德博士的topic,”Processing Near or In memory for deep learning".

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54054

    瀏覽量

    466837
  • 存儲(chǔ)
    +關(guān)注

    關(guān)注

    13

    文章

    4807

    瀏覽量

    90115
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40041

    瀏覽量

    301704
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    當(dāng) AI 遇上 ICY DOCK 硬盤盒:企業(yè) AI 基礎(chǔ)設(shè)施的存儲(chǔ)革新之道

    方案已逐漸力不從心。ICYDOCK,這個(gè)擁有30年存儲(chǔ)配件研發(fā)經(jīng)驗(yàn)的品牌,正以創(chuàng)新的設(shè)計(jì)和卓越的性能,助力AI時(shí)代的定制化高性能存儲(chǔ)解決方案
    的頭像 發(fā)表于 03-13 14:54 ?628次閱讀
    當(dāng) <b class='flag-5'>AI</b> 遇上 ICY DOCK 硬盤盒:企業(yè) <b class='flag-5'>AI</b> 基礎(chǔ)設(shè)施的<b class='flag-5'>存儲(chǔ)</b>革新之道

    慧榮科技于Embedded World 2026展示AI優(yōu)化的啟動(dòng)存儲(chǔ)與企業(yè)級(jí)解決方案

    的啟動(dòng)存儲(chǔ)(Boot Storage)解決方案。與會(huì)者可前往1號(hào)館385號(hào)展位,了解其面向工業(yè)、嵌入式、汽車及數(shù)據(jù)中心應(yīng)用的啟動(dòng)存儲(chǔ)和主控芯片解決方
    的頭像 發(fā)表于 03-11 14:09 ?109次閱讀
    慧榮科技于Embedded World 2026展示<b class='flag-5'>AI</b>優(yōu)化的啟動(dòng)<b class='flag-5'>存儲(chǔ)</b>與企業(yè)級(jí)<b class='flag-5'>解決方案</b>

    如何突破AI存儲(chǔ)?深度解析ONFI 6.0高速接口與Chiplet解耦架構(gòu)

    1. 行業(yè)核心痛點(diǎn):AI存儲(chǔ)”危機(jī)在大模型訓(xùn)練與推理場景中,算力演進(jìn)速度遠(yuǎn)超存儲(chǔ)帶寬,計(jì)算與存儲(chǔ)之間的性能鴻溝(
    發(fā)表于 01-29 17:32

    國內(nèi)分布式AI存儲(chǔ)方案商港股IPO!

    據(jù)港交所1月27日披露,北京星辰天合科技股份有限公司(簡稱“星辰天合”)向港交所主板遞交上市申請書。 ? 星辰天合專注于提供企業(yè)級(jí)AI存儲(chǔ)解決方案,助力企業(yè)大規(guī)模高效整合數(shù)據(jù)、決策及運(yùn)營。兩類主要
    的頭像 發(fā)表于 01-29 13:44 ?8642次閱讀
    國內(nèi)分布式<b class='flag-5'>AI</b><b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>方案</b>商港股IPO!

    推薦高性能存儲(chǔ)psram芯片

    智能穿戴、物聯(lián)網(wǎng)設(shè)備和端側(cè)AI應(yīng)用快速發(fā)展,PSRAM偽靜態(tài)隨機(jī)存儲(chǔ)器,正成為越來越多嵌入式系統(tǒng)的優(yōu)選方案,如何選擇一個(gè)高性能、小尺寸與低功耗的psram芯片是一個(gè)值得思考的問題。由E
    的頭像 發(fā)表于 11-18 17:24 ?524次閱讀

    VS680 HDMI AI分析解決方案 #目標(biāo)識(shí)別 #視頻翻譯 #AI #芯片

    AI
    深蕾半導(dǎo)體
    發(fā)布于 :2025年11月12日 10:29:33

    佰維存儲(chǔ)AI時(shí)代的存儲(chǔ)解決方案

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)在GMIF2025大會(huì)上,佰維存儲(chǔ)CEO何瀚表示,端側(cè)AI存儲(chǔ)的尺寸和功耗有著更為極致的要求。隨著在端側(cè)部署更大參數(shù)規(guī)模的AI模型成為趨勢,需要更大容量
    的頭像 發(fā)表于 09-30 08:40 ?1.2w次閱讀
    佰維<b class='flag-5'>存儲(chǔ)</b>:<b class='flag-5'>AI</b>時(shí)代的<b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>解決方案</b>

    AI 芯片浪潮下,職場晉升新契機(jī)?

    、新架構(gòu)不斷涌現(xiàn)。能夠在工作中提出創(chuàng)新性的解決方案,推動(dòng) AI 芯片性能、功耗、成本等關(guān)鍵指標(biāo)的優(yōu)化,將極大提升在職稱評審中的競爭力。例如,在芯片設(shè)計(jì)中引入新的計(jì)算范式,如存算一體技術(shù)
    發(fā)表于 08-19 08:58

    【書籍評測活動(dòng)NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    :科技探索與 AGI 愿景》。 這本新書針對大模型技術(shù)浪潮,詳細(xì)講解了AI芯片的主流技術(shù)、挑戰(zhàn)與創(chuàng)新解決方案,并介紹了下一代芯片工藝和顛覆性AI
    發(fā)表于 07-28 13:54

    佰維存儲(chǔ)亮相COMPUTEX 2025,全場景存儲(chǔ)方案賦能“AI +”未來生態(tài)

    近日,臺(tái)北國際電腦展(COMPUTEX 2025)以“AI NEXT”為主題啟幕,作為領(lǐng)先的存儲(chǔ)與內(nèi)存解決方案廠商,佰維存儲(chǔ)展示了其涵蓋消費(fèi)級(jí)、嵌入式
    的頭像 發(fā)表于 05-26 09:43 ?1227次閱讀
    佰維<b class='flag-5'>存儲(chǔ)</b>亮相COMPUTEX 2025,全場景<b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>方案</b>賦能“<b class='flag-5'>AI</b> +”未來生態(tài)

    華為加速AI時(shí)代數(shù)據(jù)存儲(chǔ)產(chǎn)業(yè)發(fā)展

    近日,在華為中國合作伙伴大會(huì)2025上,華為數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁周躍峰發(fā)表“共筑數(shù)智解決方案,共享數(shù)據(jù)存儲(chǔ)產(chǎn)業(yè)大發(fā)展”主題演講,深入探討如何加速AI行業(yè)化落地,并分享
    的頭像 發(fā)表于 04-01 15:35 ?1210次閱讀

    曙光存儲(chǔ)全新升級(jí)AI存儲(chǔ)方案

    近日,曙光存儲(chǔ)全新升級(jí)AI存儲(chǔ)方案,秉持“AI加速”理念,面向AI訓(xùn)練、
    的頭像 發(fā)表于 03-31 11:27 ?1376次閱讀

    STM32L431RCT6主芯片 搭配 SD NAND-動(dòng)態(tài)心電圖設(shè)備存儲(chǔ)解決方案

    貼片式SD卡存儲(chǔ)解決方案,通過硬件與軟件的深度協(xié)同,全面提升了動(dòng)態(tài)心電圖設(shè)備的性能。 1)大容量存儲(chǔ),滿足數(shù)據(jù)需求 MKDV08GCL-STPA存儲(chǔ)芯片提供了8Gb的
    發(fā)表于 03-27 10:56

    AI眼鏡定制_AI眼鏡_ai智能眼鏡主板PCBA方案

    AI智能眼鏡的硬件結(jié)構(gòu)主要包括攝像頭、電池、PCBA、存儲(chǔ)器以及芯片等。其中,芯片方案是決定眼鏡性能和成本的核心。目前主流的
    的頭像 發(fā)表于 03-19 20:11 ?1654次閱讀
    <b class='flag-5'>AI</b>眼鏡定制_<b class='flag-5'>AI</b>眼鏡_<b class='flag-5'>ai</b>智能眼鏡主板PCBA<b class='flag-5'>方案</b>