91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

聚焦 | 什么是AI芯片“存儲墻”的解決方案?

SSDFans ? 來源:YXQ ? 2019-06-18 15:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在2016年威海參加中國體系結構年會的時候,孫所也說了一句調侃的話:“現(xiàn)在的AI很火,大家都往那邊去,沒有人太關心體系結構了,我要告訴那些追AI熱點的,它都死了三回了!” 的確,作為從小學馬列的中國人,我們最熟悉螺旋式上升的概念。對于計算和I/O來講,和中國經濟調控一樣,都是“ 水多了加面,面多了加水”螺旋式上升。

Google在2017年發(fā)布了TPU V1之后,現(xiàn)在已經有越來越多的AI startup的芯片出現(xiàn),大家基本上都是用標準的Resnet50,Googlenetv3 等網(wǎng)絡為benchmark, 一次一次地刷新性能和功耗比,個人覺得很有可能在一天,AI芯片的性能和功耗比在特定的imagenet的任務上超過人腦,現(xiàn)在AI在準確率和性能上都超過了。對于AI的芯片來講,有一個指標也是大家討論比較多的。Roofline model

Y軸是P,代表算力,用來FLOP/s來表示,現(xiàn)在新出的AI ASIC往往在FLOP/s并不發(fā)力,因為從功耗比的角度上,算力肯定不是越高越好,而且大家都很難高過老黃的核彈。

代表了一個特定的計算平臺的peak performance,就是最大算力。

就是特定的計算平臺的I內存/O帶寬,這個和該計算平臺使用的DDR類型有關。

X軸是I,代表計算強度,就是在一個Byte上的計算量。因為對于一個特定的平臺,我可以知道它的最大算力和帶寬,我們就可以知道它的最大的計算強度。

因此,和圖上顯示的一樣,在點(Imax,),這個計算平臺達到了完美。在它的左邊,說明memory受限,在它的右邊說明計算受限。

因此,對于我們之前分析的Alexnet這個網(wǎng)絡,我們就知道了它的總的計算量就是:

內存訪問量 計算量
Conv1 770235 105415200
Maxpool1 430368
Conv2 1057632 223948800
Maxpool2 273152
Conv3 1057792 149520384
Conv4 1521792 112140288
Conv5 1036160 74760192
Maxpool3 61696
FC1 37766144 37748736
FC2 16789504 16777216
FC3 4102096 4096000
SUM 65021158 724406816

因為對于每一次訪存都是32位的Float Point,因此整個內存的占用就是 260MB左右,而計算量是724MFLOPs,因此Alexnet的計算強度就是724/260=2.7 operation/byte。

對于一個特定的平臺,比如老黃家的新的GTX2080Ti 系列來講:

對于計算性能,先不管老黃加各種Tensor Core,RTcore,從CUDA Core本身來講,他是100TLOP/s,

它的內存帶寬如下:

因此,作為2080Ti, 它的Imax就是166Operation/Byte.

可能到這個,就可以看出,對于Alex的2.7 來講,遠遠沒有達到2080ti的計算強度,主要是受限于內存帶寬了。

在Google的TPU中,有一個圖經常被大家引用。

大家基本上可以看到,google的Imax差不多在1000左右,基本上沒有什么網(wǎng)絡可以完全用滿TPU的peak performance。

怎么辦,內存帶寬的解決方案就是HBM,HBM2, HBM3不斷加大帶寬。記得在2017年的CNCC上,謝源教授講,他在2010年左右提出了HBM的概念,他很快就看到了AMD,Nvidia以及Xilinx和Intel都在芯片上使用了HBM,證明了這條道路的正確性。他認為目前應該在AI芯片上擺脫這種”水多了加面,面多了加水“,in-memory 計算應該是下一個方向。

這個就引出了在Memory+會議上來自平頭哥的段立德博士的topic,”Processing Near or In memory for deep learning".

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    463

    文章

    54053

    瀏覽量

    466811
  • AI
    AI
    +關注

    關注

    91

    文章

    40034

    瀏覽量

    301684

原文標題:什么是AI芯片“存儲墻”的解決方案?

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI 遇上 ICY DOCK 硬盤盒:企業(yè) AI 基礎設施的存儲革新之道

    方案已逐漸力不從心。ICYDOCK,這個擁有30年存儲配件研發(fā)經驗的品牌,正以創(chuàng)新的設計和卓越的性能,助力AI時代的定制化高性能存儲解決方案
    的頭像 發(fā)表于 03-13 14:54 ?618次閱讀
    當 <b class='flag-5'>AI</b> 遇上 ICY DOCK 硬盤盒:企業(yè) <b class='flag-5'>AI</b> 基礎設施的<b class='flag-5'>存儲</b>革新之道

    慧榮科技于Embedded World 2026展示AI優(yōu)化的啟動存儲與企業(yè)級解決方案

    的啟動存儲(Boot Storage)解決方案。與會者可前往1號館385號展位,了解其面向工業(yè)、嵌入式、汽車及數(shù)據(jù)中心應用的啟動存儲和主控芯片解決方
    的頭像 發(fā)表于 03-11 14:09 ?93次閱讀
    慧榮科技于Embedded World 2026展示<b class='flag-5'>AI</b>優(yōu)化的啟動<b class='flag-5'>存儲</b>與企業(yè)級<b class='flag-5'>解決方案</b>

    如何突破AI存儲?深度解析ONFI 6.0高速接口與Chiplet解耦架構

    1. 行業(yè)核心痛點:AI存儲”危機在大模型訓練與推理場景中,算力演進速度遠超存儲帶寬,計算與存儲之間的性能鴻溝(
    發(fā)表于 01-29 17:32

    國內分布式AI存儲方案商港股IPO!

    據(jù)港交所1月27日披露,北京星辰天合科技股份有限公司(簡稱“星辰天合”)向港交所主板遞交上市申請書。 ? 星辰天合專注于提供企業(yè)級AI存儲解決方案,助力企業(yè)大規(guī)模高效整合數(shù)據(jù)、決策及運營。兩類主要
    的頭像 發(fā)表于 01-29 13:44 ?8641次閱讀
    國內分布式<b class='flag-5'>AI</b><b class='flag-5'>存儲</b><b class='flag-5'>方案</b>商港股IPO!

    推薦高性能存儲psram芯片

    智能穿戴、物聯(lián)網(wǎng)設備和端側AI應用快速發(fā)展,PSRAM偽靜態(tài)隨機存儲器,正成為越來越多嵌入式系統(tǒng)的優(yōu)選方案,如何選擇一個高性能、小尺寸與低功耗的psram芯片是一個值得思考的問題。由E
    的頭像 發(fā)表于 11-18 17:24 ?520次閱讀

    VS680 HDMI AI分析解決方案 #目標識別 #視頻翻譯 #AI #芯片

    AI
    深蕾半導體
    發(fā)布于 :2025年11月12日 10:29:33

    佰維存儲AI時代的存儲解決方案

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)在GMIF2025大會上,佰維存儲CEO何瀚表示,端側AI存儲的尺寸和功耗有著更為極致的要求。隨著在端側部署更大參數(shù)規(guī)模的AI模型成為趨勢,需要更大容量
    的頭像 發(fā)表于 09-30 08:40 ?1.2w次閱讀
    佰維<b class='flag-5'>存儲</b>:<b class='flag-5'>AI</b>時代的<b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>

    聚焦AI挑戰(zhàn)!MPS、安謀科技、Imagination及長江存儲分享創(chuàng)新解決方案

    計算需求、能效優(yōu)化及技術快速迭代成為行業(yè)面臨的主要挑戰(zhàn)。在會上,MPS、安謀科技、Imagination Technologies以及長江存儲等企業(yè)從不同角度分享了他們的創(chuàng)新解決方案。 ? MPS:高密度電源模塊,AI算力的隱形
    的頭像 發(fā)表于 08-26 21:39 ?5440次閱讀
    <b class='flag-5'>聚焦</b><b class='flag-5'>AI</b>挑戰(zhàn)!MPS、安謀科技、Imagination及長江<b class='flag-5'>存儲</b>分享創(chuàng)新<b class='flag-5'>解決方案</b>

    AI 芯片浪潮下,職場晉升新契機?

    、新架構不斷涌現(xiàn)。能夠在工作中提出創(chuàng)新性的解決方案,推動 AI 芯片性能、功耗、成本等關鍵指標的優(yōu)化,將極大提升在職稱評審中的競爭力。例如,在芯片設計中引入新的計算范式,如存算一體技術
    發(fā)表于 08-19 08:58

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    :科技探索與 AGI 愿景》。 這本新書針對大模型技術浪潮,詳細講解了AI芯片的主流技術、挑戰(zhàn)與創(chuàng)新解決方案,并介紹了下一代芯片工藝和顛覆性AI
    發(fā)表于 07-28 13:54

    佰維存儲亮相COMPUTEX 2025,全場景存儲方案賦能“AI +”未來生態(tài)

    近日,臺北國際電腦展(COMPUTEX 2025)以“AI NEXT”為主題啟幕,作為領先的存儲與內存解決方案廠商,佰維存儲展示了其涵蓋消費級、嵌入式
    的頭像 發(fā)表于 05-26 09:43 ?1227次閱讀
    佰維<b class='flag-5'>存儲</b>亮相COMPUTEX 2025,全場景<b class='flag-5'>存儲</b><b class='flag-5'>方案</b>賦能“<b class='flag-5'>AI</b> +”未來生態(tài)

    華為加速AI時代數(shù)據(jù)存儲產業(yè)發(fā)展

    近日,在華為中國合作伙伴大會2025上,華為數(shù)據(jù)存儲產品線總裁周躍峰發(fā)表“共筑數(shù)智解決方案,共享數(shù)據(jù)存儲產業(yè)大發(fā)展”主題演講,深入探討如何加速AI行業(yè)化落地,并分享
    的頭像 發(fā)表于 04-01 15:35 ?1210次閱讀

    曙光存儲全新升級AI存儲方案

    近日,曙光存儲全新升級AI存儲方案,秉持“AI加速”理念,面向AI訓練、
    的頭像 發(fā)表于 03-31 11:27 ?1372次閱讀

    STM32L431RCT6主芯片 搭配 SD NAND-動態(tài)心電圖設備存儲解決方案

    貼片式SD卡存儲解決方案,通過硬件與軟件的深度協(xié)同,全面提升了動態(tài)心電圖設備的性能。 1)大容量存儲,滿足數(shù)據(jù)需求 MKDV08GCL-STPA存儲芯片提供了8Gb的
    發(fā)表于 03-27 10:56

    AI眼鏡定制_AI眼鏡_ai智能眼鏡主板PCBA方案

    AI智能眼鏡的硬件結構主要包括攝像頭、電池、PCBA、存儲器以及芯片等。其中,芯片方案是決定眼鏡性能和成本的核心。目前主流的
    的頭像 發(fā)表于 03-19 20:11 ?1653次閱讀
    <b class='flag-5'>AI</b>眼鏡定制_<b class='flag-5'>AI</b>眼鏡_<b class='flag-5'>ai</b>智能眼鏡主板PCBA<b class='flag-5'>方案</b>