91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

存內(nèi)計(jì)算對(duì)“存”的選擇

lPCU_elecfans ? 來(lái)源:未知 ? 2022-12-13 07:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))無(wú)論是前段時(shí)間爆火的繪圖模型Stable Diffusion,還是大規(guī)模語(yǔ)言模型ChatGPT,AI無(wú)疑已經(jīng)成了新時(shí)代的自動(dòng)化工具,哪怕是在某些與認(rèn)知相關(guān)的任務(wù)上,也能通過(guò)深度學(xué)習(xí)實(shí)現(xiàn)高于人類(lèi)的精度。
但正因我們提過(guò)多次的算力問(wèn)題,對(duì)于大型AI訓(xùn)練的計(jì)算要求已經(jīng)在每?jī)蓚€(gè)月翻倍了,別說(shuō)可持續(xù)能源供應(yīng)了,就連硬件的可持續(xù)都有些陷入停滯了。其實(shí)以目前各種模型的迭代速度來(lái)看,更高的運(yùn)算效率才是重中之重,畢竟這些模型并不需要每?jī)蓚€(gè)月就推陳出新。

深度學(xué)習(xí)還有哪些環(huán)節(jié)可以提升效率

我們先從深度學(xué)習(xí)運(yùn)算來(lái)看哪些算數(shù)運(yùn)算占比最高,根據(jù)IBM給出的統(tǒng)計(jì)數(shù)據(jù),無(wú)論是語(yǔ)音識(shí)別的RNN、語(yǔ)言模型DNN和視覺(jué)模型CNN,矩陣向量乘法都占據(jù)了運(yùn)算總數(shù)的70%到90%,所以打造一個(gè)矩陣矢量乘法加速器,是多數(shù)AI加速器的思路。

數(shù)據(jù)傳輸和運(yùn)算的功耗對(duì)比 / ISSCC
要考慮效率,我們就不能不談到功耗的問(wèn)題,如果只顧算力而不考慮功耗,任由龐大規(guī)模的GPU等硬件消耗能量不顧碳排放的話(huà),也不符合全球當(dāng)下的節(jié)能減排趨勢(shì)。而在深度學(xué)習(xí)中,各種精度的加法乘法都會(huì)消耗能量,但這些運(yùn)算消耗的能量與傳統(tǒng)馮諾依曼結(jié)構(gòu)中數(shù)據(jù)移動(dòng)消耗的能量相比,就顯得微不足道了,尤其是從DRAM中讀寫(xiě)高精度數(shù)值時(shí),能耗差距甚至可以達(dá)到數(shù)十倍以上。
這還只是在數(shù)據(jù)中心場(chǎng)景中,如果我們放到邊緣來(lái)看,如今的移動(dòng)設(shè)備需要語(yǔ)音識(shí)別、圖像識(shí)別之類(lèi)的各種深度學(xué)習(xí)應(yīng)用。所以提升這類(lèi)設(shè)備的效率,才有可能在功耗和內(nèi)存都有所限制的嵌入式應(yīng)用中普及深度學(xué)習(xí)。

存內(nèi)計(jì)算的存儲(chǔ)選擇

為了減少數(shù)據(jù)移動(dòng)消耗的能量,提高M(jìn)VM的計(jì)算性能,存內(nèi)計(jì)算成了一個(gè)不錯(cuò)的選擇。存內(nèi)計(jì)算(IMC)是一項(xiàng)創(chuàng)新的計(jì)算方式,將特定的計(jì)算任務(wù)放到存儲(chǔ)設(shè)備中,并使用模擬或混合信號(hào)的計(jì)算技術(shù)。相較馮諾依曼結(jié)構(gòu)或近存計(jì)算來(lái)說(shuō),最大程度地減少了數(shù)據(jù)移動(dòng)。
而早期利用IMC進(jìn)行神經(jīng)網(wǎng)絡(luò)推理的測(cè)試結(jié)果證明,在軟硬件結(jié)合的情況下,可以得到優(yōu)秀的精度結(jié)果,而DAC、ADC、功能激活之類(lèi)的數(shù)字操作則是通過(guò)片外的軟件或硬件來(lái)實(shí)現(xiàn)的。自那之后,各種使用SRAM、NOR Flash、RRAM、PCM和MRAM的單核或多核存內(nèi)計(jì)算芯片紛紛面世。
在對(duì)于正確存儲(chǔ)類(lèi)型的選擇上,存內(nèi)計(jì)算必須面臨取舍的問(wèn)題,比如性能、密度、寫(xiě)入時(shí)間、寫(xiě)入功耗、穩(wěn)定性以及制造工藝上。性能自然就是直接影響到我們說(shuō)的TOPS算力以及效率,目前SRAM優(yōu)勢(shì)較大,密度則決定了裸片大小,同時(shí)也影響到了成本。
而在邊緣場(chǎng)景下,環(huán)境一致性往往不比數(shù)據(jù)中心,所以如果不能保證穩(wěn)定性的話(huà),就會(huì)影響到存內(nèi)計(jì)算進(jìn)行深度學(xué)習(xí)的精度。最后的制造工藝不僅決定了這類(lèi)存內(nèi)計(jì)算芯片能否量產(chǎn),是否存在供應(yīng)鏈危機(jī)或成本問(wèn)題,也決定了它有沒(méi)有繼續(xù)推進(jìn)的空間,比如目前工藝較為先進(jìn)的主要是PCM和SRAM,最高分別已經(jīng)到了14nm和12nm。
在2021年的VLSI技術(shù)大會(huì)上,IBM發(fā)表了一篇文章,講述了他們以14nm CMOS工藝打造的一個(gè)64核PCM模擬存內(nèi)計(jì)算芯片,HERMES。該芯片采用了后端集成的多層相變化內(nèi)存,由256個(gè)線(xiàn)性化的CCO ADC組成,可以在1GHz的工作頻率之上進(jìn)行精確的片上矩陣矢量乘法運(yùn)算。在深度學(xué)習(xí)的運(yùn)算測(cè)試中,HERMES獲得了10.5 TOPS/W的運(yùn)算效率以及1.59TOPS/mm2的性能密度。

Thetis Core芯片 / Axelera AI
而荷蘭初創(chuàng)企業(yè)Axelera AI則選了數(shù)字SRAM這一路線(xiàn),他們?cè)谌ツ?2月成功流片第一代IMC芯片Thetis Core。Thetis Core的面積不到9mm2,卻可以在INT8精度下提供39.3TOPS的算力和14.1 TOPS/W的性能,甚至還可以超頻到48.16TOPS。但不少存內(nèi)計(jì)算芯片提到性能表現(xiàn)時(shí),往往都是指滿(mǎn)載的情況,正因如此,Thetis Core在低利用率下的效率表現(xiàn)才顯得無(wú)比亮眼。哪怕從100%利用率降低至25%的,該芯片也能展現(xiàn)13TOPS/W的效率,降幅只有7%左右。

小結(jié)

除了“存”以外,存內(nèi)計(jì)算在“算”上的選擇也不盡相同,比如進(jìn)行模擬或數(shù)字MAC運(yùn)算等等。從斯坦福大學(xué)教授Boris Murmann提出的觀點(diǎn)來(lái)看,在低精度下模擬運(yùn)算要比數(shù)字運(yùn)算更高效,但一旦精度拔高,比如8位以后,模擬計(jì)算的功耗就會(huì)成倍增加了??紤]到落地應(yīng)用較少,未來(lái)的存內(nèi)計(jì)算會(huì)更傾向于哪種形式仍有待觀察,但從存儲(chǔ)廠商、存算一體芯片廠商的動(dòng)向來(lái)看,這或許是存儲(chǔ)市場(chǎng)迎來(lái)又一輪爆發(fā)的絕佳機(jī)遇。

聲明:本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請(qǐng)注明以上來(lái)源。如需入群交流,請(qǐng)?zhí)砑游⑿舉lecfans999,投稿爆料采訪(fǎng)需求,請(qǐng)發(fā)郵箱huangjingjing@elecfans.com。


更多熱點(diǎn)文章閱讀

  • 狂砸900億美元!塔塔集團(tuán)半導(dǎo)體投資超美歐補(bǔ)貼,印度半導(dǎo)體制造這就成了?
  • 全球首架C919正式交付,背后是中國(guó)制造業(yè)的崛起
  • 包機(jī)出海拿下10億訂單!企業(yè)面對(duì)面溝通,或更利于電子產(chǎn)品出口!
  • 千億芯片出貨的Arm,能在PC市場(chǎng)稱(chēng)王嗎?
  • 被裹挾的臺(tái)積電與昂貴的“美國(guó)制造”:投資400億美元補(bǔ)貼不足5%


原文標(biāo)題:存內(nèi)計(jì)算對(duì)“存”的選擇

文章出處:【微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:存內(nèi)計(jì)算對(duì)“存”的選擇

文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    ISSCC 2026重磅:清華+華為+字節(jié)聯(lián)合發(fā)布內(nèi)計(jì)算芯片,重塑推薦系統(tǒng)能效邊界

    Recommendation System Acceleration》(HYDAR:面向高效推薦系統(tǒng)加速的混合內(nèi)計(jì)算框架),首次提出基于 28nm 工藝的混合
    的頭像 發(fā)表于 02-28 09:15 ?2473次閱讀
    ISSCC 2026重磅:清華+華為+字節(jié)聯(lián)合發(fā)布<b class='flag-5'>存</b><b class='flag-5'>內(nèi)</b><b class='flag-5'>計(jì)算</b>芯片,重塑推薦系統(tǒng)能效邊界

    內(nèi)計(jì)算芯片,熱度大增

    。自動(dòng)駕駛汽車(chē)需要實(shí)時(shí)響應(yīng),避免數(shù)據(jù)傳輸延遲。醫(yī)療和工業(yè)應(yīng)用通常依賴(lài)于無(wú)法與第三方共享的敏感數(shù)據(jù)。盡管邊緣人工智能應(yīng)用速度更快、更安全,但它們的計(jì)算
    的頭像 發(fā)表于 10-28 10:09 ?497次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>內(nèi)</b><b class='flag-5'>計(jì)算</b>芯片,熱度大增

    科技榮獲2025半導(dǎo)體市場(chǎng)創(chuàng)新表現(xiàn)獎(jiǎng)

    8月26日,第22屆深圳國(guó)際電子展(elexcon2025)現(xiàn)場(chǎng)正式揭曉聚焦行業(yè)技術(shù)突破與價(jià)值創(chuàng)造的“2025半導(dǎo)體市場(chǎng)創(chuàng)新表現(xiàn)獎(jiǎng)” ,知科技憑借WTM系列算一體芯片的核心技術(shù)創(chuàng)新,成功斬獲
    的頭像 發(fā)表于 08-28 17:09 ?1589次閱讀

    芯動(dòng)科技與知科技達(dá)成深度合作

    隨著3D堆疊方案憑借低功耗、高帶寬特性,有望成為下一代移動(dòng)端高端熱門(mén)技術(shù)。芯動(dòng)科技瞄準(zhǔn)3DIC市場(chǎng),與全球領(lǐng)先的算一體芯片企業(yè)知科技達(dá)成深度合作,正式量產(chǎn)面向Face2Face鍵合(F2F)系列高速接口IP解決方案。
    的頭像 發(fā)表于 08-27 17:05 ?1344次閱讀

    一文看懂“算一體”

    今天這篇文章,我們來(lái)聊一個(gè)最近幾年很火的概念——算一體。為什么會(huì)提出“算一體”?算一體,英文叫ComputeInMemory,簡(jiǎn)稱(chēng)CIM。顧名思義,就是將存儲(chǔ)和計(jì)算放在一起。大家
    的頭像 發(fā)表于 08-18 12:15 ?1445次閱讀
    一文看懂“<b class='flag-5'>存</b>算一體”

    Texas Instruments TMAG5213霍爾效應(yīng)鎖器數(shù)據(jù)手冊(cè)

    Texas Instruments TMAG5213霍爾效應(yīng)鎖器是斬波穩(wěn)定霍爾效應(yīng)傳感器,在整個(gè)溫度范圍內(nèi)具有出色的靈敏度穩(wěn)定性。這些鎖器具有30kHz磁采樣頻率、35μs上電時(shí)間以及多種靈敏度
    的頭像 發(fā)表于 08-02 15:13 ?1057次閱讀
    Texas Instruments TMAG5213霍爾效應(yīng)鎖<b class='flag-5'>存</b>器數(shù)據(jù)手冊(cè)

    科技邀您相約第二十一屆全國(guó)容錯(cuò)計(jì)算學(xué)術(shù)會(huì)議

    7月18日至20日,由中國(guó)計(jì)算機(jī)學(xué)會(huì)主辦的第二十一屆全國(guó)容錯(cuò)計(jì)算學(xué)術(shù)會(huì)議(CCF CFTC 2025)將在杭州舉行。作為國(guó)內(nèi)容錯(cuò)計(jì)算領(lǐng)域一年一度的盛會(huì),此次會(huì)議匯聚了來(lái)自學(xué)術(shù)界和產(chǎn)業(yè)界的眾多精英,知
    的頭像 發(fā)表于 07-16 15:20 ?1056次閱讀

    緩解高性能算一體芯片IR-drop問(wèn)題的軟硬件協(xié)同設(shè)計(jì)

    在高性能計(jì)算與AI芯片領(lǐng)域,基于SRAM的算一體(Processing-In-Memory, PIM)架構(gòu)因兼具計(jì)算密度、能效和精度優(yōu)勢(shì)成為主流方案。隨著算一體芯片性能的持續(xù)攀升,
    的頭像 發(fā)表于 07-11 15:11 ?1333次閱讀
    緩解高性能<b class='flag-5'>存</b>算一體芯片IR-drop問(wèn)題的軟硬件協(xié)同設(shè)計(jì)

    “算平衡”有多重要?

    。而決定這種配合效率的關(guān)鍵指標(biāo),正是我們今天要聊的“算比”。什么是算比?算比=計(jì)算能力(如每秒浮點(diǎn)運(yùn)算次數(shù))÷存儲(chǔ)容量(如GB/TB),但更核心的是
    的頭像 發(fā)表于 07-11 14:06 ?755次閱讀
    “算<b class='flag-5'>存</b>平衡”有多重要?

    一文讀懂Allegro先進(jìn)磁性開(kāi)關(guān)和鎖

    Allegro 擁有豐富的霍爾效應(yīng)和隧道磁阻(TMR)開(kāi)關(guān)及鎖器產(chǎn)品,可廣泛應(yīng)用于汽車(chē)、工業(yè)和消費(fèi)電子等領(lǐng)域。本應(yīng)用筆記旨在提供分步選型流程,協(xié)助設(shè)計(jì)師為具體應(yīng)用場(chǎng)景選擇適配的 Allegro
    的頭像 發(fā)表于 06-12 17:26 ?1926次閱讀
    一文讀懂Allegro先進(jìn)磁性開(kāi)關(guān)和鎖<b class='flag-5'>存</b>器

    得一微定義“AI力芯片”,讓每比特?cái)?shù)據(jù)創(chuàng)造更多智能

    在AI技術(shù)重塑全球產(chǎn)業(yè)格局的進(jìn)程中,計(jì)算范式正經(jīng)歷從運(yùn)算器為中心到存儲(chǔ)器為中心的范式躍遷。這一變革重新定義了“先進(jìn)力”的邊界。 得一微電子首次創(chuàng)造性地提出“AI力芯片”的技術(shù)概念。未來(lái) AI
    的頭像 發(fā)表于 06-04 09:03 ?811次閱讀

    第二屆知科技杯華東高校內(nèi)計(jì)算創(chuàng)新應(yīng)用大賽正式啟動(dòng)

    在數(shù)字化浪潮席卷各行業(yè)的當(dāng)下,數(shù)據(jù)量呈爆炸式增長(zhǎng),算力需求也水漲船高。內(nèi)計(jì)算架構(gòu)作為創(chuàng)新解決方案,備受產(chǎn)學(xué)研各界關(guān)注。為推動(dòng)內(nèi)
    的頭像 發(fā)表于 05-06 17:51 ?898次閱讀

    科技入選杭州AI“18羅漢”企業(yè)

    ,聚焦人工智能領(lǐng)域的新生代,代表人工智能產(chǎn)業(yè)的未來(lái),從而全面展現(xiàn)杭州AI生態(tài)。知科技憑借其在內(nèi)計(jì)算芯片領(lǐng)域的卓越表現(xiàn)入選杭州 AI“18 羅漢”,彰顯在人工智能基礎(chǔ)層的強(qiáng)勁實(shí)力與領(lǐng)
    的頭像 發(fā)表于 04-28 11:50 ?1265次閱讀

    科技產(chǎn)學(xué)研融合戰(zhàn)略再啟新篇

    科技產(chǎn)學(xué)研融合戰(zhàn)略再啟新篇。近日,清華大學(xué)-知科技“多模態(tài)智能感算融合系統(tǒng)”產(chǎn)學(xué)研深度融合專(zhuān)項(xiàng)啟動(dòng)會(huì)暨指導(dǎo)委員會(huì)第一次會(huì)議在清華大學(xué)順利召開(kāi)。
    的頭像 發(fā)表于 04-24 09:11 ?1209次閱讀

    得一微:AI力芯片,重構(gòu)計(jì)算范式

    。 ? 在近日舉行的MemoryS 2025上,得一微電子(YEESTOR)展示了其“IP設(shè)計(jì)-芯片設(shè)計(jì)-算法驅(qū)動(dòng)-力創(chuàng)新”的全鏈條技術(shù)實(shí)力。公司首席市場(chǎng)官羅挺接受電子發(fā)燒友采訪(fǎng)時(shí)表示,得一微在業(yè)界首次提出“AI力芯片”的概念,通過(guò)積極布局產(chǎn)品,創(chuàng)造性地采用“AI
    的頭像 發(fā)表于 04-21 16:22 ?2126次閱讀
    得一微:AI<b class='flag-5'>存</b>力芯片,重構(gòu)<b class='flag-5'>計(jì)算</b>范式