91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MCM正在潛移默化地改變芯片設(shè)計

21克888 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:凱揚 ? 2022-05-09 08:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

多芯片模塊(MCM)技術(shù)的應(yīng)用在半導(dǎo)體業(yè)界已經(jīng)不是什么新鮮事了,但隨著Chiplet、2.5D/3D封裝技術(shù)日趨火熱,MCM正在滲透進更多的芯片設(shè)計中,無論是GPU、光模塊還是AI芯片,都在慢慢引入這類封裝技術(shù)。

MCM GPU成為趨勢

以去年AMD發(fā)布的首個MCM GPU Instinct MI250X為例,這款GPU集成了兩個GPU Chiplet和128GB的超大HBM2e內(nèi)存,在算力和帶寬上都做到了極致,實現(xiàn)了383TFLOPS(FP16)和3.2TB/s的可怕成績,無疑是專注AI的各大超算中心夢寐以求的加速器了。同樣,英特爾也在其Ponte Vecchio GPU上采用了MCM。

Instinct MI250X GPU / AMD

雖然MCM已經(jīng)由AMD和英特爾兩家GPU廠商開始推進了,但目前來看英偉達的動作比較小,雖然有相關(guān)的研究,但還未拿出商用的MCM產(chǎn)品。不過以上都是面向HPC/AI市場的GPU,消費級的GPU是否也會迎來MCM的GPU呢?據(jù)現(xiàn)在的傳聞,AMD極有可能在下一代RDNA3架構(gòu)的高端GPU中用上MCM。

但消費級應(yīng)用與HPC/AI應(yīng)用又屬于截然不同的場景,后者使用多個GPU跑負載是很常見的情況。但消費場景中多GPU已經(jīng)相當少見了,在兼容性上肯定會大打折扣,所以邁出這一步很可能會帶來一定的風(fēng)險。

IP公司眼中的MCM

MCM不僅為GPU公司帶來了更多設(shè)計靈活性,也讓一眾IP公司找到了新的商業(yè)模式。比如IP公司Credo就提供混合信號DSP IP,用于客戶的ASIC設(shè)計,以Chiplet的形式集成到SoC上,打造更低功耗更高性能的MCM。隨著數(shù)據(jù)中心的網(wǎng)絡(luò)架構(gòu)慢慢趨向于400G以上,芯片連接性的要求也在逐步升高。為此,Credo在去年底推出了全新的3.2Tbps BlueJay重定時器chiplet,通過64通道56Gbps PAM4 LR的DSP,提供了強大的系統(tǒng)級連接性。

BlueJay Chiplet / Credo

BlueJay雖然只是以臺積電28nm工藝打造,但保證了性能和功耗的要求,與其先進工藝方案Nutcracker相比也降低了成本。此外,由于BlueJay與主機端MCM中SoC核心的通信是通過超低功耗的BoW D2D接口實現(xiàn)的,其接口已經(jīng)針對臺積電的CoWoS封裝技術(shù)做了優(yōu)化。這種將SerDes功能從片上(on-die)轉(zhuǎn)向片外(off-chip)的做法,顯著增加了ASIC的可使用面積,設(shè)計者可以將這一部分多出來的面積用于實現(xiàn)更高的計算性能。

AI在MCM上的創(chuàng)新

同樣,AI也在MCM上找到了新的解決方案。我們已經(jīng)看到了大的機器學(xué)習(xí)模型通過訓(xùn)練大數(shù)據(jù)在多個領(lǐng)域展示了驚人的成果,比如計算機視覺、語音識別和自然語言處理等。為了減少機器學(xué)習(xí)加速器的成本,業(yè)界引入了不少設(shè)計創(chuàng)新,其中之一就是MCM。

Coral TPU / 谷歌

英偉達的Simba,谷歌的TPU,都用到了MCM的設(shè)計。谷歌的Coral TPU是一個用于邊緣端的機器學(xué)習(xí)推理加速器,在極小的占用面積下可以實現(xiàn)4 TOPS(INT8)的峰值性能,能效比可達2 TOPS/W。英偉達的Simba同樣是一個用于推理的芯片,但規(guī)模比谷歌的Coral更大,整個MCM由36個Chiplet組成,每個都能實現(xiàn)4 TOPS的峰值性能,將整個芯片算力提升至最高128 TOPS,能效比更是高達6.1 TOPS/W。

一來在設(shè)計上,設(shè)計小芯片的難度比一整塊芯片要低,二來小芯片由于面積較小,生產(chǎn)良率也更高。這都證明了這種方案既可以減少設(shè)計和生產(chǎn)成本,也能達到與單個大芯片近似的性能與能效。

但正如我們上文提到的MCM GPU兼容問題一樣,機器學(xué)習(xí)中MCM也并非毫無痛點。由于MCM中單個Chiplet的內(nèi)存遠比單個大芯片要小,所以大型機器學(xué)習(xí)模型的訓(xùn)練與推理都需要將矢量計算的數(shù)據(jù)流圖在Chiplet上進行劃分。多芯片進行劃分就是為了將運算分配給Chiplet,從而將某個性能指標最大化,比如說吞吐量。但與單芯片不一樣,MCM中小芯片的數(shù)量以及神經(jīng)網(wǎng)絡(luò)的節(jié)點數(shù)量增加,都會讓搜索空間成指數(shù)級增長,從而降低效率,更不用說因為MCM的硬件特性,可用的劃分方案并不多。所以這種劃分的質(zhì)量,直接影響到了MCM芯片設(shè)計的優(yōu)化。

為了解決這個問題,谷歌的研究員們開發(fā)了一種深度強化學(xué)習(xí)的劃分方案,同時利用一個約束求解器來專門解決MCM封裝的機器學(xué)習(xí)模型劃分問題。他們的方案可以通過預(yù)訓(xùn)練來普及到未知的輸入圖,通過對生產(chǎn)級BERT模型的硬件評估,他們得到了超過隨機搜索和模擬退火等現(xiàn)有方案5%以上的吞吐量。更重要的是,這種方案具備極佳的遷移學(xué)習(xí)性能,使用預(yù)訓(xùn)練的模型可以有效提升樣本效率,將搜索時間從3個小時減少到了9分鐘。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54004

    瀏覽量

    465847
  • 芯片設(shè)計
    +關(guān)注

    關(guān)注

    15

    文章

    1155

    瀏覽量

    56676
  • MCM
    MCM
    +關(guān)注

    關(guān)注

    1

    文章

    70

    瀏覽量

    22891
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    恩智浦MCX N系列MCU在數(shù)據(jù)中心和AI服務(wù)器領(lǐng)域表現(xiàn)優(yōu)異

    當AI技術(shù)逐漸融入我們生活的每個角落,它正以潛移默化的方式重塑整個時代。我們見證著AI帶來的突破,如模型創(chuàng)新、應(yīng)用場景的演進,但隨著AI發(fā)展進入深水區(qū),真正決定其發(fā)展規(guī)模潛力的,早已不只是模型本身,而是其背后的AI基礎(chǔ)設(shè)施建設(shè)。
    的頭像 發(fā)表于 01-26 09:22 ?1787次閱讀
    恩智浦MCX N系列MCU在數(shù)據(jù)中心和AI服務(wù)器領(lǐng)域表現(xiàn)優(yōu)異

    技術(shù)資訊 I 一文速通 MCM 封裝

    本文要點MCM封裝將多個芯片集成在同一基板上,在提高能效與可靠性的同時,還可簡化設(shè)計并降低成本。MCM封裝領(lǐng)域的最新進展包括有機基板、重分布層扇出、硅中介層和混合鍵合。這些技術(shù)能夠提升MCM
    的頭像 發(fā)表于 12-12 17:10 ?7174次閱讀
    技術(shù)資訊 I 一文速通 <b class='flag-5'>MCM</b> 封裝

    大數(shù)據(jù)時代下的管理變革:勤哲EXCEL服務(wù)器助力企業(yè)高效運營

    在大數(shù)據(jù)高速發(fā)展的今天,先進信息技術(shù)正在潛移默化改變現(xiàn)代企業(yè)的經(jīng)營管理模式。實踐證明,這些技術(shù)不但提升了管理效率,還為企業(yè)決策提供了科學(xué)依據(jù)。信息化建設(shè)已成為企業(yè)管理創(chuàng)新的重要趨勢,越來越多企業(yè)
    的頭像 發(fā)表于 11-19 14:29 ?496次閱讀

    Chiplet,改變芯片

    1965年,英特爾聯(lián)合創(chuàng)始人戈登·摩爾提出了“摩爾定律”。半個多世紀以來,這一定律推動了集成電路(IC)性能的提升和成本的降低,并成為現(xiàn)代數(shù)字技術(shù)的基礎(chǔ)。摩爾定律指出,半導(dǎo)體芯片上的晶體管數(shù)量大約每
    的頭像 發(fā)表于 10-17 08:33 ?3152次閱讀
    Chiplet,<b class='flag-5'>改變</b>了<b class='flag-5'>芯片</b>

    AI芯片冷卻技術(shù),正在成為關(guān)鍵

    電子發(fā)燒友網(wǎng)綜合報道 隨著單芯片性能的不斷提高,AI芯片的功率飆升至數(shù)千瓦級別,需要更加搞笑的散熱來保證芯片的穩(wěn)定運行。最近市場有消息傳出,英偉達已要求供應(yīng)鏈伙伴開發(fā)一種名為MLCP的新型液冷技術(shù)
    發(fā)表于 09-20 00:36 ?1986次閱讀

    Arm CEO:公司正在自研芯片

    據(jù)外媒路透社報道,Arm CEO Rene Haas透露,Arm正在投資開發(fā)自有芯片,并計劃將部分利潤投資于制造自己的芯片和其他組件。與之對應(yīng)的是Arm預(yù)測的下一財季經(jīng)營業(yè)績也會因為自研芯片
    的頭像 發(fā)表于 07-31 11:49 ?620次閱讀

    傳統(tǒng)的芯片設(shè)計,正在被顛覆

    幾十年來,半導(dǎo)體開發(fā)一直遵循著24至36個月的穩(wěn)定設(shè)計開發(fā)周期。雖然這種模式在計算需求較低且創(chuàng)新速度更易于管理的情況下運作良好,但人工智能卻創(chuàng)造了一套新的規(guī)則。人工智能的飛速發(fā)展正在迅速超越當前芯片
    的頭像 發(fā)表于 06-27 12:38 ?925次閱讀
    傳統(tǒng)的<b class='flag-5'>芯片</b>設(shè)計,<b class='flag-5'>正在</b>被顛覆

    人工智能正在改變世界

    它需要大量的處理能力,需求每一百天就會翻一番,這推動了人工智能基礎(chǔ)設(shè)施的投資熱潮。未來的數(shù)據(jù)中心需要滿足和管理對計算資源前所未有的需求:既要能智能高效地提供支持,又要滿足相應(yīng)的計算、內(nèi)存和網(wǎng)絡(luò)性能。
    的頭像 發(fā)表于 06-13 10:19 ?807次閱讀

    藍牙語音遙控國產(chǎn)適用芯片HS6621

    在智能家居的時代,科技正在改變我們的生活方式。藍牙語音遙控器,作為智能家居的關(guān)鍵組成部分,正在重新定義用戶與設(shè)備之間的互動方式。用戶對著藍牙語音遙控器,只要輕說一句話就可以搞定很多復(fù)雜的遙控操作
    發(fā)表于 04-30 16:21

    請問改變電源管理芯片參考點電壓就會改變芯片輸出電壓的原理是什么?

    在線性穩(wěn)壓芯片LM7815電源管理芯片,在輸出端并聯(lián)電阻分壓網(wǎng)絡(luò)R1和R2,并將分壓點接在參考端,這樣做為什么會將輸出電壓增大為(1+R2/R1)*Ue,Ue為電源管理芯片額定輸出電壓; 這里假設(shè)
    發(fā)表于 04-17 06:28

    谷東AR+AI智能眼鏡如何改變生活

    這不是科幻電影,而是一副AR+AI眼鏡正在發(fā)生的“魔法”。今天,我們帶大家走進這款即將改變生活的未來科技——谷東AR+AI智能眼鏡。
    的頭像 發(fā)表于 04-14 12:50 ?1176次閱讀

    生物傳感器:解鎖生命密碼的“芯片”,正在改變世界的感知方式

    當你用智能手表監(jiān)測心率,用血糖儀檢測健康,甚至喝下一杯經(jīng)過微生物檢測的牛奶時,或許不曾想到,這些日常場景背后都藏著同一項前沿技術(shù)——生物傳感器。這個將生物學(xué)與電子技術(shù)融合的“魔法工具”,正在
    的頭像 發(fā)表于 03-26 18:19 ?1238次閱讀

    HMC518低噪聲放大器芯片,23-32GHz技術(shù)手冊

    dBm的輸出IP3。 該芯片尺寸很小,可輕松集成到混合或多芯片模塊(MCM)組件中。 所有數(shù)據(jù)均采用50 ?測試夾具中的芯片進行測試,通過最短0.31 mm (12 mil)的0.0
    的頭像 發(fā)表于 03-20 14:39 ?1247次閱讀
    HMC518低噪聲放大器<b class='flag-5'>芯片</b>,23-32GHz技術(shù)手冊

    HMC342低噪聲放大器芯片技術(shù)手冊

    HMC342芯片是一款GaAs MMIC低噪聲放大器(LNA),工作頻率范圍為13至25 GHz。 由于尺寸較小(2.14 mm2),該芯片可輕松集成到多芯片模塊(MCM)中。 該
    的頭像 發(fā)表于 03-20 09:15 ?1001次閱讀
    HMC342低噪聲放大器<b class='flag-5'>芯片</b>技術(shù)手冊