91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

MCM正在滲透進更多的芯片設計中

lPCU_elecfans ? 來源:電子發(fā)燒友網(wǎng) ? 作者:電子發(fā)燒友網(wǎng) ? 2022-05-09 09:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/周凱揚)多芯片模塊(MCM)技術的應用在半導體業(yè)界已經(jīng)不是什么新鮮事了,但隨著Chiplet、2.5D/3D封裝技術日趨火熱,MCM正在滲透進更多的芯片設計中,無論是GPU、光模塊還是AI芯片,都在慢慢引入這類封裝技術。

MCM GPU成為趨勢

以去年AMD發(fā)布的首個MCM GPU Instinct MI250X為例,這款GPU集成了兩個GPU Chiplet和128GB的超大HBM2e內(nèi)存,在算力和帶寬上都做到了極致,實現(xiàn)了383TFLOPS(FP16)和3.2TB/s的可怕成績,無疑是專注AI的各大超算中心夢寐以求的加速器了。同樣,英特爾也在其Ponte Vecchio GPU上采用了MCM。

雖然MCM已經(jīng)由AMD和英特爾兩家GPU廠商開始推進了,但目前來看英偉達的動作比較小,雖然有相關的研究,但還未拿出商用的MCM產(chǎn)品。不過以上都是面向HPC/AI市場的GPU,消費級的GPU是否也會迎來MCM的GPU呢?據(jù)現(xiàn)在的傳聞,AMD極有可能在下一代RDNA3架構的高端GPU中用上MCM。

但消費級應用與HPC/AI應用又屬于截然不同的場景,后者使用多個GPU跑負載是很常見的情況。但消費場景中多GPU已經(jīng)相當少見了,在兼容性上肯定會大打折扣,所以邁出這一步很可能會帶來一定的風險。

IP公司眼中的MCM

MCM不僅為GPU公司帶來了更多設計靈活性,也讓一眾IP公司找到了新的商業(yè)模式。比如IP公司Credo就提供混合信號DSP IP,用于客戶的ASIC設計,以Chiplet的形式集成到SoC上,打造更低功耗更高性能的MCM。隨著數(shù)據(jù)中心的網(wǎng)絡架構慢慢趨向于400G以上,芯片連接性的要求也在逐步升高。為此,Credo在去年底推出了全新的3.2Tbps BlueJay重定時器chiplet,通過64通道56Gbps PAM4 LR的DSP,提供了強大的系統(tǒng)級連接性。

BlueJay雖然只是以臺積電28nm工藝打造,但保證了性能和功耗的要求,與其先進工藝方案Nutcracker相比也降低了成本。此外,由于BlueJay與主機端MCM中SoC核心的通信是通過超低功耗的BoW D2D接口實現(xiàn)的,其接口已經(jīng)針對臺積電的CoWoS封裝技術做了優(yōu)化。這種將SerDes功能從片上(on-die)轉向片外(off-chip)的做法,顯著增加了ASIC的可使用面積,設計者可以將這一部分多出來的面積用于實現(xiàn)更高的計算性能。

AI在MCM上的創(chuàng)新

同樣,AI也在MCM上找到了新的解決方案。我們已經(jīng)看到了大的機器學習模型通過訓練大數(shù)據(jù)在多個領域展示了驚人的成果,比如計算機視覺語音識別和自然語言處理等。為了減少機器學習加速器的成本,業(yè)界引入了不少設計創(chuàng)新,其中之一就是MCM。

英偉達的Simba,谷歌的TPU,都用到了MCM的設計。谷歌的Coral TPU是一個用于邊緣端的機器學習推理加速器,在極小的占用面積下可以實現(xiàn)4 TOPS(INT8)的峰值性能,能效比可達2 TOPS/W。英偉達的Simba同樣是一個用于推理的芯片,但規(guī)模比谷歌的Coral更大,整個MCM由36個Chiplet組成,每個都能實現(xiàn)4 TOPS的峰值性能,將整個芯片算力提升至最高128 TOPS,能效比更是高達6.1 TOPS/W。

一來在設計上,設計小芯片的難度比一整塊芯片要低,二來小芯片由于面積較小,生產(chǎn)良率也更高。這都證明了這種方案既可以減少設計和生產(chǎn)成本,也能達到與單個大芯片近似的性能與能效。

但正如我們上文提到的MCM GPU兼容問題一樣,機器學習中MCM也并非毫無痛點。由于MCM中單個Chiplet的內(nèi)存遠比單個大芯片要小,所以大型機器學習模型的訓練與推理都需要將矢量計算的數(shù)據(jù)流圖在Chiplet上進行劃分。多芯片進行劃分就是為了將運算分配給Chiplet,從而將某個性能指標最大化,比如說吞吐量。但與單芯片不一樣,MCM中小芯片的數(shù)量以及神經(jīng)網(wǎng)絡的節(jié)點數(shù)量增加,都會讓搜索空間成指數(shù)級增長,從而降低效率,更不用說因為MCM的硬件特性,可用的劃分方案并不多。所以這種劃分的質量,直接影響到了MCM芯片設計的優(yōu)化。

為了解決這個問題,谷歌的研究員們開發(fā)了一種深度強化學習的劃分方案,同時利用一個約束求解器來專門解決MCM封裝的機器學習模型劃分問題。他們的方案可以通過預訓練來普及到未知的輸入圖,通過對生產(chǎn)級BERT模型的硬件評估,他們得到了超過隨機搜索和模擬退火等現(xiàn)有方案5%以上的吞吐量。更重要的是,這種方案具備極佳的遷移學習性能,使用預訓練的模型可以有效提升樣本效率,將搜索時間從3個小時減少到了9分鐘。

原文標題:MCM正在潛移默化地改變芯片設計

文章出處:【微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5193

    瀏覽量

    135407
  • 芯片設計
    +關注

    關注

    15

    文章

    1155

    瀏覽量

    56674
  • MCM
    MCM
    +關注

    關注

    1

    文章

    70

    瀏覽量

    22891

原文標題:MCM正在潛移默化地改變芯片設計

文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    無需功放IC?WTN6040FP-14S大功率語音芯片如何引領技術革新?

    在電子科技飛速發(fā)展的今天,語音芯片作為人機交互的關鍵元件,正滲透進我們生活的方方面面——從汽車喇叭的安全警示,到通道閘機的語音提示,都離不開它。然而,傳統(tǒng)的語音芯片方案往往需要外接功放IC才能驅動
    的頭像 發(fā)表于 02-27 09:45 ?248次閱讀
    無需功放IC?WTN6040FP-14S大功率語音<b class='flag-5'>芯片</b>如何引領技術革新?

    超細間距倒裝芯片灌封膠滲透與空洞控制 |鉻銳特實業(yè)

    鉻銳特實業(yè)|探討超細間距(Fine-pitch)倒裝芯片封裝,底部填充膠滲透難題與空洞缺陷控制的關鍵技術。分析間距縮小至40-55μm時的流動性、空洞成因及行業(yè)解決方案,助力高性能芯片
    的頭像 發(fā)表于 02-12 04:05 ?364次閱讀
    超細間距倒裝<b class='flag-5'>芯片</b>灌封膠<b class='flag-5'>滲透</b>與空洞控制 |鉻銳特實業(yè)

    為何工業(yè)OEM廠商正在向Arm架構遷移

    工業(yè)自動化正在經(jīng)歷一場根本性的變革。從工業(yè) PC 到邊緣網(wǎng)關和智能傳感器,邊緣側的計算需求正在快速變化。人工智能 (AI) 正在從云端走向更多現(xiàn)實環(huán)境。過去圍繞可預測、單一用途工作負載
    的頭像 發(fā)表于 12-15 14:56 ?590次閱讀

    技術資訊 I 一文速通 MCM 封裝

    本文要點MCM封裝將多個芯片集成在同一基板上,在提高能效與可靠性的同時,還可簡化設計并降低成本。MCM封裝領域的最新進展包括有機基板、重分布層扇出、硅中介層和混合鍵合。這些技術能夠提升MCM
    的頭像 發(fā)表于 12-12 17:10 ?7170次閱讀
    技術資訊 I 一文速通 <b class='flag-5'>MCM</b> 封裝

    2025國人工智能大會,藏著AI的行動派時刻

    AI正在從空中樓閣滲透進社會生產(chǎn)的方方面面
    的頭像 發(fā)表于 12-07 22:29 ?8788次閱讀
    2025<b class='flag-5'>中</b>國人工智能大會,藏著AI的行動派時刻

    CINNO預計2025年國乘用車市HUD滲透率約17%

    “根據(jù)CINNO Research數(shù)據(jù)顯示,車載標配HUD正快速向中低端和高端市場滲透,1H’25國乘用車HUD標配量同比增長22%,HUD標配率為15.5%,其中,AR-HUD標配量同比增長45%,AR-HUD標配率達4.3%,同比均提升1個百分點?!?/div>
    的頭像 發(fā)表于 11-10 17:42 ?1322次閱讀

    Arm CEO:公司正在自研芯片

    據(jù)外媒路透社報道,Arm CEO Rene Haas透露,Arm正在投資開發(fā)自有芯片,并計劃將部分利潤投資于制造自己的芯片和其他組件。與之對應的是Arm預測的下一財季經(jīng)營業(yè)績也會因為自研芯片
    的頭像 發(fā)表于 07-31 11:49 ?619次閱讀

    振弦式滲壓計如何計算滲透壓力和揚壓力?

    在巖土工程安全監(jiān)測,振弦式滲壓計是量化地下水滲透壓力與揚壓力的核心工具。其核心價值在于通過鋼弦頻率變化精準捕捉壓力數(shù)據(jù),但如何將原始信號轉化為工程所需的力學參數(shù)?下面是南京峟思給大家做出的具體介紹
    的頭像 發(fā)表于 07-16 14:41 ?807次閱讀
    振弦式滲壓計如何計算<b class='flag-5'>滲透</b>壓力和揚壓力?

    芯片行業(yè),太缺人了

    隨著芯片需求的不斷增長,以及設備和應用逐漸滲透到日常生活,半導體行業(yè)正在快速發(fā)展。然而,據(jù)Semi稱,該行業(yè)正面臨嚴重的勞動力失衡問題,合格專業(yè)人員(尤其是工程師和領導者)的數(shù)量
    的頭像 發(fā)表于 07-04 10:02 ?1191次閱讀
    <b class='flag-5'>芯片</b>行業(yè),太缺人了

    傳統(tǒng)的芯片設計,正在被顛覆

    幾十年來,半導體開發(fā)一直遵循著24至36個月的穩(wěn)定設計開發(fā)周期。雖然這種模式在計算需求較低且創(chuàng)新速度更易于管理的情況下運作良好,但人工智能卻創(chuàng)造了一套新的規(guī)則。人工智能的飛速發(fā)展正在迅速超越當前芯片
    的頭像 發(fā)表于 06-27 12:38 ?925次閱讀
    傳統(tǒng)的<b class='flag-5'>芯片</b>設計,<b class='flag-5'>正在</b>被顛覆

    瑞之辰:全金屬封裝+MEMS傳感技術雙輪驅動重塑格局

    上至宇宙的航天器,下至地下管網(wǎng),傳感器,已經(jīng)滲透進生活的每個角落。傳感器正在全球范圍內(nèi),為各產(chǎn)業(yè)轉型升級不斷提振活力。然而,當一臺咖啡機的壓力傳感器因溫漂誤差導致萃取失敗時,背后折射出的是我國高端
    的頭像 發(fā)表于 06-26 16:36 ?928次閱讀
    瑞之辰:全金屬封裝+MEMS傳感技術雙輪驅動重塑格局

    芯片底部填充膠填充不飽滿或滲透困難原因分析及解決方案

    芯片底部填充膠(Underfill)在封裝工藝若出現(xiàn)填充不飽滿或滲透困難的問題,可能導致芯片可靠性下降(如熱應力失效、焊點開裂等)。以下是系統(tǒng)性原因分析與解決方案:一、原因分析1.材
    的頭像 發(fā)表于 04-03 16:11 ?1665次閱讀
    <b class='flag-5'>芯片</b>底部填充膠填充不飽滿或<b class='flag-5'>滲透</b>困難原因分析及解決方案

    智能醫(yī)院如何重塑現(xiàn)代醫(yī)療生態(tài)

    在科幻電影,無人駕駛的醫(yī)療艙、AI診斷機器人和全息投影手術室曾被視為遙不可及的未來圖景,而如今,隨著物聯(lián)網(wǎng)、人工智能、區(qū)塊鏈等技術的突破性發(fā)展,這些場景正逐步滲透進現(xiàn)實醫(yī)療體系,催生出“智能醫(yī)院
    的頭像 發(fā)表于 03-31 15:09 ?521次閱讀

    HMC342低噪聲放大器芯片技術手冊

    HMC342芯片是一款GaAs MMIC低噪聲放大器(LNA),工作頻率范圍為13至25 GHz。 由于尺寸較小(2.14 mm2),該芯片可輕松集成到多芯片模塊(MCM)
    的頭像 發(fā)表于 03-20 09:15 ?999次閱讀
    HMC342低噪聲放大器<b class='flag-5'>芯片</b>技術手冊

    安全檢測 高效合規(guī) | 經(jīng)緯恒潤重磅推出PeneTrix滲透測試平臺

    積累,以“精研細測”的專業(yè)精神,正式推出PeneTrix滲透測試平臺,助力ECU開發(fā)團隊高效、精準地完成信息安全合規(guī)任務。PeneTrix滲透測試平臺是經(jīng)緯恒潤
    的頭像 發(fā)表于 03-17 17:04 ?1040次閱讀
    安全檢測 高效合規(guī) | 經(jīng)緯恒潤重磅推出PeneTrix<b class='flag-5'>滲透</b>測試平臺