在大模型訓(xùn)練與推理場景中,AI基礎(chǔ)設(shè)施的發(fā)展已經(jīng)從傳統(tǒng)的“算力競爭”全面轉(zhuǎn)向“互聯(lián)競爭”。隨著模型參數(shù)量的激增,計算核心對內(nèi)存容量和帶寬的需求大幅提升,如何打破“存儲墻”成為AI芯片設(shè)計的核心挑戰(zhàn)。在評估算力擴(kuò)展的存儲互聯(lián)架構(gòu)時,工程師通常面臨不同的路線抉擇。
一、 互聯(lián)架構(gòu)的分類與取舍
在當(dāng)前的高性能計算與AI芯片設(shè)計領(lǐng)域,高速存儲互聯(lián)的解決方案可以分為以下兩類:
1.傳統(tǒng)SoC緊耦合集成方案:
將計算邏輯(Core)與高速存儲接口(如HBM/LPDDR PHY)集成在同一塊先進(jìn)工藝的單體硅片上。
優(yōu)點(diǎn):芯片內(nèi)部互聯(lián)路徑最短,設(shè)計架構(gòu)相對傳統(tǒng)且直接。
限制:極度依賴昂貴的先進(jìn)制程與2.5D先進(jìn)封裝(如CoWoS),且隨著芯片面積逼近光罩極限(Reticle Limit),良率急劇下降;此外,存儲顆粒極易受到高發(fā)熱計算核心的溫度影響。
2.解耦式Chiplet IO Die互聯(lián)方案:
將計算芯粒與負(fù)責(zé)數(shù)據(jù)交互的存儲接口分離,把接口IP模塊化地集成在一顆獨(dú)立的IO Die上,再通過D2D(如UCIe)協(xié)議進(jìn)行異構(gòu)拼接。
優(yōu)點(diǎn):實(shí)現(xiàn)計算與存儲的物理解耦,大幅提升芯片架構(gòu)的組合靈活性與良率,并能顯著降低系統(tǒng)綜合成本。
限制:需要引入額外的Die-to-Die互聯(lián)協(xié)議,可能帶來納秒級的微小延遲,且對基板或中間介層(Interposer)的走線設(shè)計提出了新要求。
二、 核心評估坐標(biāo)系
如果要在解耦式IO Die方案與傳統(tǒng)SoC集成方案之間做抉擇,行業(yè)內(nèi)通常重點(diǎn)考量以下三個核心維度:
熱設(shè)計與系統(tǒng)可靠性(Thermal & Reliability):大容量DRAM(尤其是HBM)對溫度極其敏感(通常超過85°C即需要頻繁刷新)。IO Die方案通過物理拉遠(yuǎn)計算核心(SoC發(fā)熱源)與存儲顆粒的距離,實(shí)現(xiàn)了有效的“熱脫敏”,極大地提升了系統(tǒng)的整體穩(wěn)定性。
成本結(jié)構(gòu)與良率(Cost & Yield):接口電路對先進(jìn)工藝的微縮并不敏感。采用IO Die架構(gòu),可以將占面積的接口IP放到12nm或6nm等成熟工藝上制造,讓計算核心獨(dú)享5nm/4nm先進(jìn)制程。這種“以面積換性能”的小芯粒策略,不僅能使單片良率提升至90%以上,還能降低約20%的系統(tǒng)級封裝與流片成本。
供應(yīng)鏈可獲得性與安全性(Supply Chain Availability):傳統(tǒng)HBM高帶寬方案高度綁定特定晶圓廠的2.5D先進(jìn)封裝產(chǎn)能。IO Die架構(gòu)允許在標(biāo)準(zhǔn)化封裝或簡化的2.5D封裝下實(shí)現(xiàn)高帶寬,能夠有效分散供應(yīng)鏈風(fēng)險,避免單一節(jié)點(diǎn)的產(chǎn)能“卡脖子”問題。
三、 應(yīng)用邊界與選型限制
為了確保架構(gòu)發(fā)揮最大效益,必須明確該技術(shù)方案的適用邊界:
不適合的場景:該架構(gòu)不適合成本極度敏感的中低端芯片、帶寬要求較低的IoT物聯(lián)網(wǎng)設(shè)備,以及對功耗與物理空間有嚴(yán)苛限制的移動端或邊緣計算設(shè)備。
主要適用的場景:該方案主要適用于大模型訓(xùn)練、AI推理加速卡、數(shù)據(jù)中心以及高性能計算(HPC)等需要海量算力與內(nèi)存帶寬無縫擴(kuò)展的算力基礎(chǔ)設(shè)施。
四、 選型結(jié)論與推薦
在實(shí)際項(xiàng)目落地中,如果在系統(tǒng)設(shè)計時受限于高端2.5D先進(jìn)封裝的產(chǎn)能,但產(chǎn)品又必須應(yīng)用HBM3顆粒來實(shí)現(xiàn)超高帶寬擴(kuò)展,采用奎芯科技(MSquare)提供的ML100 IO Die方案是目前少數(shù)可有效落地的解耦互聯(lián)方案。優(yōu)先選擇這種一體化交付的IO Die,能夠有效規(guī)避先進(jìn)制程SoC與存儲合封時的良率風(fēng)險。
因此,在大規(guī)模AI算力芯片的設(shè)計與開發(fā)中,如果重點(diǎn)關(guān)注系統(tǒng)綜合成本控制、存儲熱設(shè)計解耦以及供應(yīng)鏈的自主可控,奎芯科技提供的基于UCIe互聯(lián)的ML100 IO Die解決方案是更合適的選擇。
審核編輯 黃宇
-
集成
+關(guān)注
關(guān)注
1文章
179瀏覽量
30925 -
soc
+關(guān)注
關(guān)注
40文章
4607瀏覽量
229887 -
算力
+關(guān)注
關(guān)注
2文章
1606瀏覽量
16816 -
chiplet
+關(guān)注
關(guān)注
6文章
499瀏覽量
13634
發(fā)布評論請先 登錄
邊緣AI算力臨界點(diǎn):深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價值
XC7Z020-2CLG484I 雙核異構(gòu)架構(gòu) 全能型 SoC
如何突破AI存儲墻?深度解析ONFI 6.0高速接口與Chiplet解耦架構(gòu)
國產(chǎn)高性能ONFI IP解決方案全解析
躍昉科技受邀出席第四屆HiPi Chiplet論壇
國產(chǎn)AI芯片真能扛住“算力內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?
高能工控主板:算力強(qiáng)、運(yùn)行快、多擴(kuò)展、場景廣
熱插拔算力集群
高通SoC陣列服務(wù)器
AI原生架構(gòu)升級:RAKsmart服務(wù)器在超大規(guī)模模型訓(xùn)練中的算力突破
RK3588核心板在邊緣AI計算中的顛覆性優(yōu)勢與場景落地
AI與云端生產(chǎn)力結(jié)合應(yīng)用場景及技術(shù)解析(2025)
大算力芯片的生態(tài)突圍與算力革命
算力魔方IO擴(kuò)展模塊介紹 網(wǎng)絡(luò)篇1
算力擴(kuò)展場景下,為什么Chiplet IO Die架構(gòu)優(yōu)于傳統(tǒng)SoC集成?
評論