電子發(fā)燒友網(wǎng)報(bào)道(文 / 吳子鵬)時(shí)至 2025 年,在專項(xiàng)政策扶持、旺盛算力需求以及跨行業(yè)多元應(yīng)用的共同推動(dòng)下,AI(人工智能)技術(shù)展現(xiàn)出前所未有的增長(zhǎng)潛力。根據(jù)市場(chǎng)調(diào)研機(jī)構(gòu) IDC 的統(tǒng)計(jì)數(shù)據(jù),2024 年全球 AI IT 總投資已達(dá) 3158 億美元,預(yù)計(jì)到 2028 年將進(jìn)一步增長(zhǎng)至 8159 億美元,期間年復(fù)合增長(zhǎng)率高達(dá) 32.9%。
AI 算力集群作為 AI IT 投資中的關(guān)鍵組成部分,正通過(guò) Scale Up(縱向擴(kuò)展)和 Scale Out(水平 / 橫向擴(kuò)展)兩種方式不斷擴(kuò)大規(guī)模。為滿足萬(wàn)億甚至十萬(wàn)億參數(shù)規(guī)模的 AI 大模型訓(xùn)練需求,萬(wàn)卡級(jí)、十萬(wàn)卡級(jí)別的 AI 算力集群已成為行業(yè)主流配置。然而,在構(gòu)建大規(guī)模 AI 算力集群的過(guò)程中,行業(yè)面臨著諸多典型挑戰(zhàn)。比如,英偉達(dá)公司NVLink 和 InfiniBand 技術(shù)雖然在 Scale Up和 Scale Out方面具有一定的性能優(yōu)勢(shì),但其作為專有協(xié)議也構(gòu)建起了生態(tài)壁壘,將算力卡與擴(kuò)展技術(shù)深度綁定,顯著提高了算力布局的準(zhǔn)入門檻。
為進(jìn)一步釋放大規(guī)模 AI 算力集群的發(fā)展?jié)撃?,打破專有技術(shù)的封閉生態(tài)已迫在眉睫,同時(shí)還需兼顧高性能、低功耗與可擴(kuò)展性等關(guān)鍵指標(biāo)。超以太網(wǎng)聯(lián)盟(UEC)和 UALink 聯(lián)盟(UAC)通過(guò)制定開(kāi)放規(guī)范,將碎片化的互連技術(shù)整合為統(tǒng)一框架。這種標(biāo)準(zhǔn)化舉措不僅減少了重復(fù)研發(fā)投入,更有效提升了行業(yè)整體運(yùn)營(yíng)效率。在此背景下,新思科技(Synopsys)推出的業(yè)界首款超以太網(wǎng)和 UALink IP 解決方案,憑借開(kāi)放標(biāo)準(zhǔn)、高性能設(shè)計(jì)以及生態(tài)協(xié)同優(yōu)勢(shì),為大規(guī)模 AI 集群提供了可擴(kuò)展、高可靠的互連基礎(chǔ),有望成為下一代 AI 基礎(chǔ)設(shè)施的核心技術(shù)。
開(kāi)放標(biāo)準(zhǔn):提升 AI 算力集群效率的關(guān)鍵
對(duì)于 AI 算力集群而言,算力芯片是最基本的計(jì)算單元。然而,算力芯片需求的發(fā)展與先進(jìn)制程之間出現(xiàn)了嚴(yán)重的演進(jìn)速度不匹配問(wèn)題。算力芯片主要服務(wù)于 AI 模型領(lǐng)域,該領(lǐng)域參數(shù)量大約每 4 至 6 個(gè)月便會(huì)翻一番;而先進(jìn)制程遵循摩爾定律,晶體管數(shù)量約每 18 - 24 個(gè)月增加一倍,性能同步提升。此外,隨著單顆芯片內(nèi)集成的計(jì)算單元和內(nèi)存單元日益增多,算力芯片設(shè)計(jì)不斷突破掩膜尺寸限制。因此,AI 行業(yè)迫切需要一種可擴(kuò)展的解決方案,以應(yīng)對(duì)急劇增長(zhǎng)的算力需求。
現(xiàn)代 AI 算力集群普遍采用 “Scale Up + Scale Out” 混合架構(gòu)。其中,Scale Up 主要用于在算力集群中通過(guò)縱向擴(kuò)展,提升單節(jié)點(diǎn)內(nèi)的計(jì)算密度與通信效率。在傳統(tǒng)算力網(wǎng)絡(luò)中,每臺(tái)服務(wù)器即為一個(gè)算力節(jié)點(diǎn),但受空間、功耗和散熱條件限制,單臺(tái)服務(wù)器所能容納的計(jì)算芯片數(shù)量有限。為此,行業(yè)引入超節(jié)點(diǎn)(SuperPod)概念,通過(guò) Switch 或交換機(jī)組網(wǎng)技術(shù),使單節(jié)點(diǎn)不再局限于一臺(tái)服務(wù)器,而是可由多臺(tái)服務(wù)器與網(wǎng)絡(luò)設(shè)備共同組成。
Scale Up 旨在盡可能地增加單節(jié)點(diǎn)內(nèi)的計(jì)算資源,而 Scale Out 則致力于突破單節(jié)點(diǎn)的算力上限,進(jìn)行更大規(guī)模的橫向擴(kuò)展,以滿足大模型訓(xùn)練對(duì)計(jì)算資源呈指數(shù)級(jí)增長(zhǎng)的需求。對(duì)于大模型訓(xùn)練任務(wù),往往需要數(shù)萬(wàn)至數(shù)十萬(wàn)計(jì)算卡協(xié)同工作,Scale Out 的優(yōu)勢(shì)在于其理論上具備無(wú)限擴(kuò)展能力,但連接效率對(duì)其至關(guān)重要。
長(zhǎng)期以來(lái),英偉達(dá)公司在 “Scale Up + Scale Out” 混合架構(gòu)領(lǐng)域引領(lǐng)技術(shù)發(fā)展。在 Scale Up 方向,英偉達(dá)擁有 NVLink 和 NVSwitch 兩大核心技術(shù);在 Scale Out 方向,Infiniband(IB)也是主流通信網(wǎng)絡(luò)協(xié)議之一。但正如前文所述,NVLink、NVSwitch 和 Infiniband 均為專有協(xié)議,形成了一定的行業(yè)技術(shù)壁壘。為打破這一局面,超以太網(wǎng)和 UALink 等開(kāi)放標(biāo)準(zhǔn)應(yīng)運(yùn)而生,重塑 AI 基礎(chǔ)設(shè)施的生態(tài)格局。
UALink 是一項(xiàng)對(duì)標(biāo)英偉達(dá) NVLink 和 NVSwitch 的關(guān)鍵技術(shù),可廣泛適配各類加速器。與 NVLink 相同,UALink 采用 GPU 內(nèi)部總線傳輸?shù)脑Z(yǔ)義 —— 內(nèi)存語(yǔ)義,支持內(nèi)存共享功能,能夠優(yōu)化加速器之間的內(nèi)存通信。無(wú)論是直接連接還是通過(guò)交換機(jī)連接,UALink 均可實(shí)現(xiàn)高效數(shù)據(jù)傳輸,每通道速度高達(dá) 200 Gbps,使每個(gè)加速器能夠直接訪問(wèn)其他加速器的內(nèi)存。UALink 還是一個(gè)低延遲的輕量級(jí)協(xié)議,并具備同步功能,有助于保障多個(gè)加速器之間的一致性,促進(jìn)系統(tǒng)高效運(yùn)行。

UALink 技術(shù)框圖,圖源:MICRO - 2024 HiPChips 研討會(huì)
另外,UALink 還具有兩項(xiàng)顯著優(yōu)勢(shì)特性:支持 Switch 組網(wǎng),并與 UEC 相輔相成。前者使 AI 行業(yè)能夠打造支持 UALink 的交換機(jī),進(jìn)而構(gòu)建更高計(jì)算性能的超級(jí)節(jié)點(diǎn);后者則構(gòu)建起基于開(kāi)放標(biāo)準(zhǔn)的生態(tài)體系,加速行業(yè)從 “少數(shù)公司主導(dǎo)” 向 “開(kāi)放競(jìng)爭(zhēng)” 模式轉(zhuǎn)變。憑借這些領(lǐng)先特性,UALink 可使超級(jí)節(jié)點(diǎn)如同單個(gè)加速器般運(yùn)作,提供高性能、低延時(shí)、低功耗的計(jì)算性能。
2025 年 4 月,UALink 聯(lián)盟正式發(fā)布 UALink 1.0 規(guī)范,支持每通道 200 GT/s 的雙向數(shù)據(jù)速率,信號(hào)速率達(dá) 212.5 GT/s,單個(gè) UALink 1.0 系統(tǒng)支持連接多達(dá) 1024 個(gè) AI 加速器,并通過(guò) UALink 交換機(jī)連接,為每個(gè) AI 加速器分配一個(gè)端口和 10 - bit 唯一標(biāo)識(shí)符,以實(shí)現(xiàn)精準(zhǔn)路由。
在 Scale Out 方向,超以太網(wǎng)聯(lián)盟致力于創(chuàng)建 “基于以太網(wǎng)的完整通信堆棧架構(gòu)”,用超以太網(wǎng)傳輸協(xié)議替代基于以太網(wǎng)的 RoCE 協(xié)議,從而提高網(wǎng)絡(luò)吞吐量、降低延遲,增強(qiáng)網(wǎng)絡(luò)的可靠性與穩(wěn)定性,這對(duì)于提升 Scale Out 的可擴(kuò)展性至關(guān)重要。

超以太網(wǎng)集群圖,圖源:新思科技
以太網(wǎng)是當(dāng)前全球應(yīng)用最廣泛的局域網(wǎng)技術(shù),其技術(shù)標(biāo)準(zhǔn)由 IEEE 的 802.3 標(biāo)準(zhǔn)制定。UEC 采用專為 AI 和 HPC 應(yīng)用設(shè)計(jì)的下一代傳輸協(xié)議,對(duì)以太網(wǎng)進(jìn)行重新定義。超以太網(wǎng)從物理層、鏈路層、傳輸層、軟件層等多個(gè)層面改進(jìn)以太網(wǎng)技術(shù),具備 FEC(前向糾錯(cuò))統(tǒng)計(jì)、鏈路層重傳(LLR)、多路徑報(bào)文噴發(fā)、新一代擁塞控制、靈活排序、端到端遙測(cè)、交換機(jī)卸載等關(guān)鍵功能。例如,在傳輸層,超以太網(wǎng)支持選擇性重傳、無(wú)序傳送、數(shù)據(jù)包噴射和高級(jí)擁塞控制機(jī)制,提供可靠有序交付(ROD)、可靠無(wú)序交付(RUD)和不可靠無(wú)序交付(UUD)等多種傳輸模式。

超以太網(wǎng)技術(shù)框圖,圖源:UEC
雖然超以太網(wǎng)與 InfiniBand 均是專為 AI 和 HPC 領(lǐng)域研發(fā)的網(wǎng)絡(luò)通信技術(shù),但超以太網(wǎng)憑借開(kāi)放標(biāo)準(zhǔn),促進(jìn)了廣泛的技術(shù)融合以及不同制造商和設(shè)備間的聯(lián)合創(chuàng)新。同時(shí),以太網(wǎng)龐大的供應(yīng)商生態(tài)體系有助于 AI 行業(yè)降低算力門檻,使中小型企業(yè)也能以較低成本參與 AI 硬件市場(chǎng)競(jìng)爭(zhēng)。
業(yè)界首款 UALink 和超以太網(wǎng) IP 解決方案
超以太網(wǎng)和 UALink 技術(shù)的誕生,實(shí)現(xiàn)了不同廠商加速器的高效互連,避免了生態(tài)綁定問(wèn)題。已發(fā)布的 UALink 1.0 標(biāo)準(zhǔn)和 UEC 就緒(UEC - ready)規(guī)范,共同構(gòu)建起下一代 AI 基礎(chǔ)設(shè)施的互連框架。
作為超以太網(wǎng)聯(lián)盟(UEC)和 UALink 聯(lián)盟(UAC)的活躍成員,新思科技推出業(yè)界首款超以太網(wǎng) IP 和 UALink IP 解決方案,旨在滿足下一代大規(guī)模 AI 算力集群在高帶寬、低延遲互連方面的迫切需求。

業(yè)界首款 UALink 和超以太網(wǎng) IP 解決方案,圖源:新思科技
新思科技 UALink IP 解決方案集成了控制器、物理層(PHY)和驗(yàn)證 IP,專為數(shù)據(jù)密集型 AI 工作負(fù)載設(shè)計(jì),具備低延遲、高帶寬和先進(jìn)的內(nèi)存共享能力。該方案是一套面向 AI 加速器和交換機(jī)的全集成解決方案,滿足 UALink 規(guī)范的完整硬件安全要求,可實(shí)現(xiàn)每通道 200 Gbps 的最大吞吐量,為擴(kuò)展至 1024 個(gè) AI 加速器的超級(jí)節(jié)點(diǎn)提供強(qiáng)大的帶寬支持。
新思科技超以太網(wǎng) IP 解決方案由 MAC(媒體訪問(wèn)控制)、PCS(物理編碼子層)控制器、物理層(PHY)以及驗(yàn)證 IP 組成,并采用經(jīng)硅驗(yàn)證的新思科技 112G/224G PHY IP,以提升可靠性,為連接百萬(wàn)節(jié)點(diǎn)構(gòu)建大規(guī)模 AI 擴(kuò)展網(wǎng)絡(luò)提供超低延遲和高帶寬連接。這一完整的超以太網(wǎng)接口棧通過(guò) 112Gbps 和 224Gbps SerDes(串行器 / 解串器)進(jìn)行信息傳輸,支持 4×400G、2×800G 和 1.6T 以太網(wǎng)速率。
同時(shí),新思科技超以太網(wǎng) IP 解決方案支持不斷演進(jìn)的 IEEE 802.3 和 OIF - 224G 電氣標(biāo)準(zhǔn),滿足 chip - to - chip、chip - to - module 以及長(zhǎng)距離銅纜 / 背板互連的性能要求。該方案中包含以太網(wǎng) PCS 的 RS - FEC(里德 - 所羅門前向糾錯(cuò))功能、前饋均衡器 (FFE) 以及低抖動(dòng)鎖相環(huán)(PLL),有效提升了信號(hào)傳輸?shù)姆€(wěn)定性。
更為關(guān)鍵的是,新思科技 UALink IP 解決方案和超以太網(wǎng) IP 解決方案基于經(jīng)硅驗(yàn)證的成熟技術(shù),結(jié)合該公司在接口技術(shù)領(lǐng)域數(shù)十年的豐富經(jīng)驗(yàn),并嚴(yán)格遵循不斷發(fā)展的行業(yè)開(kāi)放標(biāo)準(zhǔn),能夠幫助開(kāi)發(fā)人員有效降低研發(fā)風(fēng)險(xiǎn)。截至目前,新思科技已經(jīng)能夠?yàn)?AI 和 HPC 等前沿應(yīng)用提供豐富的高速接口 IP 組合,涵蓋 PCIe 7.0、1.6T 以太網(wǎng)、CXL、HBM、UCIe 以及最新的超以太網(wǎng)和 UALink 方案,充分釋放下一代 AI 基礎(chǔ)設(shè)施的發(fā)展?jié)撃堋?/p>
結(jié)語(yǔ)
大規(guī)模 AI 算力集群的發(fā)展已步入技術(shù)躍遷的關(guān)鍵階段。面對(duì)專有技術(shù)形成的生態(tài)壁壘以及指數(shù)級(jí)增長(zhǎng)的算力需求,開(kāi)放標(biāo)準(zhǔn)正以革新者的姿態(tài)重塑行業(yè)格局。超以太網(wǎng)與 UALink 通過(guò)標(biāo)準(zhǔn)化互連框架,在打破技術(shù)壟斷的同時(shí),憑借高性能、低功耗和可擴(kuò)展特性,為萬(wàn)卡、十萬(wàn)卡級(jí)集群的算力協(xié)同提供了堅(jiān)實(shí)的底層支撐。新思科技推出的業(yè)界首款超以太網(wǎng)與 UALink IP 解決方案,依托經(jīng)硅驗(yàn)證的技術(shù)積累與對(duì)開(kāi)放標(biāo)準(zhǔn)的深度契合,不僅為 AI 加速器與交換機(jī)的高效互聯(lián)奠定了硬件基礎(chǔ),更通過(guò)生態(tài)協(xié)同效應(yīng)降低了創(chuàng)新門檻,助力中小企業(yè)參與算力基建競(jìng)爭(zhēng),推動(dòng)行業(yè)從 “少數(shù)巨頭主導(dǎo)” 向 “多元開(kāi)放創(chuàng)新” 模式加速演進(jìn)。
-
摩爾定律
+關(guān)注
關(guān)注
4文章
640瀏覽量
80888 -
Synopsys
+關(guān)注
關(guān)注
2文章
162瀏覽量
91428
發(fā)布評(píng)論請(qǐng)先 登錄
車載以太網(wǎng)協(xié)議轉(zhuǎn)換器操作教程# 車載以太網(wǎng)# 轉(zhuǎn)換器# 硬件# 教程# 汽車# 技術(shù)# 操作
探索單對(duì)以太網(wǎng)(SPE)連接器:KYOCERA AVX的創(chuàng)新解決方案
工業(yè)以太網(wǎng)的可靠之選:DP83822低功耗耐用型以太網(wǎng)PHY
Amphenol單對(duì)以太網(wǎng)(SPE)IP20連接器及電纜組件:工業(yè)以太網(wǎng)新選擇
新思科技VIP全面支持超以太網(wǎng)與UALink協(xié)議
寧暢發(fā)布業(yè)界首款超鈦金3200W ATS CRPS電源 為智能算力發(fā)展注入全新動(dòng)能
積算科技上線赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型算力
車載網(wǎng)絡(luò)測(cè)試技術(shù)的進(jìn)化之路#CAN #車載以太網(wǎng) #TSN #時(shí)間敏感網(wǎng)絡(luò)
奇異摩爾邀您相約2025中國(guó)AI算力大會(huì)
摩爾線程與AI算力平臺(tái)AutoDL達(dá)成深度合作
電力電子中的“摩爾定律”(1)
深入解讀新思科技UALink和超以太網(wǎng)IP解決方案
瑞沃微先進(jìn)封裝:突破摩爾定律枷鎖,助力半導(dǎo)體新飛躍
摩爾定律趕不上模型進(jìn)化?業(yè)界首款超以太網(wǎng)和UALink IP帶來(lái)“算力擴(kuò)容”新解法
評(píng)論