91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

華為發(fā)布新一代超節(jié)點產(chǎn)品,支持8192張NPU卡高速互聯(lián)

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2026-03-09 09:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群



電子發(fā)燒友網(wǎng)報道(文/李彎彎)近日,在世界移動通信大會(MWC26)期間,華為計算產(chǎn)品線總裁張熙偉首次在海外發(fā)布多款超節(jié)點產(chǎn)品及解決方案,包括Atlas 950 SuperPoD智算超節(jié)點、Atlas 850E超節(jié)點服務器,以及業(yè)界首款通用計算超節(jié)點TaiShan 950 SuperPoD,還有TaiShan 500、TaiShan 200等系列化產(chǎn)品。

超節(jié)點技術:AI算力發(fā)展的關鍵支撐

人工智能快速發(fā)展的當下,每月都有新突破。智能體時代,模型從局限于大語言模型走向全模態(tài)原生融合,萬億級模型參數(shù)和10萬億級數(shù)據(jù)訓練成為常態(tài),算力需求提升十倍到百倍。同時,模型上下文序列長度顯著增加,對內(nèi)存容量和帶寬需求大幅提升。

而且,隨著AI在行業(yè)應用中的深入,實時性挑戰(zhàn)愈發(fā)凸顯,如金融風控場景時延要求小于20毫秒,反欺詐場景時延要在10毫秒以下,傳統(tǒng)計算架構難以滿足低時延要求。單一芯片提升已無法滿足AI算力需求,多芯片互聯(lián)、擴大計算節(jié)點規(guī)模成為必然選擇。

超節(jié)點技術應運而生,它是面向AI大模型訓練與推理需求的技術方案。通過高速互聯(lián)協(xié)議與專用交換芯片,將數(shù)十至數(shù)百個GPU或AI計算芯片在單機柜或集群內(nèi)緊密整合,形成邏輯上統(tǒng)一編址、高帶寬、低延遲的協(xié)同計算系統(tǒng)。其核心目標是突破傳統(tǒng)分布式計算中的“通信墻”瓶頸,提升大規(guī)模并行計算效率。該技術具備高算力密度、硬件解耦、開放兼容等特點,是構建標準化“AI工廠”、提升智算基礎設施效能的關鍵路徑。

目前,業(yè)內(nèi)對超節(jié)點有不同層級劃分。一是在單機柜內(nèi)部實現(xiàn)高速互聯(lián),常稱為“SuperNode”;另一種是由跨機柜組成的集群級互聯(lián),如英偉達提出的“SuperPod”。行業(yè)構建大規(guī)模GPU集群主要有兩種方式:Scale-Out(橫向擴展)和Scale-Up(縱向擴展)。Scale-Out是傳統(tǒng)方法,通過傳統(tǒng)網(wǎng)絡連接獨立服務器組成集群;Scale-Up則是增加單個節(jié)點內(nèi)資源數(shù)量。超節(jié)點是Scale-Up的重要實現(xiàn)方式,其內(nèi)部Scale-Up網(wǎng)絡時延目標為百納秒級,遠低于Scale-Out網(wǎng)絡的微秒級,能支撐TP(張量并行)、EP(專家并行)等高通信量任務。

Scale-Up網(wǎng)絡追求極致性能,具備高帶寬、低時延和大內(nèi)存空間三大核心特性。高帶寬方面,提供Tbps級別互聯(lián)帶寬,如NVL72方案中單GPU提供7.2Tbps帶寬;低時延方面,目標時延為百納秒級,而Scale-Out網(wǎng)絡時延通常在10微秒級別;大內(nèi)存空間方面,支持統(tǒng)一內(nèi)存編址或內(nèi)存語義,擴展有效內(nèi)存容量。

AI訓練中,流水線并行(PP)和數(shù)據(jù)并行(DP)通信量相對較小,可通過Scale-Out網(wǎng)絡處理,但張量并行(TP)和專家并行(EP)通信量極大,必須依賴Scale-Up網(wǎng)絡解決。超節(jié)點通過構建高帶寬域(HBD),整合大量GPU,降低大規(guī)模集群全局組網(wǎng)復雜度與運維難度,提升資源利用效率。其核心應用場景是支撐訓練參數(shù)規(guī)模超萬億級別的AI大模型訓練與推理,滿足AI Agent等多模型協(xié)同實時交互場景的高頻、海量通信需求。

華為超節(jié)點產(chǎn)品與技術:創(chuàng)新引領算力升級

去年,華為發(fā)布業(yè)界規(guī)模最大的昇騰384超節(jié)點,將384顆昇騰AI芯片連接成集群,提供高達300PFLOPs的密集BF16算力,性能接近英偉達GB200 NVL72系統(tǒng)的兩倍。

在芯片互聯(lián)規(guī)模與Scale up網(wǎng)絡性能上,華為CloudMatrix 384優(yōu)勢明顯。GB200 NVL72采用整機柜型超節(jié)點方案,有72個GPU芯片;而CloudMatrix 384采用分機柜超節(jié)點方案,計算節(jié)點和交換節(jié)點分裝不同機柜(12個計算柜和4個交換柜),Scale up計算單元由384個Ascend 910C芯片組成,昇騰芯片數(shù)量增加五倍,彌補了單個GPU性能不足。其BF16密集算力約300 PFLOPS,Scale up單向帶寬134400 GB/s,約是GB200 NVL72的2.1倍。

CloudMatrix 384的Scale up網(wǎng)絡采用兩層扁平拓撲架構,通過華為自研的靈衢網(wǎng)絡和靈衢總線設備互聯(lián)組網(wǎng)。靈衢網(wǎng)絡L1層由超節(jié)點交換網(wǎng)板承載,L2層由總線設備柜中的靈衢總線設備組成,L1 - L2通過光纖組成超節(jié)點集群。L1層每個計算節(jié)點集成8個昇騰910C NPU、4個鯤鵬CPU,內(nèi)部有7顆板載UB交換芯片;L2層劃分為7個獨立子平面,每個子平面含16個L2 UB交換芯片,L1交換芯片扇出16條鏈路到對應L2子平面交換芯片,實現(xiàn)無阻塞全對等拓撲。該超節(jié)點通過3168根光纖和6912個400G LPO模塊構建高速互連總線,在UB平面、RDMA平面等方面有詳細設計。

“靈衢”是華為2025年全聯(lián)接大會發(fā)布的互聯(lián)技術,是一種面向超節(jié)點的互聯(lián)協(xié)議,將IO、內(nèi)存訪問和處理單元間通信統(tǒng)一在同一體系,實現(xiàn)高性能數(shù)據(jù)搬移、資源統(tǒng)一管理等。其協(xié)議棧全面完整,基于靈衢的計算系統(tǒng)部署范圍廣,處理單元地位平等、資源可池化,還支持多種機制提升性能、增進容錯性等。

此外,華為發(fā)布的Atlas 950 SuperPoD智算超節(jié)點,以單柜64卡為基本單元,最大支持8192張NPU卡高速互聯(lián),在算力規(guī)模、互聯(lián)帶寬等指標上領先英偉達,大模型訓練效率、可靠性與推理性能大幅提升。Atlas 850E超節(jié)點服務器適配現(xiàn)有風冷機房,支持8到1024卡靈活擴展和快速部署。

軟件生態(tài)方面,華為持續(xù)貢獻openEuler開源操作系統(tǒng),全面開源開放CANN異構計算架構,通過分層解耦,將算子庫、加速庫、圖計算、編程語言等軟件代碼全量開源。北向支持PyTorch、vLLM、SGLang等業(yè)界開源社區(qū)和項目,大幅提升開發(fā)者易用性。華為副董事長、輪值董事長徐直軍曾表示,盡管受美國制裁,不能產(chǎn)出最先進工藝制程的芯片,但基于聯(lián)接技術能力,華為能做到萬卡級超節(jié)點,實現(xiàn)世界最強算力。

總結:

華為此次發(fā)布的新一代超節(jié)點產(chǎn)品,在性能和規(guī)模上實現(xiàn)重大突破,為全球AI發(fā)展提供了強大算力支持。超節(jié)點技術作為AI算力發(fā)展的關鍵支撐,通過創(chuàng)新架構設計,有效解決了傳統(tǒng)計算中的瓶頸問題,滿足了AI大模型訓練和推理的嚴苛需求。華為在超節(jié)點技術領域的探索和創(chuàng)新,不僅體現(xiàn)在硬件產(chǎn)品的性能提升上,更在于自研協(xié)議和軟件生態(tài)的全面布局。靈衢協(xié)議的推出和CANN異構計算架構的開源開放,為開發(fā)者提供了更加便捷、高效的開發(fā)環(huán)境,促進了AI技術的創(chuàng)新和應用。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 華為
    +關注

    關注

    218

    文章

    36009

    瀏覽量

    262136
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    華為發(fā)布新一代綠色AI站點和GW級AIDC解決方案

    在MWC26巴塞羅那期間舉辦的產(chǎn)品與解決方案發(fā)布會上,華為數(shù)字能源副總裁何波發(fā)布新一代AI綠色站點和GW級AIDC解決方案,在智能體
    的頭像 發(fā)表于 03-05 10:54 ?295次閱讀

    中科曙光3套scaleX萬集群落地國家互聯(lián)網(wǎng)鄭州核心節(jié)點

    2月5日,由中科曙光提供的3套萬集群系統(tǒng)在國家互聯(lián)網(wǎng)鄭州核心節(jié)點同時上線試運行,成為全國首個實現(xiàn)3萬
    的頭像 發(fā)表于 02-09 10:32 ?487次閱讀

    福田汽車發(fā)布新一代產(chǎn)品Wonder Plus

    在11月9日舉行的福田汽車2026全球合作伙伴大會上,福田汽車正式面向全球市場發(fā)布了全新一代產(chǎn)品——Wonder Plus。面對全球不同末端配送市場的升級需求,以“
    的頭像 發(fā)表于 11-18 09:39 ?580次閱讀

    昆侖芯節(jié)點亮相,單卡性能提升95%

    ;天池512節(jié)點將于?2026下半年上市,最高支持512互聯(lián)、
    的頭像 發(fā)表于 11-16 07:32 ?1w次閱讀
    昆侖芯<b class='flag-5'>超</b><b class='flag-5'>節(jié)點</b>亮相,單卡性能提升95%

    640節(jié)點問世:國產(chǎn)算力實現(xiàn)關鍵

    單機柜級640節(jié)點ScaleX640,為如火如荼的算力競爭注入了新的變量。 ? 這款被命名為ScaleX640的節(jié)點,憑借“
    的頭像 發(fā)表于 11-11 09:26 ?2295次閱讀

    蘭山國投攜手華為重磅發(fā)布瑯琊充興程重充電站

    解決方案打造的瑯琊充興程重充電站也正式發(fā)布。該充電站是全電物流加速的重要里程碑,也是蘭山國投攜手華為構建臨沂物流重
    的頭像 發(fā)表于 11-10 14:21 ?645次閱讀

    華為發(fā)布全球最強算力節(jié)點和集群

    華為全聯(lián)接大會2025(HUAWEI CONNECT 2025)上,華為發(fā)布最強算力節(jié)點和集群,并表示將發(fā)展生態(tài)作為公司核心戰(zhàn)略,提升到
    的頭像 發(fā)表于 10-10 17:29 ?2246次閱讀

    【內(nèi)測活動同步開啟】這么小?這么強?新一代大模型MCP開發(fā)板來啦!

    【內(nèi)測活動同步開啟】這么???這么強?新一代大模型MCP開發(fā)板來啦! 聆思全新一代六合芯片「LS26系列」,搭載WIFI / BLE & BT / NPU,與「小聆AI」強強
    發(fā)表于 09-25 11:47

    華為節(jié)點互聯(lián)技術引領AI基礎設施新范式

    今日,華為全聯(lián)接大會2025在上海啟幕,華為副董事長、輪值董事長徐直軍發(fā)表題為“以開創(chuàng)的節(jié)點互聯(lián)技術,引領AI基礎設施新范式”的主題演講,
    的頭像 發(fā)表于 09-20 16:15 ?2138次閱讀

    面向萬億級參數(shù)大模型,“節(jié)點”涌現(xiàn)

    UniPoD系列節(jié)點產(chǎn)品,旨在為萬億級參數(shù)大模型的訓練與推理提供更強勁、更智能且更綠色的算力支持。 ? H3C UniPoD系列
    的頭像 發(fā)表于 08-03 02:37 ?8915次閱讀
    面向萬億級參數(shù)大模型,“<b class='flag-5'>超</b><b class='flag-5'>節(jié)點</b>”涌現(xiàn)

    重磅!華為昇騰384節(jié)點真機登場,中興攜廠商首秀GPU節(jié)點實力

    作為中國自主的算力核彈,華為昇騰384節(jié)點真機首次亮相。中興通訊、上海儀電、曦智科技、壁仞科技聯(lián)合打造的光互聯(lián)芯片及
    的頭像 發(fā)表于 07-29 00:45 ?1.2w次閱讀
    重磅!<b class='flag-5'>華為</b>昇騰384<b class='flag-5'>超</b><b class='flag-5'>節(jié)點</b>真機登場,中興攜廠商首秀GPU<b class='flag-5'>超</b><b class='flag-5'>節(jié)點</b>實力

    華為開發(fā)者大會2025(HDC 2025)亮點:華為發(fā)布盤古大模型5.5 宣布新一代昇騰AI云服務上線

    HarmonyOS、昇騰AI云服務、盤古大模型等最新科技創(chuàng)新成果。 在主題演講中,華為常務董事、華為云計算CEO張平安宣布基于CloudMatrix384 節(jié)點
    的頭像 發(fā)表于 06-20 20:19 ?4478次閱讀
    <b class='flag-5'>華為</b>開發(fā)者大會2025(HDC 2025)亮點:<b class='flag-5'>華為</b>云<b class='flag-5'>發(fā)布</b>盤古大模型5.5 宣布<b class='flag-5'>新一代</b>昇騰AI云服務上線

    華為云黃瑾:昇騰云CloudMatrix 384節(jié)點六大科技創(chuàng)新,定義下一代AI基礎設施

    難以支撐 AI 技術的代際躍遷,節(jié)點架構的誕生不僅是技術的突破,更是以工程化創(chuàng)新開辟 AI 產(chǎn)業(yè)的新路徑。華為云 CloudMatrix 384
    的頭像 發(fā)表于 05-17 10:31 ?4633次閱讀

    華為兆瓦充重磅產(chǎn)品全新發(fā)布

    近日,上海車展同期,華為智能充電網(wǎng)絡正式發(fā)布華為兆瓦充等重磅新品,從乘用車的“公里*”到
    的頭像 發(fā)表于 04-25 16:54 ?1356次閱讀

    寶馬發(fā)布新一代智能電子電氣架構

    高速數(shù)據(jù)傳輸,為車輛帶來數(shù)字化神經(jīng)系統(tǒng) 慕尼黑2025年3月13日?/美通社/ --?寶馬發(fā)布新一代智能電子電氣架構,該架構是全球首個覆蓋全動力系統(tǒng)和全細分車型的架構,該架構更智能、更強大、更高效。全新電子電氣架構
    的頭像 發(fā)表于 03-13 15:42 ?747次閱讀