91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

算力即國力!摩爾線程架構(gòu)/芯片/超節(jié)點/萬卡集群四連發(fā),助力打造AI國之重器

Felix分析 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:吳子鵬 ? 2025-12-23 09:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/吳子鵬)在人工智能AI)時代,算力如同工業(yè)革命的電力,成為驅(qū)動社會運轉(zhuǎn)的“數(shù)字能源”,是AI從技術(shù)研發(fā)走向大規(guī)模應(yīng)用的核心支撐。因此,在摩爾線程首屆MUSA開發(fā)者大會(MDC 2025)上,摩爾線程創(chuàng)始人、董事長兼CEO張建中表示:“算力即國力,我們希望能夠從芯片到集群,以‘加速計算’的能力,利用全功能GPU打造國之重器。”
摩爾線程創(chuàng)始人、董事長兼CEO張建中

MDC 2025上,摩爾線程集中發(fā)布了一系列技術(shù)與產(chǎn)品進展,包括新架構(gòu)“花港”亮相、夸娥萬卡智算集群發(fā)布、下一代MTT C256超節(jié)點架構(gòu)分享、搭載智能SoC芯片“長江”的AI算力本MTT AIBOOK發(fā)布等,算力應(yīng)用場景覆蓋“云邊端”。本文重點聚焦云端算力基礎(chǔ)設(shè)施建設(shè),從“Scale Up”“萬卡集群”角度,解讀摩爾線程最新產(chǎn)品對國產(chǎn)算力的賦能價值。

從千卡到萬卡的躍升,下一步目標直指十萬卡

云端算力基礎(chǔ)設(shè)施的重要應(yīng)用場景之一,是AI大模型的訓(xùn)練與推理。以訓(xùn)練任務(wù)為例,大模型企業(yè)通常采用Tensor并行(TP)、Pipeline并行(PP)、Data并行(DP)及專家并行(EP)等方式,拆分千億、萬億參數(shù)規(guī)模的大模型,進而完成部署與適配。其中,PP、DP等通信量較大的任務(wù),通常選擇Scale Up方式應(yīng)對,即盡可能部署在單個超節(jié)點內(nèi);而通信量相對較小的任務(wù),則多采用Scale Out方式。

超節(jié)點的本質(zhì)是極致優(yōu)化的Scale Up,是算力縱向擴展的最高形態(tài)。它通過高速互聯(lián)技術(shù),將數(shù)十至上百顆計算芯片緊密集成為邏輯統(tǒng)一的計算單元,對外表現(xiàn)為一臺“超級計算機”。因此,在超節(jié)點體系中,算力芯片與互聯(lián)技術(shù)是核心關(guān)鍵。

摩爾線程在MDC 2025上公布的“華山”芯片,基于“花港”架構(gòu)打造,是專注于AI訓(xùn)推一體與超大規(guī)模智能計算的芯片。作為新一代全功能GPU架構(gòu),“花港”在計算密度、能效、精度支持、互聯(lián)能力及圖形技術(shù)等方面實現(xiàn)全面突破,核心特性包括:

計算性能顯著提升:基于新一代指令集,算力密度提升50%,能效大幅優(yōu)化;支持從FP4到FP64的全精度端到端計算,新增MTFP6/MTFP4及混合低精度支持。

異步編程與超大規(guī)模互聯(lián):集成新一代異步編程模型,優(yōu)化任務(wù)調(diào)度與并行機制;通過自研MTLink高速互聯(lián)技術(shù),支持十萬卡以上規(guī)模智算集群擴展。

圖形與AI深度融合:內(nèi)置AI生成式渲染架構(gòu),增強硬件光線追蹤加速引擎,完整支持DirectX 12 Ultimate,實現(xiàn)圖形渲染與智能計算的高度協(xié)同。

全棧自研與安全可信:架構(gòu)基于全棧自主研發(fā),擁有扎實的專利壁壘(截至2025年6月30日,公司累計授權(quán)專利514項,其中發(fā)明專利468項),具備全棧自研與自主可控的核心能力;通過四層硬件安全架構(gòu),提供從芯片到系統(tǒng)的可驗證安全守護。

從行業(yè)發(fā)展趨勢來看,低精度訓(xùn)練推理是未來AI的主要場景,下一代MT Transformer Engine中將進一步利用MTFP8和MTFP4的優(yōu)勢加速Attention部分,將Attention從BF16向FP8甚至FP6演進。為適配更高密度的Tensor Core,“花港”架構(gòu)在硬件層面進行創(chuàng)新,對Attention中的SIMT部分完成革新性升級:原生支持矩陣rowmax計算,大幅提升混合精度SIMT吞吐量,增強在線量化反量化能力,并提供低精度訓(xùn)練推理中隨機舍入等算法的硬件支持。

得益于“花港”架構(gòu)的領(lǐng)先性能,“華山”芯片集成新一代異步編程與全精度張量計算單元,支持從FP4至FP64的全精度計算,為萬卡級智算集群提供穩(wěn)定高效的算力支撐,是構(gòu)建下一代“AI工廠”的堅實底座?!叭A山”芯片具備多項差異化創(chuàng)新:不僅支持MTLink 4.0,還開放兼容多種以太網(wǎng)協(xié)議,可適配更多Scale Up交換機;基于新一代Scale Up系統(tǒng),目前“華山”芯片可支持高達1024個GPU集成的超節(jié)點;內(nèi)置RAS 2.0,可實現(xiàn)ECC和SRAM校驗,保障芯片運行準確性;集成ACE 2.0新一代異步通信引擎,負責芯片內(nèi)部通信調(diào)度,提升計算效率。

在Scale Up拓展的具體進展上,摩爾線程在MDC 2025上分享了面向下一代超大規(guī)模智算中心的MTT C256超節(jié)點架構(gòu)規(guī)劃,聚焦高密硬件架構(gòu)設(shè)計,旨在實現(xiàn)極致智算性能。

盡管摩爾線程未在MDC 2025上詳細介紹Scale Out相關(guān)內(nèi)容,但從其最新發(fā)布的夸娥萬卡智算集群中,可看出其在該領(lǐng)域的強勁技術(shù)實力。作為Scale Out與Scale Up融合的最終成果,夸娥萬卡集群樹立了國產(chǎn)智算效率標桿,核心突破包括:浮點運算能力達到10 Exa-Flops,訓(xùn)練算力利用率(MFU)在Dense大模型上達60%、在MOE大模型上達40%,有效訓(xùn)練時間占比超90%,訓(xùn)練線性擴展效率達95%,與國際主流生態(tài)高度兼容,且在多項能效指標上具備顯著優(yōu)勢。

張建中表示,摩爾線程已具備千卡和萬卡集群的部署與運營能力,下一步目標是攻克十萬卡集群技術(shù)。

MUSA 5.0的戰(zhàn)略基石價值:讓算力普惠各行各業(yè)

強勁的全功能GPU性能,疊加針對性的系統(tǒng)優(yōu)化,使大模型開發(fā)者無論是開展訓(xùn)練還是推理工作,都能獲得極致優(yōu)化的效率:

在訓(xùn)練側(cè),基于原生FP8能力完整復(fù)現(xiàn)頂尖大模型訓(xùn)練流程,多項關(guān)鍵精度指標達到國際主流水平。技術(shù)層面實現(xiàn)核心優(yōu)化:Flash Attention算力利用率超95%,突破FP8累加精度等關(guān)鍵技術(shù)瓶頸,充分釋放國產(chǎn)GPU在大模型訓(xùn)練中的性能潛力。

在推理側(cè),摩爾線程聯(lián)合硅基流動,經(jīng)系統(tǒng)級工程優(yōu)化與FP8精度加速,在DeepSeek R1 671B全量模型上實現(xiàn)性能突破:MTT S5000單卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s,樹立國產(chǎn)推理性能新標桿。

需要說明的是,本文僅解讀了摩爾線程全功能GPU在AI計算領(lǐng)域的能力。此外,該公司全功能GPU的核心引擎還涵蓋3D圖形渲染、物理仿真與科學(xué)計算、智能視頻編解碼,這使得摩爾線程全功能GPU在AI科學(xué)計算、工業(yè)智能、數(shù)字孿生、具身智能、量子計算、6G通信、生物醫(yī)藥等領(lǐng)域擁有廣闊市場空間。

能夠?qū)崿F(xiàn)全場景覆蓋,核心原因在于摩爾線程不僅擁有性能領(lǐng)先的全功能GPU,其自主研發(fā)的MUSA統(tǒng)一架構(gòu)更是戰(zhàn)略基石。

MUSA(Meta-computing Unified System Architecture,元計算統(tǒng)一計算架構(gòu))是摩爾線程自主研發(fā)的全棧技術(shù)體系,覆蓋芯片架構(gòu)、指令集、編程模型、軟件運行庫及驅(qū)動程序框架等核心環(huán)節(jié)。

MUSA不僅完整定義了從芯片設(shè)計到軟件生態(tài)的統(tǒng)一技術(shù)標準,更彰顯了公司堅持底層創(chuàng)新、踐行長期主義的戰(zhàn)略核心,為全功能GPU奠定了堅實技術(shù)根基。歷經(jīng)五年深度研發(fā)與持續(xù)迭代,MUSA實現(xiàn)了軟件性能的指數(shù)級跨越。全新升級的MUSA 5.0標志著該架構(gòu)步入成熟新階段,在全棧統(tǒng)一性、極致效能與生態(tài)開放性上取得關(guān)鍵突破,具體包括:

編程生態(tài)全面升級:原生支持MUSA C,深度兼容TileLang、Triton等編程語言,為開發(fā)者提供靈活高效的全棧開發(fā)體驗。

計算效能極致優(yōu)化:核心計算庫muDNN實現(xiàn)GEMM/FlashAttention效率超98%,通信效率達97%,編譯器性能提升3倍,并集成高性能算子庫,顯著加速訓(xùn)練與推理全流程。

開源生態(tài)持續(xù)擴大:計劃逐步開源計算加速庫、通信庫及系統(tǒng)管理框架等核心組件,向開發(fā)者社區(qū)開放深度優(yōu)化的底層能力。

前沿特性拓展邊界:即將推出兼容跨代GPU指令架構(gòu)的中間語言MTX、面向渲染+AI融合計算的編程語言muLang、量子計算融合框架MUSA-Q及計算光刻庫muLitho,持續(xù)拓展全功能GPU的算力應(yīng)用邊界。

張建中指出,MUSA不僅支持國際通用的CPU系統(tǒng),同時兼容國產(chǎn)CPU操作系統(tǒng)與開發(fā)環(huán)境;通過MUSA架構(gòu),開發(fā)者可采用同一套軟件支撐“云邊端”不同系列產(chǎn)品。“我們希望MUSA能為我國各領(lǐng)域科技開發(fā)者提供更優(yōu)質(zhì)的工具與裝置,助力他們踐行‘十五五’規(guī)劃,在各自領(lǐng)域貢獻力量。我相信中國科技自立自強之路將走得更快、更穩(wěn),摩爾線程將持續(xù)為美好世界加速。”
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1527

    瀏覽量

    16737
  • 摩爾線程
    +關(guān)注

    關(guān)注

    2

    文章

    279

    瀏覽量

    6447
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    華為領(lǐng)銜,三劍客入局!十萬集群落地,國產(chǎn)芯片強勢崛起

    的“驅(qū)動燃料”。中移動在現(xiàn)場展示了“AI集群
    的頭像 發(fā)表于 10-14 09:30 ?1.4w次閱讀
    華為領(lǐng)銜,三劍客入局!十萬<b class='flag-5'>卡</b>智<b class='flag-5'>算</b><b class='flag-5'>集群</b>落地,國產(chǎn)<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>強勢崛起

    中科曙光3套scaleX集群落地國家互聯(lián)網(wǎng)鄭州核心節(jié)點

    2月5日,由中科曙光提供的3套集群系統(tǒng)在國家互聯(lián)網(wǎng)鄭州核心
    的頭像 發(fā)表于 02-09 10:32 ?458次閱讀

    中科曙光scaleX集群重塑超大規(guī)模基礎(chǔ)設(shè)施

    在“人工智能+”行動深入推進的當下,基礎(chǔ)設(shè)施已成為國家戰(zhàn)略競爭的核心,而超大規(guī)模集群的運維管控難題卻日益凸顯。中科曙光scaleX
    的頭像 發(fā)表于 01-30 15:43 ?704次閱讀

    中科曙光scaleX集群背后的持續(xù)創(chuàng)新

    集群的發(fā)展浪潮正以超乎想象的速度襲來,未來五年,十萬級的集群將成為標配。但一個核心挑戰(zhàn)
    的頭像 發(fā)表于 01-19 14:49 ?591次閱讀

    摩爾線程公布全功能GPU架構(gòu)路線圖:以“花港”新架構(gòu)訓(xùn)練集群,開啟自主新時代

    MUSA統(tǒng)一架構(gòu)為核心的全棧技術(shù)成果,全面展現(xiàn)公司在高端全功能GPU領(lǐng)域的關(guān)鍵突破與前瞻布局。 本次發(fā)布的核心成果包括: 1、新架構(gòu)“花港”亮相:全功能GPU架構(gòu)“花港”,支持FP4到FP64的全精度計算,
    發(fā)表于 12-20 12:51 ?1083次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>公布全功能GPU<b class='flag-5'>架構(gòu)</b>路線圖:以“花港”新<b class='flag-5'>架構(gòu)</b>與<b class='flag-5'>萬</b><b class='flag-5'>卡</b>訓(xùn)練<b class='flag-5'>集群</b>,開啟自主<b class='flag-5'>算</b><b class='flag-5'>力</b>新時代

    華為發(fā)布全球最強節(jié)點集群

    在華為全聯(lián)接大會2025(HUAWEI CONNECT 2025)上,華為發(fā)布最強節(jié)點集群,并表示將發(fā)展生態(tài)作為公司核心戰(zhàn)略,提升到
    的頭像 發(fā)表于 10-10 17:29 ?2234次閱讀

    節(jié)點+集群”:華為撞出來的之路

    節(jié)點+集群”,成為徹底解決AI困局的契機
    的頭像 發(fā)表于 09-24 10:55 ?1175次閱讀
    “<b class='flag-5'>超</b><b class='flag-5'>節(jié)點</b>+<b class='flag-5'>集群</b>”:華為撞出來的<b class='flag-5'>算</b><b class='flag-5'>力</b>之路

    睿海光電800G光模塊助力全球AI基建升級

    18%。 智中心建設(shè):與國內(nèi)AI獨角獸合作,提供支持液冷散熱的800G模塊集群,助力其大模型訓(xùn)練效率提升30%。 邊緣計算網(wǎng)絡(luò):在北美某5G運營商邊緣
    發(fā)表于 08-13 19:05

    睿海光電領(lǐng)航AI光模塊:快交付與全場景兼容賦能智時代——以創(chuàng)新實力助力全球客戶構(gòu)建高效底座

    光模塊功耗和光纖部署復(fù)雜度,同時結(jié)合優(yōu)化的前向糾錯(FCE)技術(shù),確保誤碼率低于10?12,靈敏度穩(wěn)定在-5dBm以內(nèi),充分滿足AI集群對長距離、低時延的嚴苛需求。 二、交付周期領(lǐng)
    發(fā)表于 08-13 19:03

    摩爾線程副總裁王華:AI工廠全棧技術(shù)重構(gòu)基建,開啟國產(chǎn) GPU 黃金時代

    摩爾線程在世界人工智能大會(WAIC 2025)前夕舉辦以“進化,精度革命”為主題的技術(shù)分享會,創(chuàng)新性提出“AI工廠” 理念。這一系統(tǒng)性
    的頭像 發(fā)表于 08-02 14:21 ?5342次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>副總裁王華:<b class='flag-5'>AI</b>工廠全棧技術(shù)重構(gòu)<b class='flag-5'>算</b><b class='flag-5'>力</b>基建,開啟國產(chǎn) GPU 黃金時代

    一文看懂AI集群

    最近這幾年,AI浪潮席卷全球,成為整個社會的關(guān)注焦點。大家在討論AI的時候,經(jīng)常會提到AI集群
    的頭像 發(fā)表于 07-23 12:18 ?1594次閱讀
    一文看懂<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>集群</b>

    熱插拔集群

    能力? 服務(wù)節(jié)點熱插拔?:集群服務(wù)支持在線更換計算節(jié)點(如2U服務(wù)容納12個熱插拔
    的頭像 發(fā)表于 06-26 09:20 ?1011次閱讀

    奇異摩爾邀您相約2025中AI大會

    在2025中AI大會上,奇異摩爾首席網(wǎng)絡(luò)架構(gòu)專家葉棟將帶來“
    的頭像 發(fā)表于 06-17 17:49 ?1521次閱讀

    摩爾線程AI平臺AutoDL達成深度合作

    近日,摩爾線程與國內(nèi)領(lǐng)先的AI平臺AutoDL宣布達成深度合作,雙方聯(lián)合推出面向個人開發(fā)者的“摩爾
    的頭像 發(fā)表于 05-23 16:10 ?1719次閱讀

    DeepSeek推動AI需求:800G光模塊的關(guān)鍵作用

    數(shù)據(jù)傳輸速率,減少帶寬瓶頸,成為數(shù)據(jù)中心和AI集群架構(gòu)優(yōu)化的重點。光模塊速率的躍升不僅提升了傳輸效率,也為大規(guī)模并行計算任務(wù)提供了必要的帶寬保障。 800G光模塊如何解決DeepSeek大規(guī)模
    發(fā)表于 03-25 12:00