3月12日,中科曙光宣布實(shí)現(xiàn)國(guó)產(chǎn)高端原生RDMA技術(shù)重大突破,正式發(fā)布首款全棧自研400G無(wú)損高速網(wǎng)絡(luò)——scaleFabric。該產(chǎn)品基于原生RDMA架構(gòu),從底層的112G SerDes IP、硬件設(shè)備到上層的管理軟件實(shí)現(xiàn)100%自主研發(fā),填補(bǔ)了國(guó)內(nèi)數(shù)據(jù)中心高速網(wǎng)絡(luò)領(lǐng)域的空白,以比肩國(guó)際頂尖同類產(chǎn)品的性能表現(xiàn),為超大規(guī)模智算集群鋪就了一條高帶寬、低時(shí)延、真無(wú)損、超可靠的“算力大動(dòng)脈”。

高端智算互聯(lián)待破局
隨著AI大模型訓(xùn)練與高通量推理計(jì)算需求持續(xù)擴(kuò)大,萬(wàn)卡級(jí)乃至更大規(guī)模的算力集群正成為主流形態(tài)。研究表明,在大規(guī)模分布式訓(xùn)練中,網(wǎng)絡(luò)通信耗時(shí)占比已達(dá)到30-50%,網(wǎng)絡(luò)性能直接影響算力系統(tǒng)的整體效率。
在大規(guī)模智算集群領(lǐng)域,RDMA(遠(yuǎn)程直接內(nèi)存訪問(wèn))網(wǎng)絡(luò)已成為算力中心的基本需求,憑借零丟包、高帶寬、低延遲等特征,可極大提升通信效率。其中,InfiniBand憑借低時(shí)延與原生無(wú)損傳輸能力,在全球頂級(jí)超算與AI集群中被廣泛采用。根據(jù)TOP500榜單,目前全球約60%的高性能計(jì)算系統(tǒng)采用InfiniBand網(wǎng)絡(luò)架構(gòu)。
長(zhǎng)期以來(lái),從高速SerDes IP、核心芯片到IB網(wǎng)卡、IB交換機(jī)等設(shè)備,InfiniBand相關(guān)產(chǎn)業(yè)鏈基本被海外廠商壟斷。隨著AI算力需求快速增長(zhǎng)及數(shù)據(jù)中心網(wǎng)絡(luò)持續(xù)演進(jìn),自主高性能RDMA網(wǎng)絡(luò)正成為產(chǎn)業(yè)關(guān)注焦點(diǎn)。中國(guó)工程院院士鄔賀銓表示,高速網(wǎng)絡(luò)作為算力基礎(chǔ)設(shè)施的核心關(guān)鍵技術(shù),其自主可控性直接關(guān)系到國(guó)家算力基礎(chǔ)設(shè)施的安全與發(fā)展質(zhì)量。在大模型訓(xùn)練和智算集群規(guī)?;渴鸨尘跋?,網(wǎng)絡(luò)需要同時(shí)具備超低延遲、超高帶寬與無(wú)損傳輸能力,而RDMA高速網(wǎng)絡(luò)正是智算集群的“算力大動(dòng)脈”。

中國(guó)工程院院士?鄔賀銓 視頻致辭
國(guó)產(chǎn)原生RDMA問(wèn)世
scaleFabric是國(guó)內(nèi)首款原生無(wú)損RDMA高速網(wǎng)絡(luò),面向超大規(guī)模智算集群設(shè)計(jì),從核心關(guān)鍵IP、交換芯片、網(wǎng)卡到交換機(jī)、驅(qū)動(dòng)與管理軟件均實(shí)現(xiàn)自主研發(fā),構(gòu)建起從硬件到軟件的完整技術(shù)體系。
此次發(fā)布的scaleFabric400系列網(wǎng)絡(luò)產(chǎn)品技術(shù)規(guī)格全面對(duì)標(biāo)英偉達(dá)NDR,部分指標(biāo)實(shí)現(xiàn)趕超。性能方面,scaleFabric400網(wǎng)卡基于PCIe5.0接口,端口帶寬達(dá)400Gbps,端到端通信時(shí)延低至0.9微秒;scaleFabric400交換機(jī)單端口帶寬達(dá)800Gbps,整機(jī)交換容量可達(dá)雙向64Tbps,交換時(shí)延約260納秒,支持800G×40或400G×80端口擴(kuò)展。這一性能組合,可充分滿足萬(wàn)卡級(jí)AI訓(xùn)練集群對(duì)高帶寬、低時(shí)延網(wǎng)絡(luò)的極致需求。
穩(wěn)定性與擴(kuò)展能力上,產(chǎn)品采用基于信用的無(wú)損流控機(jī)制,從根源規(guī)避擁塞丟包風(fēng)險(xiǎn),鏈路故障恢復(fù)時(shí)間小于1毫秒,已支撐近萬(wàn)卡集群持續(xù)穩(wěn)定運(yùn)行驗(yàn)證超10個(gè)月。與英偉達(dá)NDR相比,交換機(jī)端口密度提升25%,網(wǎng)卡最大QP數(shù)支持提升100%,單子網(wǎng)互連規(guī)模是傳統(tǒng)IB的2.33倍,可輕松支持最大11.4萬(wàn)卡集群部署,同時(shí)網(wǎng)絡(luò)總成本可降低30%。
在大規(guī)模AI訓(xùn)練系統(tǒng)中,網(wǎng)絡(luò)互聯(lián)能力已成為影響算力利用率的關(guān)鍵變量。scaleFabric的發(fā)布,標(biāo)志著國(guó)產(chǎn)智算網(wǎng)絡(luò)在高端RDMA領(lǐng)域?qū)崿F(xiàn)重大突破。
萬(wàn)卡集群率先驗(yàn)證
在實(shí)際應(yīng)用層面,scaleFabric目前已部署于國(guó)家超算互聯(lián)網(wǎng)鄭州核心節(jié)點(diǎn),支撐三套萬(wàn)卡級(jí)scaleX智算集群上線運(yùn)行,總規(guī)模達(dá)3萬(wàn)卡。中科曙光高級(jí)副總裁李斌表示,隨著產(chǎn)品在超大規(guī)模智算集群中的落地應(yīng)用,國(guó)產(chǎn)原生RDMA技術(shù)路線正逐步走向成熟,圍繞其形成的高性能網(wǎng)絡(luò)產(chǎn)業(yè)生態(tài)也正在加速形成。

運(yùn)行數(shù)據(jù)顯示,該網(wǎng)絡(luò)系統(tǒng)在大規(guī)模集群環(huán)境中保持穩(wěn)定運(yùn)行,可支持跨POD組網(wǎng)及大規(guī)模并行訓(xùn)練任務(wù),為國(guó)產(chǎn)原生無(wú)損RDMA網(wǎng)絡(luò)在高端智算基礎(chǔ)設(shè)施中的應(yīng)用提供了實(shí)踐驗(yàn)證。
依托在高性能計(jì)算、存儲(chǔ)與網(wǎng)絡(luò)領(lǐng)域的長(zhǎng)期技術(shù)積累,中科曙光已逐步形成“算—存—網(wǎng)”協(xié)同發(fā)展的完整算力底座能力,為大規(guī)模AI基礎(chǔ)設(shè)施提供系統(tǒng)級(jí)支撐。隨著政府工作報(bào)告提出持續(xù)推進(jìn)“人工智能+”,算力基礎(chǔ)設(shè)施正進(jìn)入新一輪升級(jí)周期。國(guó)產(chǎn)原生RDMA網(wǎng)絡(luò)的落地,意味著我國(guó)在智算互聯(lián)這一關(guān)鍵環(huán)節(jié)開始形成自主技術(shù)路徑,補(bǔ)齊了我國(guó)智算基礎(chǔ)設(shè)施中的關(guān)鍵一環(huán)。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
海光 “鯨吞” 中科曙光,國(guó)產(chǎn)算力 “超級(jí)航母” 啟航!
,對(duì)中科曙光進(jìn)行換股吸收合并,同時(shí)還將發(fā)行 A 股股票募集配套資金。根據(jù)安排,兩家公司 A 股股票自 5 月 26 日起停牌,預(yù)計(jì)停牌時(shí)長(zhǎng)不超過(guò) 10 個(gè)交易日。 ? ? 值得關(guān)注的是,這是 5 月 16 日《上市公司重大資產(chǎn)重
中科曙光推出國(guó)產(chǎn)自研原生RDMA高速網(wǎng)絡(luò)scaleFabric
AI算力集群正加速向萬(wàn)卡、十萬(wàn)卡級(jí)規(guī)模迭代,高速互連網(wǎng)絡(luò)作為算力高效釋放的“神經(jīng)樞紐”,其性能、擴(kuò)展性與穩(wěn)定性直接決定集群整體效能。大規(guī)模集群組網(wǎng)需兼顧高帶寬、低延遲與無(wú)損傳輸,同時(shí)要適配算力指數(shù)級(jí)增長(zhǎng)的擴(kuò)展需求,還要控制組網(wǎng)成本與故障風(fēng)險(xiǎn),現(xiàn)有方案難以全面平衡這些核心訴
中科曙光獲得中國(guó)商飛上航公司感謝信
近日,中國(guó)商飛上海航空工業(yè)(集團(tuán))有限公司(簡(jiǎn)稱“上航公司”)向中科曙光發(fā)來(lái)感謝信,就曙光提供的國(guó)產(chǎn)高性能計(jì)算平臺(tái)等服務(wù)給予高度評(píng)價(jià),充分肯定了曙光
2025年中科曙光DeepAI深算智能引擎完成全面進(jìn)化
2025年,中科曙光DeepAI深算智能引擎完成了從技術(shù)突破到生態(tài)建設(shè)的全面進(jìn)化。從2月全球開發(fā)者先鋒大會(huì)的正式發(fā)布,到5月榮獲中國(guó)信通院權(quán)威認(rèn)證,再到9月世博會(huì)的全面開源開放,DeepAI正成為
總算力5EFLOPS!可擴(kuò)展至10萬(wàn)卡,國(guó)產(chǎn)算力集群部分性能超越NVL576
中國(guó)在高性能計(jì)算領(lǐng)域的又一次重大突破。 ? 中科曙光高級(jí)副總裁李斌表示,面對(duì)人工智能基礎(chǔ)設(shè)施對(duì)性能、效率、可靠性、可擴(kuò)展性等方面的極致需求,ScaleX萬(wàn)卡超集群在超節(jié)點(diǎn)架構(gòu)、高速互連
今日看點(diǎn):海光信息終止換股吸收合并中科曙光;國(guó)內(nèi)本土企業(yè)全球首發(fā)地磁能發(fā)電技術(shù)
海光信息終止換股吸收合并中科曙光 ? 日前,海光信息披露公告稱,公司決定終止重大資產(chǎn)重組。公告顯示,海光信息原擬通過(guò)向中科曙光全體A股換股股
發(fā)表于 12-10 10:22
?1702次閱讀
中科曙光以算力生態(tài)賦能行業(yè)創(chuàng)新
的特點(diǎn)?!伴僦蕖北澈髣t是由湖南匯視威科技依托中科曙光長(zhǎng)沙人工智能創(chuàng)新中心國(guó)產(chǎn)算力自主研發(fā)。在人工智能國(guó)產(chǎn)化浪潮中,中科
琶洲實(shí)驗(yàn)室與中科曙光達(dá)成多項(xiàng)合作共識(shí)
近日,一場(chǎng)關(guān)乎AI算力突破與產(chǎn)業(yè)落地的重要座談在中科曙光落下帷幕。中國(guó)科學(xué)院院士、琶洲實(shí)驗(yàn)室(黃埔)主任徐宗本,實(shí)驗(yàn)室副主任張海教授帶領(lǐng)核心團(tuán)隊(duì)專程到訪,與中科
中科曙光超智融合方案助力國(guó)產(chǎn)算力中心建設(shè)
近期,位于魯中南地區(qū)的某大型算力中心正式啟動(dòng)建設(shè),標(biāo)志著國(guó)產(chǎn)算力技術(shù)在該區(qū)域數(shù)字經(jīng)濟(jì)中的重要突破。該中心采用中科曙光“超智融合”方案,實(shí)現(xiàn)算力利用率提升40%目標(biāo),為區(qū)域數(shù)字經(jīng)濟(jì)發(fā)展注
達(dá)坦能源TAPP智能無(wú)線井下壓力監(jiān)測(cè)系統(tǒng)取得重大突破
近日,在陜北某區(qū)塊煤巖氣井測(cè)試中,達(dá)坦能源自主研發(fā)的TAPP智能無(wú)線井下壓力監(jiān)測(cè)系統(tǒng)取得重大突破。
中科曙光與中科星圖在太空計(jì)算領(lǐng)域達(dá)成合作
伴隨空天信息產(chǎn)業(yè)的高速發(fā)展,太空計(jì)算正成為戰(zhàn)略新興技術(shù)高地。在此背景下,近日,中科曙光與中科星圖在合肥“2025空天信息大會(huì)”上,簽署了《太空計(jì)算領(lǐng)域的合作開發(fā)框架協(xié)議》。按協(xié)議,雙方
中科曙光構(gòu)建全國(guó)產(chǎn)化基因組學(xué)高性能計(jì)算平臺(tái)
近日,中科曙光承建的國(guó)內(nèi)某研究所基因組學(xué)高性能計(jì)算平臺(tái)正式交付。這是國(guó)內(nèi)生物信息學(xué)領(lǐng)域首個(gè)從底層硬件到上層軟件實(shí)現(xiàn)完全自主可控,并深度融合高性能計(jì)算與人工智能算力的平臺(tái),成功填補(bǔ)了該領(lǐng)域國(guó)產(chǎn)高端算力的空白。
中科曙光亮相2025國(guó)際超級(jí)計(jì)算大會(huì)
多元發(fā)展的態(tài)勢(shì)。而中科曙光憑借“超智融合” 技術(shù)體系,已在石油勘探、生物信息等領(lǐng)域?qū)崿F(xiàn)多項(xiàng)國(guó)產(chǎn)首創(chuàng)突破,成為行業(yè)矚目焦點(diǎn)。
瑞風(fēng)協(xié)同與中科曙光達(dá)成深度合作
近日,瑞風(fēng)協(xié)同與中科曙光達(dá)成深度合作,雙方將圍繞aiEF大模型一體機(jī)展開全方位聯(lián)合研發(fā),旨在打造“AI+工業(yè)”領(lǐng)域標(biāo)桿解決方案。此次合作依托中科曙光
中軟國(guó)際在大型銀行AI項(xiàng)目領(lǐng)域?qū)崿F(xiàn)重大突破
近日,中軟國(guó)際成功中標(biāo)某全國(guó)性股份制銀行2025年大模型算力擴(kuò)容項(xiàng)目,標(biāo)志著中軟國(guó)際在大型銀行AI項(xiàng)目領(lǐng)域?qū)崿F(xiàn)重大突破,進(jìn)一步鞏固了其在金融科技領(lǐng)域的領(lǐng)先地位。
重大突破!中科曙光scaleFabric國(guó)產(chǎn)原生RDMA高速網(wǎng)絡(luò)首發(fā)
評(píng)論