91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

光通信+分布式架構(gòu),突破傳統(tǒng)網(wǎng)絡(luò)架構(gòu)瓶頸

Hobby觀察 ? 來源:電子發(fā)燒友 ? 作者:綜合報道 ? 2025-06-20 09:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)綜合報道,隨著大語言模型(LLM)參數(shù)規(guī)模突破萬億級,傳統(tǒng)數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)(如NVL、TPUv4、SiP-Ring)逐漸暴露出瓶頸。

傳統(tǒng)方案依賴昂貴的交換機(如NVIDIA的NVLink Switch)或光學(xué)電路(如TPUv4的OCS),其成本隨集群規(guī)模呈指數(shù)級增長。例如,NVLink Switch單臺成本高達數(shù)萬美元,且僅支持單節(jié)點級擴展(如DGX H100集群最多8-GPU互聯(lián))。TPUv4雖采用光學(xué)環(huán)形網(wǎng)絡(luò),但其OCS交換機需定制化光纖布線,限制了跨Pod級擴展能力。

由于拓撲限制,單個GPU故障可能引發(fā)級聯(lián)失效。以SiP-Ring為例,其靜態(tài)環(huán)形拓撲要求所有節(jié)點嚴格同步,若某一節(jié)點故障,整個TP組需重新初始化,導(dǎo)致GPU浪費率高達37%(TP-64場景)。NVL架構(gòu)中,單節(jié)點故障甚至?xí)袛嗳?a href="http://m.makelele.cn/v/tag/1301/" target="_blank">通信,迫使作業(yè)暫停重試。

跨ToR(Top of Rack)通信也成為網(wǎng)絡(luò)架構(gòu)的性能瓶頸。研究顯示,GPT-3訓(xùn)練任務(wù)中35%的通信流量為跨機架傳輸,導(dǎo)致網(wǎng)絡(luò)擁塞,帶寬利用率不足40%。傳統(tǒng)Fat-Tree拓撲雖支持高帶寬,但其樹狀結(jié)構(gòu)易在核心層形成熱點,限制了大規(guī)模并行效率。

為了解決這些問題,最近,曦智科技聯(lián)合北京大學(xué)、階躍星辰的研究團隊提出了一種以光交換(OCS)模組為中心的高帶寬域架構(gòu)InfiniteHBD。InfinitePOD通過無交換機架構(gòu)設(shè)計 、動態(tài)拓撲編排算法和光通信技術(shù)優(yōu)化 ,系統(tǒng)性解決了現(xiàn)有的問題。

InfinitePOD采用分布式節(jié)點直連網(wǎng)絡(luò),每個GPU節(jié)點配備QSFP-DD OCSTrx光模塊(51.2Tbps帶寬),通過預(yù)定義光纖鏈路實現(xiàn)跨ToR的3跳內(nèi)直連??梢允∪S媒粨Q機,僅使用標(biāo)準化光模塊,單節(jié)點互連成本下降60%。

同時物理層支持任意規(guī)模集群互聯(lián),實驗驗證可擴展至65536 GPU,遠超NVL(16384 GPU)和TPUv4(單Pod級)。在拓撲靈活性上,通過軟件動態(tài)配置通信組,支持K-Hop Ring(環(huán)形)和K-Hop Line(線性)等拓撲,適配TP、DP、PP等不同并行策略。

InfinitePOD采用了兩階段部署機制,首先是物理層預(yù)定義,在部署階段規(guī)劃節(jié)點間3跳光纖連接,形成Rail-Optimized拓撲,減少跨機架流量;在運行時動態(tài)編排,基于圖切割算法(Graph Partitioning)和貪心策略,實時調(diào)整通信組拓撲。

容錯機制上,當(dāng)GPU故障時,編排算法自動重構(gòu)通信路徑,僅隔離故障節(jié)點而不影響全局。實驗表明,在TP-64場景下,GPU浪費率從NVL的24%降至11%,作業(yè)中斷概率降低72%。

在光通信技術(shù)上,InfinitePOD采用QSFP-DD OCSTrx光模塊,光模塊基于曦智科技硅光子技術(shù)的分布式光交換dOCS,將基于馬赫曾德(MZI,Mach-Zehnder Interferometer)交換矩陣的光交換芯片集成到商用QSFP-DD 800Gbps光電轉(zhuǎn)換模組中,大幅簡化了器件結(jié)構(gòu)的同時,有效提升了器件集成度,從而降低了成本和功耗,顯著提升了InfiniteHBD的性價比和系統(tǒng)可擴展性。

同時采用Rail-Optimized拓撲,針對機架間通信優(yōu)化,通過3跳內(nèi)光纖直連實現(xiàn)流量局部化 ,AllReduce帶寬利用率提升至77.26%,接近理論極限。

InfinitePOD的核心價值在于將光通信技術(shù)與分布式架構(gòu)深度融合 ,通過“硬件簡化+軟件智能”的設(shè)計理念,重新定義了高帶寬數(shù)據(jù)中心網(wǎng)絡(luò)。盡管當(dāng)前方案仍需解決長距離光信號衰減和模塊功耗問題,但其開創(chuàng)性的設(shè)計已為下一代數(shù)據(jù)中心網(wǎng)絡(luò)指明方向——去中心化、軟硬協(xié)同、極致擴展 。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 光通信
    +關(guān)注

    關(guān)注

    20

    文章

    1003

    瀏覽量

    35381
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    機載系統(tǒng)智能化的基石:分布式網(wǎng)絡(luò)控制系統(tǒng)與容器虛擬化技術(shù)的深度融合實踐

    創(chuàng)新的“云-邊-端”分布式智能架構(gòu),該架構(gòu)深度融合了分布式綜合模塊化航電系統(tǒng)、邊緣計算、容器化軟件及確定性網(wǎng)絡(luò)等前沿技術(shù)。
    的頭像 發(fā)表于 01-27 09:13 ?500次閱讀
    機載系統(tǒng)智能化的基石:<b class='flag-5'>分布式</b><b class='flag-5'>網(wǎng)絡(luò)</b>控制系統(tǒng)與容器虛擬化技術(shù)的深度融合實踐

    德州儀器(TI)解讀汽車區(qū)域架構(gòu)中的 TSN:啟用以太網(wǎng)環(huán)形架構(gòu)和 AVB 分布式音頻

    德州儀器(TI)解讀汽車區(qū)域架構(gòu)中的 TSN:啟用以太網(wǎng)環(huán)形架構(gòu)和 AVB 分布式音頻
    的頭像 發(fā)表于 12-24 18:10 ?1.2w次閱讀
    德州儀器(TI)解讀汽車區(qū)域<b class='flag-5'>架構(gòu)</b>中的 TSN:啟用以太網(wǎng)環(huán)形<b class='flag-5'>架構(gòu)</b>和 AVB <b class='flag-5'>分布式</b>音頻

    基于I3C分布式總線架構(gòu)的人形機器人靈巧手方案

    最復(fù)雜、最精密和最關(guān)鍵的執(zhí)行器,成為人形機器人發(fā)展的核心方向之一,它不僅需要具備高自由度的運動能力,還要實現(xiàn)對力和位置的精準控制,以模擬人手的操作行為。 ? 挑戰(zhàn):傳統(tǒng)通信方式在分布式架構(gòu)中的
    發(fā)表于 10-27 17:28 ?1892次閱讀
    基于I3C<b class='flag-5'>分布式</b>總線<b class='flag-5'>架構(gòu)</b>的人形機器人靈巧手方案

    從 “單一控制” 到 “智能可視”:分布式系統(tǒng)與傳統(tǒng)音視頻控制系統(tǒng)的關(guān)鍵區(qū)別

    分布式可視化控制系統(tǒng)與傳統(tǒng)的音視頻控制系統(tǒng)的區(qū)別主要體現(xiàn)在以下幾個方面: 1.系統(tǒng)架構(gòu)分布式可視化控制系統(tǒng)采用分布式
    的頭像 發(fā)表于 10-21 10:52 ?387次閱讀

    分布式光伏環(huán)境監(jiān)測站的技術(shù)架構(gòu)與應(yīng)用實踐

    分布式光伏環(huán)境監(jiān)測站的技術(shù)架構(gòu)與應(yīng)用實踐 柏峰【BF-GFQX】一、系統(tǒng)技術(shù)架構(gòu)解析 分布式光伏環(huán)境監(jiān)測站采用“感知層-傳輸層-應(yīng)用層”三層架構(gòu)
    的頭像 發(fā)表于 10-13 10:05 ?574次閱讀
    <b class='flag-5'>分布式</b>光伏環(huán)境監(jiān)測站的技術(shù)<b class='flag-5'>架構(gòu)</b>與應(yīng)用實踐

    關(guān)于AI 數(shù)據(jù)中心時代的光通信的精選問答

    模塊技術(shù)的融合與演進。AI 數(shù)據(jù)中心的持續(xù)擴張正以前所未有的速度推動光通信升級。隨著算力需求每年以十倍速增長,僅靠芯片提升已難以為繼,網(wǎng)絡(luò)架構(gòu)的革新變得尤為關(guān)鍵。Scale-up 與 Scale-out 的多樣化
    的頭像 發(fā)表于 09-12 10:42 ?722次閱讀

    【節(jié)能學(xué)院】Acrel-1000DP分布式光伏監(jiān)控系統(tǒng)在奉賢平高食品 4.4MW 分布式光伏中應(yīng)用

    摘要:在“雙碳”和新型電力系統(tǒng)建設(shè)背景下,分布式光伏接入比例不斷提高,對配電網(wǎng)電壓、調(diào)度運行及調(diào)峰等環(huán)節(jié)造成強烈沖擊。本文設(shè)計包含平臺層、設(shè)備層二層架構(gòu)體系的分布式光伏管控平臺,以及小容量工商業(yè)
    的頭像 發(fā)表于 08-23 08:04 ?3484次閱讀
    【節(jié)能學(xué)院】Acrel-1000DP<b class='flag-5'>分布式</b>光伏監(jiān)控系統(tǒng)在奉賢平高食品 4.4MW <b class='flag-5'>分布式</b>光伏中應(yīng)用

    大規(guī)模部署(如分布式光伏集群)時,裝置的通信網(wǎng)絡(luò)易出現(xiàn)哪些瓶頸(如擁堵、延遲

    LZ-DZ200A側(cè)面 在大規(guī)模分布式光伏集群等場景中,裝置通信網(wǎng)絡(luò)瓶頸主要源于節(jié)點規(guī)模激增、數(shù)據(jù)量暴增、環(huán)境復(fù)雜等特點,具體可從以下維度分析: 一、節(jié)點規(guī)模與接入層擁堵 分布式光伏
    的頭像 發(fā)表于 08-22 09:50 ?856次閱讀
    大規(guī)模部署(如<b class='flag-5'>分布式</b>光伏集群)時,裝置的<b class='flag-5'>通信網(wǎng)絡(luò)</b>易出現(xiàn)哪些<b class='flag-5'>瓶頸</b>(如擁堵、延遲

    宏集分享 | 集中式架構(gòu)還是分布式架構(gòu)?SCADA架構(gòu)選型的新趨勢

    HongraxIIoT在工業(yè)數(shù)字化不斷推進的今天,SCADA系統(tǒng)早已不僅是簡單的數(shù)據(jù)監(jiān)控工具,它正在成為保障企業(yè)運行效率、安全性和業(yè)務(wù)連續(xù)性的戰(zhàn)略核心。而“選擇集中式、分布式還是混合式架構(gòu)?”也正
    的頭像 發(fā)表于 08-08 18:15 ?659次閱讀
    宏集分享 | 集中式<b class='flag-5'>架構(gòu)</b>還是<b class='flag-5'>分布式</b><b class='flag-5'>架構(gòu)</b>?SCADA<b class='flag-5'>架構(gòu)</b>選型的新趨勢

    攜手共探無線光通信新未來!六博光電邀您相聚第六屆無線光通信理論與組網(wǎng)技術(shù)論壇

    通信技術(shù)飛速發(fā)展的今天,無線光通信憑借高速、大容量、低延遲和高安全性等顯著優(yōu)勢,成為突破當(dāng)前通信網(wǎng)絡(luò)瓶頸、推動
    的頭像 發(fā)表于 07-10 17:17 ?820次閱讀
    攜手共探無線<b class='flag-5'>光通信</b>新未來!六博光電邀您相聚第六屆無線<b class='flag-5'>光通信</b>理論與組網(wǎng)技術(shù)論壇

    多節(jié)點并行處理架構(gòu)

    /GPU)、內(nèi)存及本地存儲,節(jié)點間通過高速網(wǎng)絡(luò)通信,避免資源爭用,提升擴展性。 數(shù)據(jù)水平分片? 海量數(shù)據(jù)被分割存儲在不同節(jié)點,查詢時各節(jié)點并行處理本地數(shù)據(jù),最后匯總結(jié)果(如Doris、ClickHouse)。 分布式任務(wù)調(diào)度? 協(xié)調(diào)節(jié)點將任務(wù)分解為子任務(wù)分發(fā)至各計
    的頭像 發(fā)表于 06-12 08:18 ?622次閱讀
    多節(jié)點并行處理<b class='flag-5'>架構(gòu)</b>

    突破精度極限,賦能光通信未來——武漢昊衡科技OLI光纖微裂紋檢測儀引領(lǐng)行業(yè)革新

    光通信網(wǎng)絡(luò)高速發(fā)展的今天,光纖及光器件的質(zhì)量直接決定了通信系統(tǒng)的穩(wěn)定性和傳輸效率。然而,傳統(tǒng)檢測技術(shù)受限于精度不足、效率低下等問題,難以滿足日益嚴苛的行業(yè)需求。武漢昊衡科技有限公司憑借深厚的技術(shù)積累
    的頭像 發(fā)表于 06-05 17:31 ?2581次閱讀
    <b class='flag-5'>突破</b>精度極限,賦能<b class='flag-5'>光通信</b>未來——武漢昊衡科技OLI光纖微裂紋檢測儀引領(lǐng)行業(yè)革新

    見合八方邀您相約2025國際光通信網(wǎng)絡(luò)會議

    第二十三屆IEEE國際光通信網(wǎng)絡(luò)會議(ICOCN 2025) 將于7月份在中國張家界啟幕!天津見合八方與ICOCN 2025聯(lián)手深度合作,共同打造一場 “產(chǎn)學(xué)研用”全鏈貫通的全球光通信盛宴。
    的頭像 發(fā)表于 05-26 15:04 ?1543次閱讀

    六博光電船載激光通信系統(tǒng):開啟水上高速通信新紀元

    在浩瀚水域中實現(xiàn)穩(wěn)定、高速的無線通信,一直是海洋監(jiān)測、應(yīng)急救援及水上作業(yè)領(lǐng)域的技術(shù)難點。傳統(tǒng)射頻通信易受干擾、帶寬有限,而衛(wèi)星通信則面臨高延遲、高成本的
    的頭像 發(fā)表于 04-01 09:15 ?1063次閱讀
    六博光電船載激<b class='flag-5'>光通信</b>系統(tǒng):開啟水上高速<b class='flag-5'>通信</b>新紀元

    六博光電支持OpenVLC推出高性價比可見光通信模組

    在科技飛速發(fā)展的今天,通信技術(shù)領(lǐng)域不斷涌現(xiàn)出創(chuàng)新成果??梢?b class='flag-5'>光通信(VisibleLightCommunication,VLC)作為一種極具潛力的新興通信技術(shù),正逐漸走進人們的視野。六博光電致力于無線
    的頭像 發(fā)表于 03-14 09:52 ?1306次閱讀
    六博光電支持OpenVLC推出高性價比可見<b class='flag-5'>光通信</b>模組