91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Spectrum-XGS以太網(wǎng)如何實(shí)現(xiàn)跨區(qū)域網(wǎng)絡(luò)擴(kuò)展

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2025-09-29 16:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI 技術(shù)日益復(fù)雜,訓(xùn)練與推理領(lǐng)域的新進(jìn)展對數(shù)據(jù)中心提出了更高的要求。隨著數(shù)據(jù)中心算力的迅速提升,數(shù)據(jù)中心基礎(chǔ)設(shè)施逐漸受到了和算法和模型無關(guān)的基礎(chǔ)物理?xiàng)l件的限制,如電力供應(yīng)、散熱能力以及空間限制等,制約了 AI 工廠的物理擴(kuò)展。為了持續(xù)增長,在構(gòu)建新的數(shù)據(jù)中心時(shí),需要考慮通過遠(yuǎn)程互連技術(shù)將這些計(jì)算資源池化在一起,實(shí)現(xiàn)協(xié)同服務(wù)于單一訓(xùn)練任務(wù)或分離式推理工作負(fù)載。

傳統(tǒng)上,當(dāng)采用基于通用商業(yè)芯片構(gòu)建的遠(yuǎn)程互連以太網(wǎng)來連接多個(gè)數(shù)據(jù)中心時(shí),首要目標(biāo)是確保數(shù)據(jù)能夠準(zhǔn)確送達(dá)目的地。由于傳輸距離較長,延遲較高,導(dǎo)致網(wǎng)絡(luò)擁塞的概率顯著增加,其后果可能很嚴(yán)重。

為緩解這一挑戰(zhàn)并防止丟包,通用以太網(wǎng)供應(yīng)商采用了深度數(shù)據(jù)包緩存作為解決方案,以此來吸收網(wǎng)絡(luò)流量的大規(guī)模突發(fā),并已部署了這種方案。這種深度緩沖交換機(jī)雖適用于遠(yuǎn)程服務(wù)提供商和電信應(yīng)用,卻在 AI 應(yīng)用中出現(xiàn)了問題。

特別是,基于深度緩沖交換機(jī)的高延遲是其天然的弊病,此外,當(dāng)緩沖被填滿時(shí),就必須進(jìn)行排空。對于 AI 工作負(fù)載而言,這種情況發(fā)生的不可預(yù)測性,會導(dǎo)致大量的網(wǎng)絡(luò)抖動(dòng)或數(shù)據(jù)傳輸波動(dòng)。高延遲和這種網(wǎng)絡(luò)突發(fā)流量吸收技術(shù)帶來的不確定性,會影響訓(xùn)練和分離式推理的性能,因?yàn)檫@些任務(wù)本質(zhì)上是同步的,需要網(wǎng)絡(luò)提供穩(wěn)定且可預(yù)期的傳輸表現(xiàn)。

本文介紹了面向跨區(qū)域網(wǎng)絡(luò)的NVIDIA Spectrum-XGS 以太網(wǎng)技術(shù)是如何實(shí)現(xiàn)不同數(shù)據(jù)中心之間的互連,并提供滿足 AI 應(yīng)用所需的高性能。

什么是跨區(qū)域網(wǎng)絡(luò)?

跨區(qū)域網(wǎng)絡(luò)是一種新型的 AI 計(jì)算網(wǎng)絡(luò)互連架構(gòu),可被視為一個(gè)新維度,獨(dú)立于現(xiàn)有的縱向擴(kuò)展和橫向擴(kuò)展網(wǎng)絡(luò)。借助于跨區(qū)域網(wǎng)絡(luò)的 Spectrum-XGS 以太網(wǎng),不同規(guī)模和不同距離的多個(gè)數(shù)據(jù)中心能夠被整合為一個(gè)統(tǒng)一的大型 AI 工廠,首次實(shí)現(xiàn)了在跨地域的多個(gè)獨(dú)立的數(shù)據(jù)中心之間運(yùn)行大規(guī)模單 AI 訓(xùn)練與推理任務(wù)所需的網(wǎng)絡(luò)高性能。

e796a41c-9ac0-11f0-8c8f-92fbcf53809c.jpg

圖 1. AI 所需的三種網(wǎng)絡(luò)類型是縱向擴(kuò)展、橫向擴(kuò)展和跨區(qū)域擴(kuò)展

NVIDIA Spectrum-XGS 以太網(wǎng)如何實(shí)現(xiàn)跨區(qū)域網(wǎng)絡(luò)擴(kuò)展?

NVIDIA Spectrum-XGS 以太網(wǎng)是 NVIDIA Spectrum-X 以太網(wǎng)網(wǎng)絡(luò)平臺的一項(xiàng)新技術(shù)。它采用了同樣的 Spectrum-X 以太網(wǎng)交換機(jī)和 ConnectX-8 SuperNIC 硬件組合,以及和數(shù)據(jù)中心內(nèi)橫向擴(kuò)展網(wǎng)絡(luò)相同的軟件棧與通信庫。

借助 Spectrum-XGS 以太網(wǎng),AI 工廠之間可實(shí)現(xiàn)長距離連接,如 500 米以上的連接,這意味著實(shí)現(xiàn)園區(qū)內(nèi)不同建筑之間的連接,或者跨越數(shù)十乃至數(shù)百英里,實(shí)現(xiàn)跨城市、跨州乃至跨國之間的連接。為了支持這種跨區(qū)域擴(kuò)展的連接需求,保障高效帶寬與性能隔離的算法也必須持續(xù)發(fā)展。

距離感知算法在跨區(qū)域網(wǎng)絡(luò)擴(kuò)展中的作用是什么?

長距離傳輸數(shù)據(jù)面臨的主要挑戰(zhàn)之一是延遲的增加,即使數(shù)據(jù)以光的形式在光纖中傳播也是如此。數(shù)據(jù)在玻璃纖維中每傳輸 1 米需要 5 納秒,意味著每傳輸 1 公里需要 5 微秒。盡管這些數(shù)值看似微小,但在 GPU 之間的通信中,每微秒都至關(guān)重要。

Spectrum-XGS 以太網(wǎng)采用了改進(jìn)的基于遙測技術(shù)的擁塞控制與動(dòng)態(tài)路由算法,專門根據(jù)通信設(shè)備之間的距離進(jìn)行了優(yōu)化。在每次連接建立時(shí),網(wǎng)絡(luò)會知道相互連接的兩臺設(shè)備是在數(shù)據(jù)中心內(nèi),還是跨越數(shù)據(jù)中心。

這有助于交換機(jī)確定動(dòng)態(tài)路由負(fù)載均衡的最佳策略,并通知 SuperNIC 調(diào)整面向擁塞控制的數(shù)據(jù)注入速率。在網(wǎng)絡(luò)層面,這使得 Spectrum-XGS 以太網(wǎng)能夠高效處理通信,并避免額外延遲。

Spectrum-XGS 以太網(wǎng)技術(shù)在跨區(qū)域網(wǎng)絡(luò)方面具有多項(xiàng)顯著優(yōu)勢,包括:

集成、統(tǒng)一的網(wǎng)絡(luò)架構(gòu):Spectrum-X 以太網(wǎng)橫向擴(kuò)展和 Spectrum-XGS 以太網(wǎng)跨區(qū)域擴(kuò)展均基于相同的硬件、軟件和通信庫??梢怨ぷ髫?fù)載和網(wǎng)絡(luò)操作的統(tǒng)一管理,這是通用以太網(wǎng)無法實(shí)現(xiàn)的。

基于遙測的端到端擁塞控制:統(tǒng)一架構(gòu)還支持全局網(wǎng)絡(luò)可視化。借助來自數(shù)據(jù)中心內(nèi)外網(wǎng)絡(luò)的全面遙測數(shù)據(jù),無需深度緩沖交換即可實(shí)現(xiàn)基于遙測的擁塞控制。

智能、自動(dòng)調(diào)節(jié)負(fù)載均衡:Spectrum-X 以太網(wǎng) AI 網(wǎng)絡(luò)具有距離感知和 NVIDIA 集合通信庫(NCCL)-感知功能,能夠感知和補(bǔ)償由位置而導(dǎo)致的不同網(wǎng)絡(luò)流量模式,并動(dòng)態(tài)調(diào)整臨界值和限制,以確保最高的網(wǎng)絡(luò)性能。

更大限度地降低跨區(qū)域工作負(fù)載的延遲: Spectrum-XGS 以太網(wǎng)專為提供可預(yù)測的結(jié)果而進(jìn)行了優(yōu)化,這使網(wǎng)絡(luò)能夠感知和補(bǔ)償遠(yuǎn)距離傳輸?shù)臄?shù)據(jù)流,最大限度地減少延遲損失,且不存在深度緩沖帶來的抖動(dòng)風(fēng)險(xiǎn)。

彈性跨區(qū)域擴(kuò)展能力:由于相同的硬件被用于橫向擴(kuò)展和跨區(qū)域擴(kuò)展,因此可以重新分配網(wǎng)絡(luò)資源以支持?jǐn)?shù)據(jù)中心內(nèi)或數(shù)據(jù)中心間的流量。通用的淺緩沖以太網(wǎng)交換機(jī)無法被用于遠(yuǎn)程連接。

NVIDIA Spectrum-XGS 以太網(wǎng)有哪些性能優(yōu)勢?

為展示 NVIDIA Spectrum-XGS 以太網(wǎng)對跨區(qū)域擴(kuò)展性能的影響,NVIDIA 工程師在相距 10 公里的多點(diǎn)之間運(yùn)行了 NCCL 測試,并將其結(jié)果與通用以太網(wǎng)進(jìn)行了對比。如圖 2 所示,性能優(yōu)勢十分顯著:

e7f5179a-9ac0-11f0-8c8f-92fbcf53809c.jpg

圖 2. 與通用以太網(wǎng)相比,NVIDIA Spectrum-XGS 以太網(wǎng)可將性能提升高達(dá) 1.9 倍

相較通用以太網(wǎng),NVIDIA Spectrum-XGS 以太網(wǎng)可提供高達(dá) 1.9 倍的 NCCL All-Reduce 帶寬,特別是對于大消息,性能提升尤為顯著,而這正是 AI 訓(xùn)練工作負(fù)載中的典型場景。NCCL 性能的提升有助于縮短 AI 應(yīng)用的任務(wù)完成時(shí)間。

跨區(qū)域網(wǎng)絡(luò)如何提高AI 工廠的投資回報(bào)率?

NVIDIA Spectrum-XGS 以太網(wǎng)增強(qiáng)了 AI 基礎(chǔ)設(shè)施的靈活性。該技術(shù)使數(shù)據(jù)中心能夠在任意距離下實(shí)現(xiàn)高效通信,且不犧牲性能,從而構(gòu)建出可在橫向擴(kuò)展架構(gòu)與跨區(qū)域網(wǎng)絡(luò)擴(kuò)展之間共享的通用平臺。基于 Spectrum-XGS 以太網(wǎng)的多個(gè)以太網(wǎng)數(shù)據(jù)中心能夠被輕松整合為一個(gè)統(tǒng)一的整體,突破了地理位置的限制。

基于 Spectrum-XGS 構(gòu)建的以太網(wǎng)數(shù)據(jù)中心能夠被無縫整合為單一系統(tǒng)運(yùn)行,無論相距多遠(yuǎn)。這使得關(guān)鍵任務(wù)型 AI 基礎(chǔ)設(shè)施可以高效池化數(shù)據(jù)中心資源,持續(xù)為復(fù)雜 AI 工作負(fù)載提供價(jià)值。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 以太網(wǎng)
    +關(guān)注

    關(guān)注

    41

    文章

    5995

    瀏覽量

    180777
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    18

    文章

    5645

    瀏覽量

    75006
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39707

    瀏覽量

    301318

原文標(biāo)題:如何利用跨區(qū)域網(wǎng)絡(luò)將分布式數(shù)據(jù)中心連接成大型 AI 工廠

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA Spectrum-X以太網(wǎng)硅光技術(shù)助力AI工廠網(wǎng)絡(luò)創(chuàng)新

    NVIDIA 將率先為 AI 工廠引入采用光電一體封裝 (CPO) 的優(yōu)化以太網(wǎng)網(wǎng)絡(luò),通過 NVIDIA Spectrum-X 以太網(wǎng)硅光
    的頭像 發(fā)表于 01-14 09:06 ?604次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Spectrum</b>-X<b class='flag-5'>以太網(wǎng)</b>硅光技術(shù)助力AI工廠<b class='flag-5'>網(wǎng)絡(luò)</b>創(chuàng)新

    基于以太網(wǎng)芯片的應(yīng)用層方案

    聚焦于以沁恒微電子以太網(wǎng)芯片(如CH394/CH395及集成型MCU CH32V317等)為基礎(chǔ)構(gòu)建的多種高效應(yīng)用層方案,闡述其如何以簡化的硬件與低成本,實(shí)現(xiàn)豐富的網(wǎng)絡(luò)功能。
    的頭像 發(fā)表于 12-09 14:47 ?508次閱讀
    基于<b class='flag-5'>以太網(wǎng)</b>芯片的應(yīng)用層方案

    NVIDIA擴(kuò)大與微軟合作推動(dòng)AI超級工廠建設(shè)

    在 Microsoft Ignite 大會上,NVIDIA 擴(kuò)大與微軟的合作,包括在由 NVIDIA Blackwell 平臺驅(qū)動(dòng)的全新 Microsoft Fairwater AI 超級工廠中部署新一代 NVIDIA
    的頭像 發(fā)表于 12-01 09:52 ?789次閱讀

    NVIDIA Spectrum-X 以太網(wǎng)交換機(jī)助力 Meta 和 Oracle 加速網(wǎng)絡(luò)性能

    超大規(guī)模企業(yè)廣泛采用 NVIDIA 網(wǎng)絡(luò)解決方案,驅(qū)動(dòng)十億瓦級(Giga-Scale)高性能 AI 數(shù)據(jù)中心 Meta 推出基于 NVIDIA Spectrum
    的頭像 發(fā)表于 10-14 10:26 ?1788次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Spectrum</b>-X <b class='flag-5'>以太網(wǎng)</b>交換機(jī)助力 Meta 和 Oracle 加速<b class='flag-5'>網(wǎng)絡(luò)</b>性能

    移植網(wǎng)絡(luò)PHY芯片驅(qū)動(dòng),如何融入 rt-thread 的網(wǎng)絡(luò)體系,并添加新的以太網(wǎng)類型的報(bào)文?

    PHY 芯片最底層收發(fā)以太網(wǎng)報(bào)文,有可能組成 VLAN 網(wǎng)絡(luò)); 我要實(shí)現(xiàn)一個(gè)新的以太網(wǎng)類型報(bào)文(HPGP報(bào)文,以太網(wǎng)報(bào)文類型為 0x88
    發(fā)表于 09-22 06:11

    NVIDIA推出Spectrum-XGS以太網(wǎng)技術(shù)

    NVIDIA 今日宣布推出 NVIDIA Spectrum-XGS 以太網(wǎng)。這項(xiàng)跨區(qū)域擴(kuò)展(sc
    的頭像 發(fā)表于 08-27 12:51 ?1318次閱讀

    以太網(wǎng)入門:從零開始,掌握以太網(wǎng)基礎(chǔ)知識!

    以太網(wǎng)作為現(xiàn)代通信技術(shù)的基石,其重要性不言而喻。無論是日常網(wǎng)絡(luò)應(yīng)用,還是AI對高速大帶寬網(wǎng)絡(luò)的需求,以太網(wǎng)都扮演著不可或缺的角色。本文將從零開始,帶您了解
    的頭像 發(fā)表于 06-09 14:00 ?4117次閱讀
    <b class='flag-5'>以太網(wǎng)</b>入門:從零開始,掌握<b class='flag-5'>以太網(wǎng)</b>基礎(chǔ)知識!

    雙通道CAN轉(zhuǎn)以太網(wǎng)#CAN轉(zhuǎn)以太網(wǎng)#三格電子

    以太網(wǎng)
    三格電子科技
    發(fā)布于 :2025年05月12日 13:17:05

    AD9574以太網(wǎng) 千兆以太網(wǎng)時(shí)鐘發(fā)生器技術(shù)手冊

    AD9574具有多路輸出時(shí)鐘發(fā)生器功能,內(nèi)置專用鎖相環(huán)(PLL)內(nèi)核,針對以太網(wǎng)和千兆以太網(wǎng)線路卡應(yīng)用進(jìn)行了優(yōu)化。 整數(shù)N PLL設(shè)計(jì)基于ADI公司成熟的高性能、低抖動(dòng)頻率合成器產(chǎn)品系列,確保實(shí)現(xiàn)高的
    的頭像 發(fā)表于 04-10 10:43 ?1096次閱讀
    AD9574<b class='flag-5'>以太網(wǎng)</b> 千兆<b class='flag-5'>以太網(wǎng)</b>時(shí)鐘發(fā)生器技術(shù)手冊

    NVIDIA推出全新硅光網(wǎng)絡(luò)交換機(jī)

    NVIDIA 今天推出了 NVIDIA Spectrum-X 和 NVIDIA Quantum-X 硅光網(wǎng)絡(luò)交換機(jī),使 AI 工廠能夠
    的頭像 發(fā)表于 03-20 14:52 ?993次閱讀

    廣成科技CAN轉(zhuǎn)以太網(wǎng)模塊的作用和應(yīng)用

    CAN轉(zhuǎn)以太網(wǎng)模塊是一類能夠?qū)AN總線數(shù)據(jù)轉(zhuǎn)換為以太網(wǎng)數(shù)據(jù)的設(shè)備,通常用于實(shí)現(xiàn)CAN總線與以太網(wǎng)總線之間的互聯(lián)互通。在智能鎖柜和智能文件交換箱中,CAN轉(zhuǎn)
    的頭像 發(fā)表于 03-20 13:58 ?1347次閱讀
    廣成科技CAN轉(zhuǎn)<b class='flag-5'>以太網(wǎng)</b>模塊的作用和應(yīng)用

    Spectrum推出可由以太網(wǎng)控制的超高速GHz數(shù)字化儀

    GHz(千兆赫)范圍內(nèi)將信號的自動(dòng)采集與分析變得更加簡單。通過一根以太網(wǎng)/LXI線,DN2.33x系列產(chǎn)品能夠與臺式機(jī)、筆記本電腦甚至公司網(wǎng)絡(luò)連接。此外,這些儀器體積小、重量輕,非常便于攜帶。新產(chǎn)品使用了
    的頭像 發(fā)表于 03-12 14:57 ?684次閱讀
    <b class='flag-5'>Spectrum</b>推出可由<b class='flag-5'>以太網(wǎng)</b>控制的超高速GHz數(shù)字化儀