91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ECN如何在HPC和數(shù)據(jù)中心中應(yīng)對網(wǎng)絡(luò)擁塞

星融元Asterfusion ? 2025-09-26 14:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

網(wǎng)絡(luò)通信中,擁塞是一個常見的問題,尤其是在高負(fù)載時期或網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)不完善的情況下。傳統(tǒng)的擁塞控制方法主要通過丟包來指示網(wǎng)絡(luò)擁塞,當(dāng)路由器的緩沖區(qū)滿時,會丟棄數(shù)據(jù)包,發(fā)送方通過檢測丟失的數(shù)據(jù)包來進(jìn)行擁塞控制。然而,丟包會導(dǎo)致重傳,增加網(wǎng)絡(luò)負(fù)擔(dān),降低網(wǎng)絡(luò)性能。

ECN(Explicit Congestion Notification)是一種改進(jìn)后的擁塞控制方法,它不依賴于丟包來指示擁塞,而是在數(shù)據(jù)包的頭部標(biāo)記擁塞發(fā)生的信號。ECN通過向數(shù)據(jù)包的 IP 頭部添加一個特殊的標(biāo)記位告知發(fā)送方網(wǎng)絡(luò)發(fā)生了擁塞。

ECN的工作原理

ECN 的工作原理可以分為三個主要階段:標(biāo)記、回傳、響應(yīng)。

標(biāo)記(第一階段):當(dāng)路由器的緩沖區(qū)開始出現(xiàn)擁塞時,它會檢查傳入的數(shù)據(jù)包。如果緩沖區(qū)超過了某個閾值,路由器會修改數(shù)據(jù)包的 IP 頭部,在其中設(shè)置 ECN 位,表示網(wǎng)絡(luò)出現(xiàn)了擁塞。

回傳(第二階段):標(biāo)記了 ECN 位的數(shù)據(jù)包繼續(xù)在網(wǎng)絡(luò)中傳輸,它們不會被丟棄。這使得接收方能夠收到所有數(shù)據(jù)包,無需等待重傳。

響應(yīng)(第三階段):接收方收到帶有 ECN 標(biāo)記的數(shù)據(jù)包后,會向發(fā)送方發(fā)送一條特殊的通知(CNP),告知發(fā)送方網(wǎng)絡(luò)發(fā)生了擁塞。發(fā)送方收到通知后,會根據(jù)接收方的指示適當(dāng)調(diào)整發(fā)送速率,以降低網(wǎng)絡(luò)擁塞的程度。

通過這種方式,ECN 可以更及時地指示網(wǎng)絡(luò)擁塞,并且避免了丟包帶來的額外開銷,從而提高了網(wǎng)絡(luò)的性能和效率。

ECN在網(wǎng)絡(luò)層的實(shí)現(xiàn)

ECN在IP頭部中需要2個比特位來承載信息,它在IPv4位于IP頭部TOS字段中,示意圖如下:

wKgZPGjWNcqAfmHaAAEW0xc5a2o479.png

(Differentiated Services Field (區(qū)分服務(wù)領(lǐng)域):DS Field的兩個部分DSCP和CU組合成一個可擴(kuò)展性相對較強(qiáng)的方法以此來保證IP的服務(wù)質(zhì)量。)

ECN在 IPv4 和 IPv6 頭部中的位置和功能是類似的,但由于兩者頭部結(jié)構(gòu)不同,其具體位置也存在差異。如下表:

特性維度IPv4IPv6
?頭部結(jié)構(gòu)?可變長度頭部(通常20字節(jié),可帶選項(xiàng))固定40字節(jié)基本頭部,擴(kuò)展功能通過擴(kuò)展頭部實(shí)現(xiàn)
?ECN字段位置?重新定義的 ?ToS(服務(wù)類型)字節(jié)的后2位(第7-8位)?Traffic Class(流量類別)字節(jié)的后2位(第7-8位)
?ECN字段大小?2比特2比特
?ECN碼點(diǎn)含義?00: Non-ECT (不支持ECN)
01: ECT(1) (支持ECN)
10: ECT(0) (支持ECN)
11: CE (經(jīng)歷擁塞)
00: Non-ECT (不支持ECN)
01: ECT(1) (支持ECN)
10: ECT(0) (支持ECN)
11: CE (經(jīng)歷擁塞)
?所屬字段?該8位字段前6位為DS(差分服務(wù))字段,后2位為ECN字段?(如圖)該8位字段前6位為Traffic Class字段,后2位為ECN字段?

支持ECN的標(biāo)識

支持ECN的發(fā)送端(如服務(wù)器)在發(fā)出IP數(shù)據(jù)包時,會將其IP頭部的ECN字段設(shè)置為 ECT(0)或 ECT(1)。這相當(dāng)于向網(wǎng)絡(luò)宣告:“我這個數(shù)據(jù)包是可以被ECN標(biāo)記的,如果遇到擁塞,請標(biāo)記我,不要丟棄我。”

擁塞標(biāo)記

當(dāng)支持ECN的網(wǎng)絡(luò)設(shè)備(如路由器、交換機(jī))檢測到其緩沖區(qū)隊列開始出現(xiàn)擁塞(但尚未滿到需要丟包的程度)時,它會檢查正在通過的數(shù)據(jù)包的ECN字段。如果該字段是 ECT(0)或 ECT(1),設(shè)備就會將其修改成 CE (11)。這個動作是ECN的核心—顯式擁塞通知。

信息回傳

接收端收到帶有 CE 標(biāo)記的數(shù)據(jù)包后,會通過其傳輸層協(xié)議(如 TCP ACK 包中的 ECN-Echo 標(biāo)志位)通知發(fā)送端。發(fā)送端接到通知后,便會像檢測到丟包一樣降低發(fā)送速率,從而緩解擁塞。

ECN在傳輸層的實(shí)現(xiàn)

TCP

ECN在傳輸層的實(shí)現(xiàn),是其發(fā)揮“端到端”擁塞控制作用的關(guān)鍵一環(huán)。在數(shù)據(jù)傳輸前,發(fā)送方和接收方必須通過三次握手 (Three-Way Handshake) 建立一個穩(wěn)定的連接。TCP協(xié)議負(fù)責(zé)接收來自網(wǎng)絡(luò)層(IP)的擁塞信號,并將其反饋給發(fā)送方,最終觸發(fā)發(fā)送方的速率調(diào)整。

TCP 通過其首部中的兩個標(biāo)志位來實(shí)現(xiàn) ECN 功能。

wKgZPGjWNqmAGR3MAAEtXpmtqDI626.png

這2位有4種可能組合,每種組合被稱為碼點(diǎn)

CWRECE碼點(diǎn)發(fā)送自目標(biāo)
100Non-ECN set up任意任意
201ECN Echo接收方發(fā)送方
310Congestion window reduced發(fā)送方接收方
411ECN Setup發(fā)送方接收方
  • ECE (ECN-Echo):用于接收方向發(fā)送方回顯擁塞通知。當(dāng)接收方收到一個被網(wǎng)絡(luò)設(shè)備標(biāo)記為擁塞體驗(yàn)(CE)的數(shù)據(jù)包時(接上一節(jié)內(nèi)容),它會在后續(xù)返回的 ACK 包中設(shè)置 ECE=1,以此通知發(fā)送方網(wǎng)絡(luò)發(fā)生了擁塞。
  • CWR (Congestion Window Reduced):用于發(fā)送方向接收方確認(rèn)已降低發(fā)送速率。當(dāng)發(fā)送方收到一個 ECE=1 的 ACK 包并做出降速響應(yīng)后,它會在下一個數(shù)據(jù)包中設(shè)置 CWR=1,以此告知接收方:“我已收到擁塞通知并已采取行動”。

UDP

UDP也是網(wǎng)絡(luò)中傳輸層的一個核心協(xié)議,那么它和TCP的區(qū)別又是什么呢?

特性UDP (用戶數(shù)據(jù)報協(xié)議)TCP (傳輸控制協(xié)議)
?連接性??無連接?
發(fā)送數(shù)據(jù)前無需建立連接,直接發(fā)送。
?面向連接?
通信前需通過“三次握手”建立可靠連接。
?可靠性??不可靠?
不保證數(shù)據(jù)包順序、不重傳丟失或出錯包。
?可靠?
通過確認(rèn)、重傳等機(jī)制確保數(shù)據(jù)正確有序送達(dá)。
?控制機(jī)制?無流量控制、無擁塞控制。有復(fù)雜的流量控制和擁塞控制機(jī)制(如滑動窗口)。
?數(shù)據(jù)單元??面向報文?
應(yīng)用層交給UDP多長的報文,UDP就發(fā)送多長。
?面向字節(jié)流?
將數(shù)據(jù)視為無結(jié)構(gòu)的字節(jié)流進(jìn)行傳輸。
?速度開銷??傳輸速度快?
頭部開銷小(固定8字節(jié)),延遲低。
相對較慢
頭部開銷大(最小20字節(jié)),延遲較高。
?適用場景?實(shí)時應(yīng)用:音視頻通話、直播、在線游戲、DNS查詢等。可靠性要求高的應(yīng)用:文件傳輸、網(wǎng)頁瀏覽、郵件等。
wKgZPGjWNvuABcJcAACDIy1UNn4950.png

UDP 本身是無連接、無狀態(tài)的協(xié)議,不像 TCP 那樣有復(fù)雜的確認(rèn)和重傳機(jī)制。因此,ECN 在 UDP 中的實(shí)現(xiàn)方式與 TCP 不同,通常需要應(yīng)用程序的更多參與或依賴配套的反饋協(xié)議。

發(fā)送方(應(yīng)用程序)需要通過特定的 API(如 IP_ECNsocket 選項(xiàng))來檢測路徑是否支持 ECN,并在發(fā)出的 UDP 數(shù)據(jù)包的 IP 頭部設(shè)置 ECT 碼點(diǎn)(ECT(0) 或 ECT(1)),表明該數(shù)據(jù)包支持 ECN。

當(dāng)支持 ECN 的網(wǎng)絡(luò)設(shè)備將 UDP 數(shù)據(jù)包標(biāo)記為 CE 后,接收方需要檢測到這一標(biāo)記。由于 UDP 沒有類似 TCP 的 ACK 機(jī)制,接收方需要生成一個專門的 CNP (Congestion Notification Packet, 擁塞通知報文),CNP報文內(nèi)部會攜帶引發(fā)擁塞的原始數(shù)據(jù)流的關(guān)鍵信息(源和目標(biāo)IP地址、傳輸層端口號、擁塞程度信息、QP(Queue Pair)信息),并將其發(fā)送回源發(fā)送方。發(fā)送方在收到 CNP 后,需要主動降低數(shù)據(jù)發(fā)送速率。

wKgZPGjWN9GAevvzAAB4GeEolDM007.png

ECN在RDMA中的實(shí)現(xiàn)方式

在高性能計算和數(shù)據(jù)中心環(huán)境中,RoCEv2 也廣泛使用 ECN。其實(shí)現(xiàn)方式與 UDP 類似,因?yàn)?RoCEv2 運(yùn)行在 UDP 之上。

支持 ECN 的交換機(jī)在檢測到擁塞時,會標(biāo)記 RoCEv2 數(shù)據(jù)包的 IP 頭 ECN 字段為 CE。接收端網(wǎng)卡生成專門的 CNP(擁塞通知報文),其中包含導(dǎo)致?lián)砣牧髁吭葱畔?,CNP 被發(fā)送回引發(fā)擁塞的發(fā)送端主機(jī),發(fā)送端主機(jī)收到 CNP 后,會根據(jù)DCQCN(數(shù)據(jù)中心量化擁塞通知) 等算法調(diào)整相應(yīng)數(shù)據(jù)流的發(fā)送速率。

智算中心的硬件核心在于為 RoCEv2提供穩(wěn)定、高性能的無損網(wǎng)絡(luò)環(huán)境。這不僅需要網(wǎng)卡支持,更需要交換機(jī)的深度配合。CX-N系列數(shù)據(jù)中心交換機(jī)通過其超低時延、無損網(wǎng)絡(luò)技術(shù)、對大容量緩存的優(yōu)化、高級遙測功能以及對自動化運(yùn)維的支持,為DCQCN協(xié)議在AI計算、高性能計算等場景中的高效、穩(wěn)定運(yùn)行提供了堅實(shí)的硬件基礎(chǔ)。

wKgZO2jHi6uAW31NAAPH9niMZ4o418.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    透視數(shù)據(jù)中心中的25G、50G和100G技術(shù)

    企業(yè)和云級網(wǎng)絡(luò)數(shù)據(jù)中心中各種“G”比比皆是,是時候搞清楚他們的性能了。
    發(fā)表于 12-18 09:52 ?2259次閱讀

    適用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡(luò)

    數(shù)據(jù)中心依賴數(shù)千甚至上萬個GPU集群進(jìn)行高性能計算,對帶寬、延遲和數(shù)據(jù)交換效率提出極高要求。 AI云:以生成式AI為核心的云平臺,為多租戶環(huán)境提供推理服務(wù)。這類數(shù)據(jù)中心要求網(wǎng)絡(luò)
    發(fā)表于 03-25 17:35

    PCIe協(xié)議分析儀在數(shù)據(jù)中心中有何作用?

    調(diào)度不合理、硬件限制),指導(dǎo)優(yōu)化拓?fù)浣Y(jié)構(gòu)或升級硬件(如從Gen4升級至Gen5)。 流量調(diào)度與QoS優(yōu)化 場景:多租戶數(shù)據(jù)中心中,不同業(yè)務(wù)(如HPC、AI、存儲)共享PCIe資源,需避免低優(yōu)先級流量
    發(fā)表于 07-29 15:02

    透視數(shù)據(jù)中心中的25G/50G和100G技術(shù)看完你就懂了

    透視數(shù)據(jù)中心中的25G/50G和100G技術(shù)看完你就懂了
    發(fā)表于 05-20 06:41

    數(shù)據(jù)中心太耗電怎么辦

    !》,原文作者:啟明 。一、3 年電費(fèi)消耗,可再建造一個數(shù)據(jù)中心!1.1 科技驅(qū)動,推動數(shù)據(jù)中心市場持續(xù)高速發(fā)展國際慣例,先介(bai)紹(du)一(bai)下(ke)“數(shù)據(jù)中心”:數(shù)據(jù)中心
    發(fā)表于 06-30 06:27

    數(shù)據(jù)中心是什么

    數(shù)據(jù)中心是什么:數(shù)據(jù)中心是全球協(xié)作的特定設(shè)備網(wǎng)絡(luò),用來在因特網(wǎng)絡(luò)基礎(chǔ)設(shè)施上傳遞、加速、展示、計算、存儲數(shù)據(jù)信息。
    發(fā)表于 07-12 07:10

    數(shù)據(jù)中心網(wǎng)絡(luò)進(jìn)行監(jiān)控和管理如何操作

    數(shù)據(jù)中心網(wǎng)絡(luò)進(jìn)行監(jiān)控和管理如何操作 任何數(shù)據(jù)中心中最重要的任務(wù)之一都是對網(wǎng)絡(luò)設(shè)備,服務(wù)器和數(shù)據(jù)中心本身的監(jiān)控。企業(yè)通常
    發(fā)表于 01-21 12:01 ?607次閱讀

    數(shù)據(jù)中心中網(wǎng)絡(luò)擁塞的危害及其疏散方法的介紹

    數(shù)據(jù)中心應(yīng)用的不斷增加和用戶數(shù)量的迅速增長,使得數(shù)據(jù)中心正面臨著一個嚴(yán)重的性能問題,而其中尤為嚴(yán)重的現(xiàn)象就是網(wǎng)絡(luò)擁塞。當(dāng)網(wǎng)絡(luò)中存在過多的
    發(fā)表于 10-17 12:33 ?6次下載

    基于數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)涓兄?b class='flag-5'>擁塞控制算法

    針對數(shù)據(jù)中心網(wǎng)絡(luò)(DCN)的鏈路擁塞問題,提出了一種拓?fù)涓兄?b class='flag-5'>擁塞控制算法(TACC)。首先,根據(jù)廣義超立方體拓?fù)涠嗑S正交和單維全連接的結(jié)構(gòu)特點(diǎn),結(jié)合
    發(fā)表于 12-12 13:55 ?0次下載

    基于流調(diào)度代價的數(shù)據(jù)中心網(wǎng)絡(luò)擁塞控制路由算法

    針對傳統(tǒng)數(shù)據(jù)中心網(wǎng)絡(luò)極易發(fā)生擁塞的問題,提出了在軟件定義網(wǎng)絡(luò)(SDN)的架構(gòu)下設(shè)計基于流調(diào)度代價的擁塞控制路由算法加以解決。首先,進(jìn)行
    發(fā)表于 12-14 14:35 ?0次下載

    淺談數(shù)據(jù)中心網(wǎng)絡(luò)基礎(chǔ)技術(shù)

    Clos Spine/Leaf兩層結(jié)構(gòu) 圖3 常見的數(shù)據(jù)中心網(wǎng)絡(luò)互聯(lián)結(jié)構(gòu) 2008年,美國加州大學(xué)圣迭戈分校的研究學(xué)者提出了將Clos架構(gòu)用于數(shù)據(jù)中心中。
    發(fā)表于 11-07 11:42 ?1309次閱讀

    HPC和數(shù)據(jù)中心融合網(wǎng)絡(luò)面臨的技術(shù)挑戰(zhàn)

    隨著大型DC采用具有更高帶寬需求的高性能加速器,數(shù)據(jù)中心網(wǎng)絡(luò)通過支持遠(yuǎn)程直接內(nèi)存訪問(RDMA)、RDMA融合以太網(wǎng)(RDMA over converged Ethernet,RoCE)、互聯(lián)網(wǎng)廣域RDMA協(xié)議(iWarp)等新技術(shù)不斷向HPCN融合。
    發(fā)表于 09-15 09:56 ?1736次閱讀
    <b class='flag-5'>HPC</b><b class='flag-5'>和數(shù)據(jù)中心</b>融合<b class='flag-5'>網(wǎng)絡(luò)</b>面臨的技術(shù)挑戰(zhàn)

    半導(dǎo)體存儲器在數(shù)據(jù)中心中的應(yīng)用

    半導(dǎo)體存儲器在數(shù)據(jù)中心中的應(yīng)用是極其重要且廣泛的,它們不僅是數(shù)據(jù)中心存儲系統(tǒng)的核心組件,還直接關(guān)系到數(shù)據(jù)處理的效率、可靠性和安全性。以下將詳細(xì)闡述半導(dǎo)體存儲器在數(shù)據(jù)中心中的具體應(yīng)用,包
    的頭像 發(fā)表于 08-20 10:17 ?2431次閱讀

    信而泰PFC/ECN流量測試方案:打造智能無損網(wǎng)絡(luò)的關(guān)鍵利器

    導(dǎo)語:AI算力爆發(fā)的背后,如何保障網(wǎng)絡(luò)“零丟包”? 在當(dāng)今數(shù)據(jù)中心網(wǎng)絡(luò)中,隨著AI、高性能計算(HPC)和分布式存儲等應(yīng)用的飛速發(fā)展,網(wǎng)絡(luò)
    的頭像 發(fā)表于 03-13 09:53 ?1541次閱讀
    信而泰PFC/<b class='flag-5'>ECN</b>流量測試方案:打造智能無損<b class='flag-5'>網(wǎng)絡(luò)</b>的關(guān)鍵利器

    解析DCQCN:RDMA在數(shù)據(jù)中心網(wǎng)絡(luò)的關(guān)鍵擁塞控制協(xié)議

    DCQCN ( Data Center Quantized Congestion Notification),數(shù)據(jù)中心量化擁塞通知。它是一種專門為數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)計的端到端
    的頭像 發(fā)表于 09-15 11:45 ?1867次閱讀
    解析DCQCN:RDMA在<b class='flag-5'>數(shù)據(jù)中心</b><b class='flag-5'>網(wǎng)絡(luò)</b>的關(guān)鍵<b class='flag-5'>擁塞</b>控制協(xié)議