91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智算中心網(wǎng)絡(luò)交換機(jī)需要什么樣的緩存架構(gòu)

SDNLAB ? 來源:西貝吹風(fēng) ? 2024-11-14 16:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

?在交換機(jī)上,緩存就是數(shù)據(jù)交換的緩沖區(qū),被交換機(jī)用來協(xié)調(diào)不同網(wǎng)絡(luò)設(shè)備之間的速度匹配問題,突發(fā)數(shù)據(jù)可以存儲在緩沖區(qū)內(nèi),直到被慢速設(shè)備處理為止。數(shù)據(jù)中心交換機(jī)應(yīng)用在HPC/AI大模型訓(xùn)練、分布式存儲等場景時,并非緩存越大越好,過大的緩存會導(dǎo)致更長的隊列、更高的時延和抖動、更高的成本,所以不能簡單地去擴(kuò)大緩存,交換機(jī)避免丟包所需的緩存與此帶寬延遲積BDP直接相關(guān),借助于帶寬時延積BDP可以確定合適的內(nèi)存大小。

緩存架構(gòu)分類

按照緩沖區(qū)的大小,以太網(wǎng)交換機(jī)通常分為深緩沖區(qū)交換機(jī)和淺緩沖區(qū)交換機(jī),深緩沖區(qū)交換機(jī)緩沖區(qū)容量高達(dá)數(shù)GB,與淺緩沖區(qū)交換機(jī)的幾十MB形成鮮明對比。這種設(shè)計上的差異源于應(yīng)用場景的差異,深緩沖區(qū)交換機(jī)(或路由器)主要面向路由和廣域網(wǎng)場景,RTT時間長,希望能夠容納更多的數(shù)據(jù)流量,對微突發(fā)流量不敏感,但也意味著更高的尾延遲和抖動,這一點與HPC/AI大模型訓(xùn)練、分布式存儲等場景的低時延要求顯然是相違背的,淺緩沖區(qū)交換機(jī)在這種場景下更適合,以目前最高端的51.2Tbps(64個800G)的交換機(jī)為例,如果RTT時間是3~5微秒,緩存僅需33MB左右,這是交換機(jī)中所需的總緩存,那么這個總的緩存能否被每一個端口充分利用嗎?

這就取決于交換機(jī)(交換芯片)所采用緩存架構(gòu)。交換芯片的緩存架構(gòu)通常分為:完全共享緩存架構(gòu)和分片報文緩存架構(gòu)(也稱分割緩沖區(qū)結(jié)構(gòu))。

完全共享緩存架構(gòu):設(shè)備中的所有緩存都可用于動態(tài)分配到任何端口,意味著在所有輸入-輸出端口之間共享緩存而沒有任何限制,最大限度地提高了可用內(nèi)存的效率。

分片報文緩存架構(gòu):由多片較小的緩存共同組成了芯片內(nèi)部的緩存,所有的物理接口也被劃分成了不同的組,同一組內(nèi)的物理接口共享對應(yīng)的緩存單元。

不同緩存架構(gòu)影響

如下圖所示,同樣是16MB的緩存情況下,完全共享緩沖架構(gòu)中的每個端口極限情況下(如多打一的Incast場景,)可以最大利用到16MB;如果是兩個分片的分組端口緩存架構(gòu)下,每個端口極限情況下僅可以最大利用到8MB;而如果是四個分片的分組端口緩存架構(gòu)下,每個端口極限情況下僅可以最大利用到4MB。

2719230e-906c-11ef-a511-92fbcf53809c.jpg

思科之前的文檔中也做過分析,分片報文緩存架構(gòu)下,不同的流量模型對微突發(fā)流量吸收的影響或限制也不同,如下圖所示:

273abf0a-906c-11ef-a511-92fbcf53809c.jpg

以圖中右側(cè)圖示情況為例,4個分片的架構(gòu)下,如果四個輸出端口位于4個不同的分片上,最理想的情況可以達(dá)到100%的緩存利用,但是任意一個輸出端口最多僅可以消耗總內(nèi)存的25%。在復(fù)雜的流量模式下,這種限制可能會更加痛苦,如圖中右側(cè)圖示為例,此情況下,一個輸出端口的緩存被限制為總緩沖區(qū)的1/16(6.25%),這種限制使得Incast下的緩沖行為不可預(yù)測。 在完全共享緩存架構(gòu)中,設(shè)備中的所有數(shù)據(jù)包緩沖區(qū)都可用于動態(tài)分配到任意一個端口,這意味著在所有輸入輸出端口之間共享緩存而沒有任何限制,最大限度地提高了可用內(nèi)存的效率,并且使微突發(fā)流量吸收能力可預(yù)測,與流量模型沒有任何關(guān)系。

完全共享緩存的優(yōu)勢也體現(xiàn)在RoCEv2網(wǎng)絡(luò)中,RoCEv2是TCP/IP協(xié)議中UDP層實現(xiàn),因為使用不需要確認(rèn)的UDP協(xié)議,此時RTT不是緩沖區(qū)需求的直接驅(qū)動因素,但是RDMA的無損特性往往要依靠PFC來實現(xiàn),PFC逐級反壓控制會導(dǎo)致?lián)砣樱耆蚕砭彺嫱ㄟ^在需要的時間和節(jié)點支持更多的緩存,有助于最大限度地減少觸發(fā)PFC流量控制的需要。

主流廠商實現(xiàn)當(dāng)前市場上,大多數(shù)數(shù)據(jù)中心交換機(jī)都是使用商用交換芯片ASIC構(gòu)建的,這些ASIC針對傳統(tǒng)的數(shù)據(jù)流量模式和數(shù)據(jù)包大小進(jìn)行了成本優(yōu)化,為了在實現(xiàn)帶寬目標(biāo)的同時保持低成本,芯片供應(yīng)商更多使用了分片緩存架構(gòu),犧牲了公平性,同時面臨不可預(yù)測性和微突發(fā)吸收的問題。

但是,當(dāng)前幾個主要廠商51.2Tbps最高容量的交換芯片,由于應(yīng)對場景以HPC/AI大模型訓(xùn)練等為主,基本都采用完全共享緩存架構(gòu),相關(guān)的交換芯片或交換機(jī)如博通Tomahawk5、英偉達(dá)Spectrum-4、思科Silicon One G200都是宣傳采用完全共享緩存架構(gòu)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 網(wǎng)絡(luò)交換機(jī)

    關(guān)注

    1

    文章

    75

    瀏覽量

    16825
  • 緩存
    +關(guān)注

    關(guān)注

    1

    文章

    248

    瀏覽量

    27760
  • 智算中心
    +關(guān)注

    關(guān)注

    0

    文章

    113

    瀏覽量

    2531

原文標(biāo)題:智算中心網(wǎng)絡(luò)交換機(jī)需要什么樣的緩存架構(gòu)?

文章出處:【微信號:SDNLAB,微信公眾號:SDNLAB】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    產(chǎn)品彩頁-CX-N系列數(shù)據(jù)中心交換機(jī)

    CX-N系列數(shù)據(jù)中心交換機(jī)面向AI/ML(人工智能/機(jī)器學(xué)習(xí))智中心和云計算數(shù)據(jù)中心提供一站式全開放網(wǎng)
    發(fā)表于 10-29 13:55 ?1次下載

    NVIDIA Spectrum-X 以太網(wǎng)交換機(jī)助力 Meta 和 Oracle 加速網(wǎng)絡(luò)性能

    基于?NVIDIA Spectrum-X 以太網(wǎng)交換機(jī)的 AI 數(shù)據(jù)中心網(wǎng)絡(luò)。 Meta 和 Oracle 正將 Spectrum-X 以太網(wǎng)交換機(jī)標(biāo)準(zhǔn)化為一種開放的加速
    的頭像 發(fā)表于 10-14 10:26 ?1797次閱讀
    NVIDIA Spectrum-X 以太網(wǎng)<b class='flag-5'>交換機(jī)</b>助力 Meta 和 Oracle 加速<b class='flag-5'>網(wǎng)絡(luò)</b>性能

    交換機(jī):納秒速率、低時延與高密度端口重構(gòu)AI網(wǎng)絡(luò)

    速率(光電交換機(jī)可達(dá)納秒級,光機(jī)械交換機(jī)達(dá)毫秒級)、低時延架構(gòu)(時延低于10微秒)、高能效比(功耗較InfiniBand或以太網(wǎng)方案降低65%以上)。這種技術(shù)特性使其在AI
    的頭像 發(fā)表于 09-26 09:11 ?7494次閱讀

    工業(yè)以太網(wǎng)交換機(jī)與商用交換機(jī)的技術(shù)差異與應(yīng)用場景分析

    在當(dāng)今的工業(yè)自動化和網(wǎng)絡(luò)通信領(lǐng)域,交換機(jī)作為網(wǎng)絡(luò)基礎(chǔ)設(shè)施的核心組件,扮演著至關(guān)重要的角色。然而,市場上存在兩種主要類型的交換機(jī):工業(yè)交換機(jī)
    的頭像 發(fā)表于 09-23 14:33 ?870次閱讀

    Is交換機(jī)組成的環(huán)形網(wǎng)絡(luò)中,當(dāng)位于主控節(jié)點的Ism網(wǎng)管交換機(jī)故障后,為什么環(huán)網(wǎng)中其他交換機(jī)不受影響?

    當(dāng)位于主控節(jié)點的交換機(jī)故障斷掉,環(huán)網(wǎng)中其他交換機(jī)是如何保持正常運行的?或者說什么原理讓環(huán)網(wǎng)其他交換機(jī)不受影響?
    發(fā)表于 08-06 06:46

    普通交換機(jī)和車載交換機(jī)的區(qū)別有哪些?怎么選?

    你可能知道 交換機(jī) 是一種網(wǎng)絡(luò)設(shè)備,用于在計算機(jī)網(wǎng)絡(luò)中連接多個設(shè)備(如計算機(jī)、服務(wù)器、打印機(jī)等),并實現(xiàn)這些設(shè)備之間的數(shù)據(jù)交換。但是不同場景下交換機(jī)
    的頭像 發(fā)表于 07-09 15:53 ?610次閱讀
    普通<b class='flag-5'>交換機(jī)</b>和車載<b class='flag-5'>交換機(jī)</b>的區(qū)別有哪些?怎么選?

    什么是工業(yè)級交換機(jī)?工業(yè)交換機(jī)作用有哪些?

    重中之重!??! ? ? 工業(yè)級交換機(jī) 是專為工業(yè)環(huán)境設(shè)計的 網(wǎng)絡(luò)設(shè)備 ,主要作用是實現(xiàn)以太網(wǎng)設(shè)備的互聯(lián),擴(kuò)大網(wǎng)絡(luò)覆蓋范圍。與普通的商業(yè)交換機(jī)相比,工業(yè)級
    的頭像 發(fā)表于 07-07 16:25 ?1300次閱讀

    網(wǎng)絡(luò)交換機(jī)在CCC認(rèn)證范圍嗎

    網(wǎng)絡(luò)交換機(jī)(NetworkSwitch)通常不在中國強制性產(chǎn)品認(rèn)證(CCC)目錄范圍內(nèi),也就是說:一般情況下,網(wǎng)絡(luò)交換機(jī)需要做CCC認(rèn)證。
    的頭像 發(fā)表于 06-30 14:12 ?2004次閱讀
    <b class='flag-5'>網(wǎng)絡(luò)</b><b class='flag-5'>交換機(jī)</b>在CCC認(rèn)證范圍嗎

    工業(yè)交換機(jī)與普通交換機(jī)的區(qū)別:為什么工廠網(wǎng)絡(luò)寧貴不省?

    在工業(yè)4.0和智能制造的浪潮下,工廠的每一臺設(shè)備、每一處傳感器都成了網(wǎng)絡(luò)中的“神經(jīng)元”,而連接這些“神經(jīng)元”的核心設(shè)備——工業(yè)交換機(jī),卻常被忽視。許多人會問:“工業(yè)交換機(jī)和普通交換機(jī)
    的頭像 發(fā)表于 05-23 17:14 ?1318次閱讀

    工業(yè)級交換機(jī)選型指南

    在工業(yè)自動化和物聯(lián)網(wǎng)應(yīng)用中,工業(yè)級交換機(jī)是不可或缺的網(wǎng)絡(luò)設(shè)備。它不僅需要具備高度的穩(wěn)定性和可靠性,還需要適應(yīng)各種惡劣的環(huán)境條件。但對于初次接觸工業(yè)級
    的頭像 發(fā)表于 04-17 16:38 ?1487次閱讀
    工業(yè)級<b class='flag-5'>交換機(jī)</b>選型指南

    交換機(jī)和分交換機(jī)的連接光纖接口是否是lc

    交換機(jī)和分交換機(jī)的連接光纖接口是否采用LC接口,取決于設(shè)備型號、設(shè)計需求和場景要求,并非固定選擇。 在光纖網(wǎng)絡(luò)中,主交換機(jī)和分交換機(jī)之間的
    的頭像 發(fā)表于 04-15 10:42 ?1417次閱讀

    POE交換機(jī)接口詳解

    在現(xiàn)代網(wǎng)絡(luò)設(shè)備中,PoE(以太網(wǎng)供電)技術(shù)已成為不可或缺的一部分。PoE交換機(jī)接口不僅能傳輸數(shù)據(jù),還能通過同一條網(wǎng)線為終端設(shè)備供電,有效簡化布線,降低成本,并提升網(wǎng)絡(luò)部署效率。本文將全面解析PoE
    發(fā)表于 03-27 17:17

    如何實現(xiàn)POE交換機(jī)串聯(lián)?

    提供連接與供電。然而,POE交換機(jī)的串聯(lián)需要合理的連接方式與配置,以確保網(wǎng)絡(luò)性能和穩(wěn)定性。本文將詳細(xì)介紹如何實現(xiàn)POE交換機(jī)串聯(lián)。 POE交換機(jī)
    發(fā)表于 03-25 19:10

    PoE交換機(jī)如何助力智慧城市基礎(chǔ)設(shè)施建設(shè)?

    交換機(jī)在構(gòu)建這些網(wǎng)絡(luò)中發(fā)揮著至關(guān)重要的作用。本文將探討PoE交換機(jī)如何助力智慧城市發(fā)展,以及它們在構(gòu)建強大城市網(wǎng)絡(luò)中的重要性。 智慧城市中的網(wǎng)
    發(fā)表于 03-25 10:20

    PoE交換機(jī)與非PoE交換機(jī)的比較:兩者能否協(xié)同工作?

    號線對并接地)而影響網(wǎng)絡(luò)運行。 如果您需要通過非PoE交換機(jī)為PoE設(shè)備供電,可以使用PoE供電器,它能在數(shù)據(jù)傳輸過程中為設(shè)備提供電力,確保PoE設(shè)備正常運行。 PoE交換機(jī)可以連接
    發(fā)表于 03-21 19:20