91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一起來看看RDMA讓網(wǎng)絡(luò)實(shí)現(xiàn)低時(shí)延的絕招

鮮棗課堂 ? 來源:中興文檔 ? 作者:中興文檔 ? 2022-11-24 09:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

眾所周知,互聯(lián)網(wǎng)數(shù)據(jù)的爆炸式增長,給數(shù)據(jù)中心的處理能力帶來了很大的挑戰(zhàn)。

計(jì)算、存儲(chǔ)和網(wǎng)絡(luò),是推動(dòng)數(shù)據(jù)中心發(fā)展的三駕馬車。

計(jì)算隨著CPU、GPUFPGA的發(fā)展,算力得到了極大的提升。存儲(chǔ)隨著閃存盤(SSD)的引入,數(shù)據(jù)存取時(shí)延已大幅降低。

但是,網(wǎng)絡(luò)的發(fā)展明顯滯后,傳輸時(shí)延高,逐漸成為了數(shù)據(jù)中心高性能的瓶頸。

fb502ce2-6b27-11ed-8abf-dac502259ad0.png

在數(shù)據(jù)中心內(nèi),70%的流量為東西向流量(服務(wù)器之間的流量)。這些流量,一般為數(shù)據(jù)中心進(jìn)行高性能分布式并行計(jì)算時(shí)的過程數(shù)據(jù)流,通過TCP/IP網(wǎng)絡(luò)傳輸。

如果服務(wù)器之間的TCP/IP傳輸速率提升了,數(shù)據(jù)中心的性能自然也會(huì)跟著提升。

fb63bde8-6b27-11ed-8abf-dac502259ad0.png

下面,我們就來看看服務(wù)器之間數(shù)據(jù)TCP/IP傳輸?shù)倪^程,了解一下“時(shí)間都去哪了”,才好“對(duì)癥下藥”。

服務(wù)器間的TCP/IP傳輸

在數(shù)據(jù)中心,服務(wù)器A向服務(wù)器B發(fā)送數(shù)據(jù)的過程如下: fb9f5d1c-6b27-11ed-8abf-dac502259ad0.png

1、CPU控制數(shù)據(jù)由A的APP Buffer拷貝到操作系統(tǒng)Buffer。

2、CPU控制數(shù)據(jù)在操作系統(tǒng)(OS)Buffer中添加TCP、IP報(bào)文頭。

3、添加TCP、IP報(bào)文頭后的數(shù)據(jù)傳送到網(wǎng)卡(NIC),添加以太網(wǎng)報(bào)文頭。

4、報(bào)文由網(wǎng)卡發(fā)送,通過以太網(wǎng)絡(luò)傳輸?shù)椒?wù)器B網(wǎng)卡。

5、服務(wù)器B網(wǎng)卡卸載報(bào)文的以太網(wǎng)報(bào)文頭后,將其傳輸?shù)讲僮飨到y(tǒng)Buffer。

6、CPU控制操作系統(tǒng)Buffer中的報(bào)文卸載TCP、IP報(bào)文頭。

7、CPU控制卸載后的數(shù)據(jù)傳輸?shù)紸PP Buffer中。

從數(shù)據(jù)傳輸?shù)倪^程可以看出,數(shù)據(jù)在服務(wù)器的Buffer內(nèi)多次拷貝,在操作系統(tǒng)中需要添加/卸載TCP、IP報(bào)文頭,這些操作既增加了數(shù)據(jù)傳輸時(shí)延,又消耗了大量的CPU資源,無法很好得滿足高性能計(jì)算的需求。

那么,如何構(gòu)造高吞吐量、超低時(shí)延和低CPU開銷的高性能數(shù)據(jù)中心網(wǎng)絡(luò)呢?

RDMA技術(shù)可以做到。

什么是RDMA

RDMA( Remote Direct Memory Access,遠(yuǎn)程直接地址訪問技術(shù) )是一種新的內(nèi)存訪問技術(shù),可以讓服務(wù)器直接高速讀寫其他服務(wù)器的內(nèi)存數(shù)據(jù),而不需要經(jīng)過操作系統(tǒng)/CPU耗時(shí)的處理。

RDMA不算是一項(xiàng)新技術(shù),已經(jīng)廣泛應(yīng)用于高性能(HPC)科學(xué)計(jì)算中。隨著數(shù)據(jù)中心高帶寬、低時(shí)延的發(fā)展需求,RDMA也開始逐漸應(yīng)用于某些要求數(shù)據(jù)中心具備高性能的場景中。

舉個(gè)例子,2021年某大型網(wǎng)上商城的雙十一交易額再創(chuàng)新高,達(dá)到5000多億,比2020年又增長了近10%。如此巨大的交易額背后是海量的數(shù)據(jù)處理,該網(wǎng)上商城采用了RDMA技術(shù)來支撐高性能網(wǎng)絡(luò),保障了雙十一的順暢購物。

下面我們一起來看看RDMA讓網(wǎng)絡(luò)實(shí)現(xiàn)低時(shí)延的絕招吧。

RDMA將服務(wù)器應(yīng)用數(shù)據(jù)直接由內(nèi)存?zhèn)鬏數(shù)街悄芫W(wǎng)卡(固化RDMA協(xié)議),由智能網(wǎng)卡硬件完成RDMA傳輸報(bào)文封裝,解放了操作系統(tǒng)和CPU。

fbe20df6-6b27-11ed-8abf-dac502259ad0.png

這使得RDMA具有兩大優(yōu)勢(shì):

Zero Copy(零拷貝):無需將數(shù)據(jù)拷貝到操作系統(tǒng)內(nèi)核態(tài)并處理數(shù)據(jù)包頭部的過程,傳輸延遲會(huì)顯著減小。

Kernel Bypass(內(nèi)核旁路)和Protocol Offload(協(xié)議卸載):不需要操作系統(tǒng)內(nèi)核參與,數(shù)據(jù)通路中沒有繁瑣的處理報(bào)頭邏輯,不僅會(huì)使延遲降低,而且也大大節(jié)省了CPU的資源。

fc0fb8dc-6b27-11ed-8abf-dac502259ad0.png

三大RDMA網(wǎng)絡(luò)

目前,大致有三類RDMA網(wǎng)絡(luò),分別是InfiniBand、RoCE(RDMA over Converged Ethernet,RDMA過融合以太網(wǎng))和iWARP(RDMAover TCP,互聯(lián)網(wǎng)廣域RDMA協(xié)議)。

RDMA最早專屬于Infiniband網(wǎng)絡(luò)架構(gòu),從硬件級(jí)別保證可靠傳輸,而RoCE和iWARP都是基于以太網(wǎng)的RDMA技術(shù)。

InfiniBand

InfiniBand是一種專為RDMA設(shè)計(jì)的網(wǎng)絡(luò)。

采用Cut-Through轉(zhuǎn)發(fā)模式(直通轉(zhuǎn)發(fā)模式),減少轉(zhuǎn)發(fā)時(shí)延。

基于Credit的流控機(jī)制(基于信用的流控機(jī)制),保證無丟包。

要求InfiniBand專用的網(wǎng)卡、交換機(jī)和路由器,建網(wǎng)成本最高。

RoCE

傳輸層為InfiniBand協(xié)議。

RoCE有兩個(gè)版本:RoCEv1基于以太網(wǎng)鏈路層實(shí)現(xiàn),只能在L2層傳輸;RoCEv2基于UDP承載RDMA,可部署于三層網(wǎng)絡(luò)。

需要支持RDMA專用智能網(wǎng)卡,不需要專用交換機(jī)和路由器(支持ECN/PFC等技術(shù),降低丟包率),建網(wǎng)成本最低。

iWARP

傳輸層為iWARP協(xié)議。

iWARP是以太網(wǎng)TCP/IP協(xié)議中TCP層實(shí)現(xiàn),支持L2/L3層傳輸,大型組網(wǎng)TCP連接會(huì)消耗大量CPU,所以應(yīng)用很少。

iWARP只要求網(wǎng)卡支持RDMA,不需要專用交換機(jī)和路由器,建網(wǎng)成本介于InfiniBand和RoCE之間。

Infiniband技術(shù)先進(jìn),但是價(jià)格高昂,應(yīng)用局限在HPC高性能計(jì)算領(lǐng)域,隨著RoCE和iWARPC的出現(xiàn),降低了RDMA的使用成本,推動(dòng)了RDMA技術(shù)普及。

在高性能存儲(chǔ)、計(jì)算數(shù)據(jù)中心中采用這三類RDMA網(wǎng)絡(luò),都可以大幅度降低數(shù)據(jù)傳輸時(shí)延,并為應(yīng)用程序提供更高的CPU資源可用性。

其中,InfiniBand網(wǎng)絡(luò)為數(shù)據(jù)中心帶來極致的性能,傳輸時(shí)延低至百納秒,比以太網(wǎng)設(shè)備延時(shí)要低一個(gè)量級(jí)。

RoCE和iWARP網(wǎng)絡(luò)為數(shù)據(jù)中心帶來超高性價(jià)比,基于以太網(wǎng)承載RDMA,充分利用了RDMA的高性能和低CPU使用率等優(yōu)勢(shì),同時(shí)網(wǎng)絡(luò)建設(shè)成本也不高。

基于UDP協(xié)議的RoCE比基于TCP協(xié)議的iWARP性能更好,結(jié)合無損以太網(wǎng)的流控技術(shù),解決了丟包敏感的問題。RoCE網(wǎng)絡(luò),已廣泛應(yīng)用于各行業(yè)高性能數(shù)據(jù)中心中。

結(jié)語

隨著5G人工智能、工業(yè)互聯(lián)網(wǎng)等新型領(lǐng)域的發(fā)展,RDMA技術(shù)的應(yīng)用會(huì)越來越普及,RDMA將成為助力數(shù)據(jù)中心高性能的一大功臣。







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    14

    文章

    10253

    瀏覽量

    91482
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    21

    文章

    3109

    瀏覽量

    122222
  • HPC
    HPC
    +關(guān)注

    關(guān)注

    0

    文章

    346

    瀏覽量

    24974
  • TCP協(xié)議
    +關(guān)注

    關(guān)注

    1

    文章

    101

    瀏覽量

    12767
  • RDMA
    +關(guān)注

    關(guān)注

    0

    文章

    99

    瀏覽量

    9615

原文標(biāo)題:到底什么是RDMA?為什么數(shù)據(jù)中心需要它?

文章出處:【微信號(hào):鮮棗課堂,微信公眾號(hào):鮮棗課堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    破解RDMA網(wǎng)絡(luò)“黑盒”:輕量化會(huì)話追蹤工具

    RDMA網(wǎng)絡(luò)運(yùn)維面臨“黑盒”挑戰(zhàn)的背景下,星融元推出的RST工具通過無侵入捕獲CM報(bào)文,實(shí)現(xiàn)RDMA會(huì)話的可視化追蹤與全網(wǎng)路徑還原。該工具基于RFT與RPT雙模塊,支持從設(shè)備流表到全
    的頭像 發(fā)表于 02-13 14:30 ?319次閱讀
    破解<b class='flag-5'>RDMA</b><b class='flag-5'>網(wǎng)絡(luò)</b>“黑盒”:輕量化會(huì)話追蹤工具

    回望2025:與162萬開發(fā)者一起AI硬件觸手可及

    設(shè)備中。今天,我們想和大家一起回顧這年的成長,也分享我們對(duì)未來的期待。2025,我們跟開發(fā)者一起完成了1、開發(fā)者生態(tài)持續(xù)壯大截至四季度末,涂鴉平臺(tái)累計(jì)注冊(cè)開發(fā)者超
    的頭像 發(fā)表于 02-12 18:59 ?174次閱讀
    回望2025:與162萬開發(fā)者<b class='flag-5'>一起</b>,<b class='flag-5'>讓</b>AI硬件觸手可及

    RDMA設(shè)計(jì)1:開發(fā)必要性1之設(shè)計(jì)考慮

    . 選擇 RDMA IP 開發(fā)必要性 為了滿足大批量數(shù)據(jù)的采集、 存儲(chǔ)與傳輸需求, 如機(jī)器學(xué)習(xí)、 雷達(dá)、 ?融?控、 航空航天等, 如何在 FPGA 上實(shí)現(xiàn)高帶寬、 延時(shí)的
    發(fā)表于 11-19 14:30

    磁柵尺在數(shù)控機(jī)床領(lǐng)域的應(yīng)用案例,一起來看看吧!

    磁柵尺在數(shù)控機(jī)床領(lǐng)域的應(yīng)用案例:某汽車零部件企業(yè)曲軸加工:某汽車零部件企業(yè)在數(shù)控銑床、加工中心等設(shè)備中加裝法國雷恩磁柵尺,可實(shí)時(shí)反饋刀具位置,將重復(fù)定位精度提升至 ±0.01mm,有效減少了因機(jī)械磨損導(dǎo)致的加工誤差,使曲軸加工合格率從 92% 提升至 99.6%。
    的頭像 發(fā)表于 09-15 15:02 ?632次閱讀
    磁柵尺在數(shù)控機(jī)床領(lǐng)域的應(yīng)用案例,<b class='flag-5'>一起來看看</b>吧!

    解析DCQCN:RDMA在數(shù)據(jù)中心網(wǎng)絡(luò)的關(guān)鍵擁塞控制協(xié)議

    DCQCN ( Data Center Quantized Congestion Notification),數(shù)據(jù)中心量化擁塞通知。它是種專門為數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)計(jì)的端到端擁塞控制協(xié)議。其核心目的是在使用RDMA(RoCEv2)
    的頭像 發(fā)表于 09-15 11:45 ?1864次閱讀
    解析DCQCN:<b class='flag-5'>RDMA</b>在數(shù)據(jù)中心<b class='flag-5'>網(wǎng)絡(luò)</b>的關(guān)鍵擁塞控制協(xié)議

    紫光國微2025半年報(bào) 營收30.47億 同比增長6.07%

    紫光國微2025半年報(bào)發(fā)布,我們一起來看看
    的頭像 發(fā)表于 08-19 10:51 ?1.2w次閱讀

    RDMA over RoCE V2設(shè)計(jì)1:通用,穩(wěn)定及高性能!

    # 設(shè)計(jì)目標(biāo): RDMA技術(shù)采用無感傳輸機(jī)制,消除傳統(tǒng)網(wǎng)絡(luò)傳輸中需要CPU介入下的多重?cái)?shù)據(jù)復(fù)制與內(nèi)核參與環(huán)節(jié),實(shí)現(xiàn)直接跨主機(jī)內(nèi)存訪問的機(jī)制。其設(shè)計(jì)目標(biāo)為優(yōu)化分布式環(huán)境下的數(shù)據(jù)傳輸效率,降低CPU負(fù)載
    發(fā)表于 08-05 17:53

    RDMA over RoCE V2設(shè)計(jì)1:通用,穩(wěn)定及高性能!

    )設(shè)計(jì)目標(biāo): RDMA技術(shù)采用無感傳輸機(jī)制,消除傳統(tǒng)網(wǎng)絡(luò)傳輸中需要CPU介入下的多重?cái)?shù)據(jù)復(fù)制與內(nèi)核參與環(huán)節(jié),實(shí)現(xiàn)直接跨主機(jī)內(nèi)存訪問的機(jī)制。其設(shè)計(jì)目標(biāo)為優(yōu)化分布式環(huán)境下的數(shù)據(jù)傳輸效率,
    發(fā)表于 07-15 10:54

    技術(shù)故障率降低20%,關(guān)鍵在于這套IoT軟硬件體化方案...

    設(shè)備運(yùn)行不穩(wěn)定、現(xiàn)場環(huán)境惡劣、網(wǎng)絡(luò)集成困難?一起來看看這個(gè)案例怎么破局吧
    的頭像 發(fā)表于 07-02 10:48 ?410次閱讀
    技術(shù)故障率降低20%,關(guān)鍵在于這套IoT軟硬件<b class='flag-5'>一</b>體化方案...

    RDMA簡介3之四種子協(xié)議對(duì)比

    RDMA協(xié)議共有四種子協(xié)議,分別為InfiniBand、iWARP、RoCE v1和RoCE v2協(xié)議。這四種協(xié)議使用統(tǒng)RDMA API,但在具體的網(wǎng)絡(luò)層級(jí)
    發(fā)表于 06-04 16:05

    RDMA簡介2之A技術(shù)優(yōu)勢(shì)分析

    隨著數(shù)據(jù)中心對(duì)于網(wǎng)絡(luò)帶寬和延遲的要求日益增長,傳統(tǒng)的TCP/IP網(wǎng)絡(luò)已無法滿足性能要求,RDMA網(wǎng)絡(luò)則憑借其高帶寬、延時(shí)的特性脫穎而出。相
    發(fā)表于 06-04 11:35

    RDMA簡介1之RDMA開發(fā)必要性

    ,提供高通量、延遲、遠(yuǎn)距離的零拷貝網(wǎng)絡(luò)數(shù)據(jù)傳輸。基于融合以太網(wǎng)的遠(yuǎn)程直接內(nèi)存訪問(RoCE)提供了種基于以太網(wǎng)的RDMA技術(shù)實(shí)現(xiàn)方法,相
    發(fā)表于 06-03 14:38

    創(chuàng)建列表 (List) 介紹,一起來看看是做什么的

    開始到距離結(jié)束端10vp的位置,畫條粗細(xì)為1vp的分割線,可以實(shí)現(xiàn)圖9設(shè)置列表分隔線的樣式。 說明: 分隔線的寬度會(huì)使ListItem之間存在定間隔,當(dāng)List設(shè)置的內(nèi)容間距小于分隔線
    發(fā)表于 04-30 07:06

    80張傳感器工作原理圖的資料合集

    、記錄和控制等要求,是實(shí)現(xiàn)自動(dòng)檢測(cè)和自動(dòng)控制的首要環(huán)節(jié)。傳感器的存在和發(fā)展,物體有了觸覺、味覺和嗅覺等感官,物體慢慢變得活了起來。 下面,讓我們
    發(fā)表于 04-27 16:53

    文詳解以太網(wǎng)RDMA技術(shù)

    在現(xiàn)代計(jì)算機(jī)網(wǎng)絡(luò)中,傳輸效率和時(shí)是高性能計(jì)算、云計(jì)算、分布式存儲(chǔ)等應(yīng)用的關(guān)鍵需求。而遠(yuǎn)程直接內(nèi)存訪問(RDMA,Remote Direct Memory Access)技術(shù)因其高效
    的頭像 發(fā)表于 03-10 11:09 ?5047次閱讀
    <b class='flag-5'>一</b>文詳解以太網(wǎng)<b class='flag-5'>RDMA</b>技術(shù)