91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RDMA技術(shù)場(chǎng)景和參數(shù)優(yōu)化

智能計(jì)算芯世界 ? 來(lái)源:智能計(jì)算芯世界 ? 作者:智能計(jì)算芯世界 ? 2022-07-11 11:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

RDMA是一種直接內(nèi)存訪問(wèn)技術(shù),RDMA 通過(guò)網(wǎng)絡(luò)把資料直接傳入計(jì)算機(jī)的存儲(chǔ)區(qū),將數(shù)據(jù)從一個(gè)系統(tǒng)快速移動(dòng)到遠(yuǎn)程系統(tǒng)存儲(chǔ)器中,而不對(duì)操作系統(tǒng)造成任何影響,這樣就不需要用到多少計(jì)算機(jī)的處理功能。它消除了外部存儲(chǔ)器復(fù)制和文本交換操作,因而能解放內(nèi)存帶寬和CPU 周期用于改進(jìn)應(yīng)用系統(tǒng)性能。這允許高通量、低延遲的網(wǎng)絡(luò)通信,尤其適合在大規(guī)模并行計(jì)算機(jī)集群中使用。

常見(jiàn)的 RDMA 實(shí)現(xiàn)包括 iWARP、RoCE 與 InfiniBand。其中,InfiniBand 是超級(jí)計(jì)算機(jī)最常用的技術(shù),其可以做到 1ms 的延遲及超過(guò) 100Gb 每秒的傳輸速率。這對(duì)于超大規(guī)模的計(jì)算機(jī)集群是必要的。超級(jí)計(jì)算機(jī)、人工智能,云計(jì)算的數(shù)據(jù)中心都會(huì)受益于 InfiniBand 的卓越效能。世界 TOP500 超級(jí)計(jì)算機(jī)(2017年 6 月排行榜)中 36%使用了 InfiniBand 技術(shù)。

Mellanox 提供從 HPC(高性能計(jì)算中心)、數(shù)據(jù)中心、WEB2.0、機(jī)器學(xué)習(xí)、云服務(wù)器等解決方案,并專門針對(duì)目前火熱的人工智能算法進(jìn)行了架構(gòu)優(yōu)化。其客戶包括 Facebook、Paypal、NVIDIA、百度、京東、騰訊等。

E級(jí)超算已經(jīng)成為世界各國(guó)在超算領(lǐng)域追逐的新目標(biāo)。目前,由江南計(jì)算所、國(guó)防科大和中科曙光公司根據(jù)不同技術(shù)路線研制的三臺(tái) E 級(jí)原型系統(tǒng)已經(jīng)完成并分別安裝在濟(jì)南、天津和深圳國(guó)家超級(jí)計(jì)算中心。據(jù) Hyperion Research 公司按照系統(tǒng)驗(yàn)收的時(shí)間估算,2021 至 2026 年期間,全球?qū)⒔ǔ?28~38 臺(tái) E 級(jí)或接近 E 級(jí)的超級(jí)計(jì)算機(jī),總價(jià)值約在 100~150 億美元。

1afa7050-00c2-11ed-ba43-dac502259ad0.png

在實(shí)現(xiàn)上,RDMA 實(shí)際上是一種智能網(wǎng)卡與軟件架構(gòu)充分優(yōu)化的遠(yuǎn)端內(nèi)存直接高速訪問(wèn)技術(shù),通過(guò)將 RDMA 協(xié)議固化于硬件(即網(wǎng)卡)上,以及支持 Zero-copy和 Kernel bypass 這兩種途徑來(lái)達(dá)到其高性能的遠(yuǎn)程直接數(shù)據(jù)存取的目標(biāo)。其通信過(guò)程使得用戶在使用 RDMA 時(shí)具備如下優(yōu)勢(shì):

? 零拷貝(Zero-copy) - 應(yīng)用程序能夠直接執(zhí)行數(shù)據(jù)傳輸,在不涉及到網(wǎng)絡(luò)軟件棧的情況下。數(shù)據(jù)能夠被直接發(fā)送到緩沖區(qū)或者能夠直接從緩沖區(qū)里接收,而不需要被復(fù)制到網(wǎng)絡(luò)層。

? 內(nèi)核旁路(Kernel bypass) - 應(yīng)用程序可以直接在用戶態(tài)執(zhí)行數(shù)據(jù)傳輸,不需要在內(nèi)核態(tài)與用戶態(tài)之間做上下文切換。

? 不需要 CPU 干預(yù)(No CPU involvement) - 應(yīng)用程序可以訪問(wèn)遠(yuǎn)程主機(jī)內(nèi)存而不消耗遠(yuǎn)程主機(jī)中的任何 CPU。遠(yuǎn)程主機(jī)內(nèi)存能夠被讀取而不需要遠(yuǎn)程主機(jī)上的進(jìn)程(或 CPU)參與。遠(yuǎn)程主機(jī)的 CPU 的緩存(cache)不會(huì)被訪問(wèn)的內(nèi)存內(nèi)容所填充。

? 消息基于事務(wù)(Message based transactions) - 數(shù)據(jù)被處理為離散消息而不是流,消除了應(yīng)用程序?qū)⒘髑懈顬椴煌?事務(wù)的需求。

? 支持分散/聚合條目(Scatter/gather entries support) - RDMA 原生態(tài)支持分散/聚合。也就是說(shuō),讀取多個(gè)內(nèi)存緩沖區(qū)然后作為一個(gè)流發(fā)出去或者接收一個(gè)流然后寫入到多個(gè)內(nèi)存緩沖區(qū)里去。

目前,RDMA 技術(shù)在超算、AI 訓(xùn)練、存儲(chǔ)等多個(gè)高性能場(chǎng)景大量部署,已形成廣泛應(yīng)用。但是 RDMA 技術(shù)路線也有很多,用戶及各家廠商對(duì)于 RDMA 技術(shù)路線的選擇也不盡相同。

在三種主流的 RDMA 技術(shù)中,可以劃分為兩大陣營(yíng)。一個(gè)是 IB 技術(shù), 另一個(gè)是支持 RDMA 的以太網(wǎng)技術(shù)(RoCE 和 iWARP)。其中,IBTA 主要聚焦 IB 和 RoCE 技術(shù),而 iWARP 則是在 IEEE/IETF 標(biāo)準(zhǔn)化的技術(shù)。

在存儲(chǔ)領(lǐng)域,支持 RDMA 的技術(shù)早就存在,比如SRP(SCSI RDMA Protocol)和iSER(iSCSI Extensions for RDMA)。如今興起的 NVMe over Fabrics 如果使用的不是 FC 網(wǎng)絡(luò)的話,本質(zhì)上就是 NVMeover RDMA。換句話說(shuō),NVMe over InfiniBand, NVMe over RoCE 和 NVMe over iWARP 都是 NVMe over RDMA。

1、總線級(jí)數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù)白皮書(shū).pdf

2、RDMA提高數(shù)據(jù)傳輸效率.pdf

3、配置 InfiniBand 和 RDMA 網(wǎng)絡(luò).pdf

4、華為RDMA.pdf

5、面向AI智能無(wú)損數(shù)據(jù)中心網(wǎng)絡(luò).pdf

6、面向分布式 AI智能網(wǎng)卡低延遲Fabric技術(shù).pdf

7、NVMe存儲(chǔ)SPDK 加速前后端 IO.pdf

8、基于RDMA多播機(jī)制的分布式持久性內(nèi)存文件系統(tǒng).pdf

9、云環(huán)境下分布式存儲(chǔ)性能優(yōu)化實(shí)踐.pdf

《RDMA技術(shù)合集(上)》

1、智能網(wǎng)卡低延遲Fabric技術(shù).pdf

2、RDMA參數(shù)選擇.pdf

3、RDMA在數(shù)據(jù)中心中的應(yīng)用研究.pdf

4、RDMA系統(tǒng)的挑戰(zhàn).pdf

5、RDMA網(wǎng)絡(luò)人工智能訓(xùn)練重要硬件

6、RDMA技術(shù)白皮書(shū)(中文版)

7、RDMA技術(shù)調(diào)研

8、RDMA在數(shù)據(jù)中心中的應(yīng)用研究

1b1870fa-00c2-11ed-ba43-dac502259ad0.png

1b299308-00c2-11ed-ba43-dac502259ad0.png

1b3ac83a-00c2-11ed-ba43-dac502259ad0.png

1b4b858a-00c2-11ed-ba43-dac502259ad0.png

1b6613b4-00c2-11ed-ba43-dac502259ad0.png

1b7aaa72-00c2-11ed-ba43-dac502259ad0.png

1b8e0c98-00c2-11ed-ba43-dac502259ad0.png

1b9da96e-00c2-11ed-ba43-dac502259ad0.png

1bb4e7f0-00c2-11ed-ba43-dac502259ad0.png

1bc7ba88-00c2-11ed-ba43-dac502259ad0.png

1bd7793c-00c2-11ed-ba43-dac502259ad0.png

1bec466e-00c2-11ed-ba43-dac502259ad0.png

1bfa5628-00c2-11ed-ba43-dac502259ad0.png

1c0cbd40-00c2-11ed-ba43-dac502259ad0.png

1c22b8e8-00c2-11ed-ba43-dac502259ad0.png

1c3fdacc-00c2-11ed-ba43-dac502259ad0.png

1c580d40-00c2-11ed-ba43-dac502259ad0.png

1c6e438a-00c2-11ed-ba43-dac502259ad0.png

1c8270c6-00c2-11ed-ba43-dac502259ad0.png

1c9f9688-00c2-11ed-ba43-dac502259ad0.png

1cb32734-00c2-11ed-ba43-dac502259ad0.png

1cbdb906-00c2-11ed-ba43-dac502259ad0.png

1cdaf070-00c2-11ed-ba43-dac502259ad0.png

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)器
    +關(guān)注

    關(guān)注

    39

    文章

    7741

    瀏覽量

    171792
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8556

    瀏覽量

    137050
  • RDMA
    +關(guān)注

    關(guān)注

    0

    文章

    99

    瀏覽量

    9632

原文標(biāo)題:RDMA技術(shù)場(chǎng)景和參數(shù)優(yōu)化

文章出處:【微信號(hào):AI_Architect,微信公眾號(hào):智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    破解RDMA網(wǎng)絡(luò)“黑盒”:輕量化會(huì)話追蹤工具

    RDMA網(wǎng)絡(luò)運(yùn)維面臨“黑盒”挑戰(zhàn)的背景下,星融元推出的RST工具通過(guò)無(wú)侵入捕獲CM報(bào)文,實(shí)現(xiàn)RDMA會(huì)話的可視化追蹤與全網(wǎng)路徑還原。該工具基于RFT與RPT雙模塊,支持從設(shè)備流表到全局拓?fù)涞亩嗑S觀測(cè),大幅降低運(yùn)維定位成本,推動(dòng)高性能網(wǎng)絡(luò)運(yùn)維走向透明化與智能化。
    的頭像 發(fā)表于 02-13 14:30 ?403次閱讀
    破解<b class='flag-5'>RDMA</b>網(wǎng)絡(luò)“黑盒”:輕量化會(huì)話追蹤工具

    RDMA設(shè)計(jì)40:隊(duì)列管理及連接建立功能驗(yàn)證與分析

    會(huì)配置網(wǎng)卡端口、遠(yuǎn)程地址、對(duì)端 QP 信息等關(guān)鍵參數(shù)。當(dāng) QP 到達(dá)準(zhǔn)備發(fā)送狀態(tài)后,整個(gè)隊(duì)列創(chuàng)建流程完成,可以正式進(jìn)行 RDMA 數(shù)據(jù)傳輸。 B站已給出相關(guān)性能的視頻,如想進(jìn)一步了解,請(qǐng)搜索B站用戶
    發(fā)表于 02-13 10:15

    RDMA設(shè)計(jì)35:基于 SV 的驗(yàn)證平臺(tái)

    本博文主要交流設(shè)計(jì)思路,在本博客已給出相關(guān)博文100多篇,希望對(duì)初學(xué)者有用。相關(guān)博文煩請(qǐng)查閱本博客文章及經(jīng)驗(yàn)貼: 博文xianuser2012的文章_可編程邏輯,移動(dòng)通信,教師 - 電子技術(shù)
    發(fā)表于 02-01 13:14

    RDMA設(shè)計(jì)4:技術(shù)需求分析2

    專注高性能存儲(chǔ)與傳輸,希望對(duì)初學(xué)者有用。注意這里只是拋磚引玉,切莫認(rèn)為參考這就可以完成商用IP設(shè)計(jì)。若有NVME或RDMA 產(chǎn)品及項(xiàng)目需求,請(qǐng)看B站視頻后聯(lián)系。 根據(jù)IP適用性技術(shù)需求分析,總結(jié)
    發(fā)表于 11-24 09:09

    RDMA設(shè)計(jì)3:技術(shù)需求分析1

    在FPGA上部署RDMA IP,一般用于高速射頻信號(hào)數(shù)據(jù)采集工作。它既要滿足對(duì)于通用大數(shù)據(jù)的實(shí)時(shí)高速傳輸要求,也需要滿足對(duì)于多路信號(hào)的數(shù)據(jù)整合需求??紤]到數(shù)據(jù)采集前端數(shù)據(jù)量大、數(shù)據(jù)產(chǎn)生速率快、采樣
    發(fā)表于 11-21 09:02

    RDMA設(shè)計(jì)2:開(kāi)發(fā)必要性之性能簡(jiǎn)介

    RDMA 產(chǎn)品及項(xiàng)目需求,請(qǐng)看B站視頻后聯(lián)系。 基于本IP設(shè)計(jì),經(jīng)過(guò)優(yōu)化后得出如下性能指標(biāo)及資源占用率: 1 性能指標(biāo) 2 不同包模式下性能 3占用資源
    發(fā)表于 11-20 10:57

    RDMA設(shè)計(jì)1:開(kāi)發(fā)必要性1之設(shè)計(jì)考慮

    解決 FPGA 系統(tǒng)存儲(chǔ)容量不足已成為亟待解決的問(wèn)題。 遠(yuǎn)程直接內(nèi)存訪問(wèn)技術(shù)RDMA) 是一種專為遠(yuǎn)距離網(wǎng)絡(luò)通信設(shè)計(jì)的技術(shù), 其通常通過(guò)光纖進(jìn)行設(shè)備間連接, 提供高通量、 低延遲、 遠(yuǎn)距離的零拷?網(wǎng)絡(luò)
    發(fā)表于 11-19 14:30

    RDMA over RoCE V2設(shè)計(jì)1:通用,穩(wěn)定及高性能!

    # 設(shè)計(jì)目標(biāo): RDMA技術(shù)采用無(wú)感傳輸機(jī)制,消除傳統(tǒng)網(wǎng)絡(luò)傳輸中需要CPU介入下的多重?cái)?shù)據(jù)復(fù)制與內(nèi)核參與環(huán)節(jié),實(shí)現(xiàn)直接跨主機(jī)內(nèi)存訪問(wèn)的機(jī)制。其設(shè)計(jì)目標(biāo)為優(yōu)化分布式環(huán)境下的數(shù)據(jù)傳輸效率,降低CPU負(fù)載
    發(fā)表于 08-05 17:53

    RDMA over RoCE V2設(shè)計(jì)1:為什么要設(shè)計(jì)它?

    基于PC-PC或GPU-GPU之間RDMA設(shè)計(jì)已有較多廠商投入,雖然有的大廠投入幾年后折羽而歸,但不影響PC領(lǐng)域成熟應(yīng)用產(chǎn)品的推廣。這里主要討論在FPGA上設(shè)計(jì)RDMA over RoCE V2,雖然已有xilinx的ernic應(yīng)用,但是性價(jià)比以及國(guó)產(chǎn)化需求還是有其發(fā)展空
    的頭像 發(fā)表于 07-15 10:58 ?715次閱讀
    <b class='flag-5'>RDMA</b> over RoCE V2設(shè)計(jì)1:為什么要設(shè)計(jì)它?

    RDMA over RoCE V2設(shè)計(jì)1:通用,穩(wěn)定及高性能!

    一)設(shè)計(jì)目標(biāo): RDMA技術(shù)采用無(wú)感傳輸機(jī)制,消除傳統(tǒng)網(wǎng)絡(luò)傳輸中需要CPU介入下的多重?cái)?shù)據(jù)復(fù)制與內(nèi)核參與環(huán)節(jié),實(shí)現(xiàn)直接跨主機(jī)內(nèi)存訪問(wèn)的機(jī)制。其設(shè)計(jì)目標(biāo)為優(yōu)化分布式環(huán)境下的數(shù)據(jù)傳輸效率,降低CPU負(fù)載
    發(fā)表于 07-15 10:54

    如何優(yōu)化可編程電源控制環(huán)路參數(shù)?

    環(huán)路帶寬;若過(guò)沖過(guò)大(>8%),可增加補(bǔ)償電阻RCOMP?降低環(huán)路增益。 五、高級(jí)優(yōu)化技術(shù):應(yīng)對(duì)復(fù)雜場(chǎng)景 非線性補(bǔ)償 分段補(bǔ)償:針對(duì)不同負(fù)載范圍(如輕載、重載)設(shè)計(jì)不同的補(bǔ)償參數(shù)
    發(fā)表于 07-02 15:56

    RDMA簡(jiǎn)介3之四種子協(xié)議對(duì)比

    RDMA協(xié)議共有四種子協(xié)議,分別為InfiniBand、iWARP、RoCE v1和RoCE v2協(xié)議。這四種協(xié)議使用統(tǒng)一的RDMA API,但在具體的網(wǎng)絡(luò)層級(jí)實(shí)現(xiàn)上有所不同,如圖1所示,接下來(lái)將
    發(fā)表于 06-04 16:05

    RDMA簡(jiǎn)介2之A技術(shù)優(yōu)勢(shì)分析

    隨著數(shù)據(jù)中心對(duì)于網(wǎng)絡(luò)帶寬和延遲的要求日益增長(zhǎng),傳統(tǒng)的TCP/IP網(wǎng)絡(luò)已無(wú)法滿足性能要求,RDMA網(wǎng)絡(luò)則憑借其高帶寬、低延時(shí)的特性脫穎而出。相較于傳統(tǒng)TCP/IP協(xié)議,RDMA具有零拷貝、不需要CPU
    發(fā)表于 06-04 11:35

    RDMA簡(jiǎn)介1之RDMA開(kāi)發(fā)必要性

    總線或高速外設(shè)部件互連總線(PCIe)上,二者均為短距離連接總線,會(huì)導(dǎo)致數(shù)據(jù)采集系統(tǒng)的部署位置受限 。遠(yuǎn)程直接內(nèi)存訪問(wèn)技術(shù)RDMA)是一種專為遠(yuǎn)距離網(wǎng)絡(luò)通信設(shè)計(jì)的技術(shù),其通常通過(guò)光纖進(jìn)行設(shè)備間連接
    發(fā)表于 06-03 14:38

    VirtualLab 應(yīng)用:傾斜光柵的參數(shù)優(yōu)化及公差分析

    ,也稱為RCWA)對(duì)傾斜光柵的優(yōu)化方法。優(yōu)化后的光柵的衍射效率超過(guò)90%。此外,還研究了其對(duì)光柵的傾角偏差和圓角邊緣的影響。 建模任務(wù) **優(yōu)化 ** 為了為傾斜光柵找到一組優(yōu)化
    發(fā)表于 05-22 08:52