91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計(jì)算高速鏈路互連內(nèi)存和GPU以實(shí)現(xiàn)高性能

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Saumitra Jagdale ? 2022-10-24 16:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著云計(jì)算技術(shù)的進(jìn)步,數(shù)據(jù)中心的架構(gòu)內(nèi)存安排發(fā)生了重大變化。為了增強(qiáng)計(jì)算能力和廣泛的數(shù)據(jù)處理,需要集成擅長處理特定工作負(fù)載的加速器。雖然這些設(shè)備已經(jīng)通過PCI Express連接,但計(jì)算快速鏈路可以進(jìn)一步改善優(yōu)化,因?yàn)樗试S對(duì)各種系統(tǒng)組件進(jìn)行異構(gòu)處理。

PCI Express是用于將主機(jī)處理器連接到加速器設(shè)備的最常見技術(shù)。它是一種高性能、行業(yè)標(biāo)準(zhǔn)的串行 I/O 接口,專為在企業(yè)、桌面和嵌入式應(yīng)用中使用而開發(fā)。

同時(shí),PCIe在具有大型共享內(nèi)存池和大量需要高帶寬的設(shè)備的系統(tǒng)中存在局限性。由于每個(gè) PCIe 層次結(jié)構(gòu)都使用單個(gè) 64 位地址空間,因此 PCIe 未提供支持一致性的技術(shù),并且無法充分維護(hù)單獨(dú)的內(nèi)存池。此外,PCIe 鏈路具有太多的延遲,無法有效地管理系統(tǒng)中多個(gè)設(shè)備之間的共享內(nèi)存。

因此,計(jì)算密集型工作負(fù)載需要與更快的數(shù)據(jù)流連接,以有效地?cái)U(kuò)展數(shù)據(jù)中心中的異構(gòu)計(jì)算。計(jì)算高速鏈路 (CXL) 通過利用 PCI 高速 5.0 的物理和電氣接口來挑戰(zhàn)一些限制。這項(xiàng)新技術(shù)提高了內(nèi)存容量和帶寬,并降低了延遲。它是高速通信的接口,因?yàn)榧铀倨髟絹碓蕉嗟赜糜谘a(bǔ)充CPU以支持新興應(yīng)用。

什么是斷續(xù)器?

計(jì)算高速鏈路 (CXL) 是一種開放的行業(yè)標(biāo)準(zhǔn)內(nèi)存互連。它旨在為當(dāng)今數(shù)據(jù)中心中使用的許多類型的內(nèi)存提供高性能連接,例如CPU,TPU,GPU和其他處理器類型。

CXL 利用 PCIe 5.0 的物理層基礎(chǔ)架構(gòu)在主機(jī)和所有設(shè)備之間創(chuàng)建公共內(nèi)存空間。緩存一致性標(biāo)準(zhǔn)可確保主機(jī)處理器和 CXL 設(shè)備在訪問數(shù)據(jù)時(shí)看到相同的數(shù)據(jù)。CPU 主機(jī)主要負(fù)責(zé)一致性管理,允許 CPU 和設(shè)備共享資源以獲得更高的性能并降低軟件堆棧的復(fù)雜性,從而降低設(shè)備總成本。

除了原始性能外,CXL還有其他優(yōu)勢(shì)。該技術(shù)是開源的,不像美光的3D Xpoint,這是迄今為止最接近高性能內(nèi)存互連的方法。美光和英特爾現(xiàn)在正在對(duì)沖他們對(duì)CXL的賭注,而不是專有技術(shù)。NVIDIA 和 AMD 的硬件系統(tǒng)還使用 CXL 來互連內(nèi)存和外部處理單元,以優(yōu)化性能。NVIDIA的GPU與CXL設(shè)計(jì)相結(jié)合,進(jìn)行了如此廣泛的計(jì)算,并在內(nèi)存設(shè)計(jì)中進(jìn)行了一些更改。

這種轉(zhuǎn)變的最重要結(jié)果將是CXL消除專有內(nèi)存互連。它是必不可少的,因?yàn)橛袔追N類型的企業(yè)存儲(chǔ),每個(gè)處理器都通過專有連接訪問它們。這可能會(huì)使企業(yè)存儲(chǔ)基礎(chǔ)架構(gòu)變得復(fù)雜,并且無法預(yù)測(cè)其性能。

現(xiàn)在,由于CXL,每個(gè)處理器都將能夠訪問所有類型的內(nèi)存。這將允許單獨(dú)的處理器共享相同的內(nèi)存池。它不僅對(duì)于數(shù)據(jù)中心至關(guān)重要,而且對(duì)于開發(fā)通常使用CPU,GPU和TPU的AI神經(jīng)網(wǎng)絡(luò)和深度機(jī)器學(xué)習(xí)系統(tǒng)等技術(shù)也至關(guān)重要。

CXL 事務(wù)層協(xié)議

憑借與 PCIe 5.0 相似的帶寬,CXL 使用三種動(dòng)態(tài)多路復(fù)用的事務(wù)層協(xié)議:CXL.io、CXL.緩存和 CXL.內(nèi)存,以在 PCIe 上獲得優(yōu)勢(shì)。

CXL.io 協(xié)議幾乎與 PCIe 5.0 相同。它用于設(shè)備發(fā)現(xiàn)、配置、寄存器訪問、中斷、虛擬化和批量 DMA。

CXL.cache 是一種可選協(xié)議,用于定義主機(jī)和設(shè)備之間的交互。這允許連接的 CXL 設(shè)備使用請(qǐng)求和響應(yīng)方法以極低的延遲高效緩存主機(jī)內(nèi)存。

CXL.memory 是一種可選協(xié)議,它使用加載和存儲(chǔ)命令為主機(jī)處理器提供對(duì)加速器連接的內(nèi)存的直接訪問。加速器連接的內(nèi)存被 CPU、GPU 或 TPU 視為額外的地址空間,從而提高效率并降低延遲。

CXL 對(duì)存儲(chǔ)的影響

CXL依賴于存儲(chǔ),并將對(duì)其產(chǎn)生影響。它將允許存儲(chǔ)系統(tǒng)使用更大的內(nèi)存池進(jìn)行緩存。該技術(shù)有利于使用內(nèi)存作為緩存的存儲(chǔ)應(yīng)用程序或系統(tǒng)。這一點(diǎn)至關(guān)重要,因?yàn)殡m然許多ISP定期限制帶寬,但臨時(shí)數(shù)據(jù)存儲(chǔ)正在成為數(shù)據(jù)中心性能的關(guān)鍵方面。

商用存儲(chǔ)系統(tǒng)中目前可用的最大 DRAM 緩存為 3 TB。盡管使用 MemVerge 或福爾穆盧斯黑色,但特定的軟件定義存儲(chǔ)可以使用英特爾傲騰 PMem 將該緩存擴(kuò)展到 4.5 TB。但是,這對(duì)除最富有的組織之外的所有組織的緩存內(nèi)存施加了硬性限制。幸運(yùn)的是,CXL 通過允許存儲(chǔ)軟件跨多個(gè)存儲(chǔ)介質(zhì)緩存數(shù)據(jù)來解決此問題。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20256

    瀏覽量

    252428
  • 云計(jì)算
    +關(guān)注

    關(guān)注

    39

    文章

    8022

    瀏覽量

    144458
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    18

    文章

    5654

    瀏覽量

    75037
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何正確選用Finisar AOC/DAC提升光互連性能

    在現(xiàn)代數(shù)據(jù)中心、高性能計(jì)算(HPC)以及企業(yè)網(wǎng)絡(luò)中,高速互連
    的頭像 發(fā)表于 03-02 09:53 ?133次閱讀
    如何正確選用Finisar AOC/DAC提升光<b class='flag-5'>互連</b><b class='flag-5'>性能</b>

    MAX4427:高性能高速MOSFET驅(qū)動(dòng)器解析

    MAX4426/MAX4427/MAX4428:高性能高速MOSFET驅(qū)動(dòng)器解析 一、引言 在電子設(shè)計(jì)領(lǐng)域,MOSFET驅(qū)動(dòng)器扮演著至關(guān)重要的角色,它能夠?qū)TL/CMOS輸入信號(hào)轉(zhuǎn)換為高壓
    的頭像 發(fā)表于 02-05 14:10 ?557次閱讀

    LT1208高速運(yùn)算放大器:高性能與多應(yīng)用的完美結(jié)合

    LT1208/LT1209高速運(yùn)算放大器:高性能與多應(yīng)用的完美結(jié)合 在電子工程領(lǐng)域,高速運(yùn)算放大器是實(shí)現(xiàn)許多高性能電路的關(guān)鍵組件。今天我們要
    的頭像 發(fā)表于 01-29 14:55 ?136次閱讀

    內(nèi)存接口到PCIe/CXL、以太網(wǎng)及光互連,高速互連芯片市場(chǎng)分析

    黃晶晶 綜合整理 ? 高速互連芯片定義及分類高速互連芯片是支撐數(shù)據(jù)中心、服務(wù)器及計(jì)算機(jī)實(shí)現(xiàn)
    的頭像 發(fā)表于 01-20 13:37 ?814次閱讀
    從<b class='flag-5'>內(nèi)存</b>接口到PCIe/CXL、以太網(wǎng)及光<b class='flag-5'>互連</b>,<b class='flag-5'>高速</b><b class='flag-5'>互連</b>芯片市場(chǎng)分析

    國產(chǎn)高性能ONFI IP解決方案全解析

    1. 什么是ONFI IP?其在AI時(shí)代的作用是什么?ONFI (Open NAND Flash Interface) 是連接閃存控制器與NAND顆粒的關(guān)鍵高速接口協(xié)議。在AI和高性能計(jì)算(HPC
    發(fā)表于 01-13 16:15

    探索DS90CR486:高性能48位通道解串器的技術(shù)剖析與應(yīng)用指南

    探索DS90CR486:高性能48位通道解串器的技術(shù)剖析與應(yīng)用指南 在高速數(shù)據(jù)傳輸?shù)念I(lǐng)域中,DS90CR486作為一款133MHz、48位通道
    的頭像 發(fā)表于 12-30 11:05 ?421次閱讀

    SN65LVCP15:高速串行的理想選擇

    的SN65LVCP15,這是一款高性能的串行復(fù)用器,適用于光纖通道、千兆以太網(wǎng)和高清電視(HDTV)等高速接口應(yīng)用。 文件下載: sn65lvcp15.pdf 特性亮點(diǎn) 多
    的頭像 發(fā)表于 12-25 14:30 ?283次閱讀

    Amphenol HD Express?:滿足PCIe? Gen 6需求的高性能互連系統(tǒng)

    Amphenol HD Express?:滿足PCIe? Gen 6需求的高性能互連系統(tǒng) 在當(dāng)今高速發(fā)展的電子科技領(lǐng)域,對(duì)于高性能、高密度互連
    的頭像 發(fā)表于 12-11 14:10 ?381次閱讀

    為什么高速信號(hào) = 芯片 + PCB + 極細(xì)同軸線束三者匹配?

    高速信號(hào)性能,不取決于單一環(huán)節(jié),而是“芯片 + PCB + 極細(xì)同軸線束”三者的整體匹配;芯片是信號(hào)的源,PCB 是高速通道,線束是關(guān)
    的頭像 發(fā)表于 11-03 18:48 ?1675次閱讀
    為什么<b class='flag-5'>高速</b>信號(hào)<b class='flag-5'>鏈</b><b class='flag-5'>路</b> = 芯片 + PCB + 極細(xì)同軸線束三者匹配?

    NVIDIA推出NVQLink高速互連架構(gòu)

    NVIDIA 推出 NVIDIA NVQLink,這是一種開放式系統(tǒng)架構(gòu),可將 GPU 計(jì)算的極致性能與量子處理器緊密結(jié)合,構(gòu)建加速的量子超級(jí)計(jì)算
    的頭像 發(fā)表于 11-03 14:53 ?733次閱讀

    TE品牌的高速可插拔I O互連產(chǎn)品性能如何?-赫聯(lián)電子

    ,從而實(shí)現(xiàn)長期成本降低,而無需完全重新設(shè)計(jì)便可提高性能。   TE的zSFP+互連產(chǎn)品符合SFF-8402的規(guī)定,已為光纖通道32G(28.05 Gbps線路速率)采用。整個(gè)產(chǎn)品系列
    發(fā)表于 10-16 11:22

    立訊技術(shù)高速裸線技術(shù)如何搶占高速互連賽道

    在AI算力爆發(fā)式增長的浪潮下,高速裸線正成為數(shù)據(jù)中心與服務(wù)器內(nèi)部傳輸?shù)拿}。當(dāng)英偉達(dá)GB200超級(jí)芯片內(nèi)置5000根NVLink銅纜,銅代光實(shí)現(xiàn)GPU
    的頭像 發(fā)表于 08-07 10:29 ?1425次閱讀
    立訊技術(shù)<b class='flag-5'>高速</b>裸線技術(shù)如何搶占<b class='flag-5'>高速</b><b class='flag-5'>互連</b>賽道

    PCIe協(xié)議分析儀能測(cè)試哪些設(shè)備?

    PCIe協(xié)議分析儀能測(cè)試多種依賴PCIe總線進(jìn)行高速數(shù)據(jù)傳輸?shù)脑O(shè)備,其測(cè)試范圍覆蓋計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)及異構(gòu)計(jì)算等多個(gè)領(lǐng)域,具體設(shè)備類型及測(cè)試場(chǎng)景如下:一、核心計(jì)算設(shè)備
    發(fā)表于 07-25 14:09

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    帶來了總雙向帶寬160GB/s的通訊速率,遠(yuǎn)高于當(dāng)時(shí)的PCIe接口(實(shí)際比現(xiàn)在的PCIe5.0也還要快)。首代的NVlink主要是增強(qiáng)了GPUGPU的通信性能GPU對(duì)系統(tǒng)
    發(fā)表于 06-18 19:31

    使用樹莓派構(gòu)建 Slurm 高性能計(jì)算集群:分步指南!

    在這篇文章中,我將分享我嘗試使用樹莓派構(gòu)建Slurm高性能計(jì)算集群的經(jīng)歷。一段時(shí)間前,我開始使用這個(gè)集群作為測(cè)試平臺(tái),來創(chuàng)建一個(gè)更大的、支持GPU計(jì)算
    的頭像 發(fā)表于 06-17 16:27 ?1750次閱讀
    使用樹莓派構(gòu)建 Slurm <b class='flag-5'>高性能</b><b class='flag-5'>計(jì)算</b>集群:分步指南!