91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CXL內(nèi)存延遲到底有多糟糕?

芯長征科技 ? 來源:半導(dǎo)體行業(yè)觀察 ? 作者:半導(dǎo)體行業(yè)觀察 ? 2022-12-07 15:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

傳統(tǒng)觀點(diǎn)認(rèn)為,如果您非常關(guān)心延遲,那么嘗試將系統(tǒng)內(nèi)存連接到 PCI-Express 總線并不是一個(gè)好主意。因?yàn)閮?nèi)存離 CPU 越遠(yuǎn),延遲就越高,這就是內(nèi)存 DIMM 通常盡可能靠近插槽的原因。

從邏輯上講,PCI-Express 是千里之外的。隨著每一代 PCI-Express 帶寬翻倍,如果沒有重定時(shí)器的幫助也會(huì)增加延遲,它可以傳輸?shù)木嚯x也會(huì)縮短。對(duì)于我們習(xí)慣于連接到 PCI-Express 的大多數(shù)類型的內(nèi)存來說,這不是什么大問題。閃存存儲(chǔ)的延遲以幾十微秒為單位的情況并不少見,這使得互連產(chǎn)生的額外幾百納秒成為一個(gè)有爭(zhēng)議的問題。然而,我們對(duì)DDR 和其他形式的易失性存儲(chǔ)器就沒有那么寬容了。

以前的內(nèi)存擴(kuò)展嘗試都陷入了妥協(xié),特別是在延遲方面。例如,GigaIO 表示其FabreX 架構(gòu)已經(jīng)可以使用 DMA 在 PCI-Express 上進(jìn)行內(nèi)存池化,但這樣做需要應(yīng)用程序能夠容忍 500 納秒到 1.5 微秒的延遲。

同樣,根據(jù) Blocks and Files 的說法,在英特爾今年夏天毫不客氣地削減其 Optane 持久內(nèi)存業(yè)務(wù)之前,部署該技術(shù)意味著會(huì)產(chǎn)生大約350 納秒的延遲。雖然可用,尤其是在分層內(nèi)存配置中,但它比直接連接 CPU 的 DDR 內(nèi)存預(yù)期的低于 100 納秒的往返延遲要長得多。

進(jìn)入 CXL 內(nèi)存生態(tài)系統(tǒng)

這為我們帶來了使用 Compute Express Link 協(xié)議或 CXL 的第一代內(nèi)存擴(kuò)展模塊?;?AMD 的Epyc 9004“Genoa”處理器的系統(tǒng)是首批系統(tǒng)之一,擁有 64 條 CXL 連接通道——不同于其 128 至 160 條整體 PCI-Express 通道——最多可分為四到十六個(gè)設(shè)備。至于英特爾將如何在其“Sapphire Rapids”Xeon SP 處理器上實(shí)施 CXL,我們將不得不等到它們明年初問世。

與這些服務(wù)器相得益彰的是我們確信的第一個(gè)是許多 CXL 內(nèi)存擴(kuò)展模塊。雖然 CXL 最終將允許完全分解的系統(tǒng),在這些系統(tǒng)中,資源可以通過高速結(jié)構(gòu)在整個(gè)機(jī)架上共享,但距離那一天還有幾年的時(shí)間。

對(duì)于首次涉足數(shù)據(jù)中心,CXL 直接專注于內(nèi)存擴(kuò)展、分層內(nèi)存和一些早期的內(nèi)存池應(yīng)用程序。目前,我們只關(guān)注內(nèi)存擴(kuò)展,因?yàn)樵谶@個(gè)早期階段,它可以說是最簡(jiǎn)單和最實(shí)用的,尤其是在以可用延遲附加內(nèi)存時(shí)。

三星和Astera Labs已經(jīng)展示了 CXL 內(nèi)存模塊,他們說只需將它們插入兼容的 PCI-Express 5.0 插槽,即可為系統(tǒng)添加數(shù) TB 的內(nèi)存。從系統(tǒng)的角度來看,它們的外觀和行為就像通過內(nèi)存總線連接到相鄰插槽的常規(guī) DDR DRAM 內(nèi)存。

在最長的時(shí)間里,一旦達(dá)到 CPU 內(nèi)存控制器的限制,添加更多內(nèi)存的唯一方法就是添加更多插槽。如果工作負(fù)載可以利用額外的線程,那就更好了,但如果不能,這將成為一種非常昂貴的添加內(nèi)存的方式。實(shí)際上,額外的插槽只是一個(gè)內(nèi)存控制器,上面附有一堆昂貴的、不需要的內(nèi)核。

內(nèi)存擴(kuò)展模塊的行為方式大致相同,但它不是使用專有的插槽到插槽互連,如英特爾的 UPI 或 AMD 的 xGMI 鏈接,而是 CXL。這意味著您可以擁有這些設(shè)備的整個(gè)生態(tài)系統(tǒng),事實(shí)上,我們已經(jīng)看到一個(gè)相當(dāng)充滿活力,有時(shí)甚至是令人向往的設(shè)備圍繞 CXL 展開。

CXL 總裁 Siamak Tavallaei在 SC22上告訴 The Next Platform ,CXL 實(shí)際上包含三種協(xié)議,但并非所有協(xié)議都是延遲的靈丹妙藥?!癈XL.io 仍然具有您預(yù)期的相同類型的延遲(來自 PCI-Express),但其他兩個(gè)協(xié)議——CXL.cache 和 CXL.mem——通過協(xié)議采用更快的路徑,并且它們減少了延遲。”

CXL 內(nèi)存延遲到底有多糟糕?

如果 Astera 值得信任,延遲并不像您想象的那么糟糕。該公司的Leo CXL 內(nèi)存控制器旨在接受高達(dá) 5600 MT/秒的標(biāo)準(zhǔn) DDR5 內(nèi)存 DIMM。他們聲稱客戶可以預(yù)期延遲與訪問第二個(gè) CPU 上的內(nèi)存大致相當(dāng),一個(gè) NUMA 躍點(diǎn)。這使得它在 170 納秒到 250 納秒附近。事實(shí)上,就系統(tǒng)而言,這正是這些內(nèi)存模塊向操作系統(tǒng)顯示的方式。

Tavallaei 解釋說,大多數(shù) CXL 內(nèi)存控制器會(huì)增加大約 200 納秒的延遲,額外的重定時(shí)器會(huì)增加或花費(fèi)幾十納秒,具體取決于設(shè)備與 CPU 的距離。這與其他 CXL 早期采用者所看到的一致。GigaIO 首席執(zhí)行官 Alan Benjamin 告訴The Next Platform,它所見過的大多數(shù) CXL 內(nèi)存擴(kuò)展模塊的延遲都接近 250 納秒,而不是 170 納秒。

然而,正如 Tavallaei 指出的那樣,這仍然是對(duì)四插槽或八插槽系統(tǒng)的改進(jìn),在這些系統(tǒng)中,應(yīng)用程序可能僅僅因?yàn)樾枰獌?nèi)存而不得不應(yīng)對(duì)多個(gè) NUMA 躍點(diǎn)。(不過,公平地說,IBM 和英特爾在 CPU 之間添加了更多更快的鏈接,以減少跳數(shù)和每跳延遲。)

話雖如此,許多芯片制造商很快指出,CXL 生態(tài)系統(tǒng)現(xiàn)在才剛剛起步。在 CXL 董事會(huì)任職的 AMD 的 Kurtis Bowman 告訴The Next Platform,許多早期的 CXL 概念驗(yàn)證和產(chǎn)品都使用尚未針對(duì)延遲進(jìn)行優(yōu)化的 FPGA 或第一代 ASIC。隨著時(shí)間的推移,他預(yù)計(jì)延遲會(huì)大大改善。

如果 CXL 供應(yīng)商能夠像他們聲稱的那樣,在展廳演示之外實(shí)現(xiàn)與多插槽系統(tǒng)同等的延遲,那么它應(yīng)該在很大程度上消除利用它們所需的應(yīng)用程序或操作系統(tǒng)特定定制的需要。好吧,至少就內(nèi)存擴(kuò)展而言。正如我們?cè)?Optane 中看到的那樣,CXL 內(nèi)存分層幾乎肯定需要某種操作系統(tǒng)或應(yīng)用程序支持。

隨著插槽變得越來越大并且在板上安裝更多 DIMM 變得越來越難,這再合適不過了。放置它們的地方更少了。有可容納 32 個(gè) DIMM 的雙插槽系統(tǒng),但隨著芯片制造商增加更多通道以滿足更高核心數(shù)的帶寬需求,這是不可擴(kuò)展的。

我們已經(jīng)在某種程度上在 AMD 的 Genoa 芯片上看到了這一點(diǎn),盡管該芯片將內(nèi)存通道數(shù)量增加到 12 個(gè),但在發(fā)布時(shí)每個(gè)通道僅支持一個(gè) DIMM,將雙插槽配置中的 DIMM 數(shù)量限制為 24 個(gè)。即使您可以為每個(gè)通道連接兩個(gè) DIMM,我們被告知將 48 個(gè) DIMM 安裝到標(biāo)準(zhǔn)機(jī)箱中是不切實(shí)際的。

當(dāng)我們希望在更遠(yuǎn)的距離(例如跨機(jī)架)連接內(nèi)存時(shí),事情會(huì)變得更加復(fù)雜,因?yàn)殡娀蚬饣ミB產(chǎn)生的延遲必須計(jì)入方程式。但對(duì)于機(jī)箱內(nèi) CXL 內(nèi)存擴(kuò)展,延遲似乎并不像許多人擔(dān)心的那么令人頭疼。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5683

    瀏覽量

    139945
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    9

    文章

    3209

    瀏覽量

    76361
  • 生態(tài)系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    711

    瀏覽量

    21581

原文標(biāo)題:CXL,面臨嚴(yán)峻的延遲問題

文章出處:【微信號(hào):芯長征科技,微信公眾號(hào):芯長征科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    瀾起科技發(fā)布PCIe 6.x/CXL 3.x AEC解決方案

    瀾起科技今日宣布,率先在國內(nèi)推出基于PCIe 6.x/CXL 3.x標(biāo)準(zhǔn)的高性能有源電纜(AEC,Active Electrical Cable)解決方案。該方案面向數(shù)據(jù)中心從單機(jī)架向機(jī)架復(fù)雜架構(gòu)
    的頭像 發(fā)表于 01-27 14:15 ?306次閱讀

    內(nèi)存接口到PCIe/CXL、以太網(wǎng)及光互連,高速互連芯片市場(chǎng)分析

    通信協(xié)議,通過信號(hào)處理、架構(gòu)優(yōu)化等方式,保障數(shù)據(jù)在各系統(tǒng)間高效、可靠傳輸。 高速互聯(lián)芯片 按技術(shù)類別區(qū)分,高速互連芯片主要分為三大類:內(nèi)存互連芯片、PCIe/CXL 互連芯片和以太網(wǎng)及光互連芯片等。其中,內(nèi)存互連芯片包括
    的頭像 發(fā)表于 01-20 13:37 ?765次閱讀
    從<b class='flag-5'>內(nèi)存</b>接口到PCIe/<b class='flag-5'>CXL</b>、以太網(wǎng)及光互連,高速互連芯片市場(chǎng)分析

    Penguin Solutions SMART Modular CXL NV-CMM E3.S 2T 內(nèi)存模塊通過 CXL 兼容性認(rèn)證

    失性內(nèi)存模塊已成功通過 CXL? 兼容性測(cè)試。此項(xiàng)里程碑不僅代表產(chǎn)品符合行業(yè)標(biāo)準(zhǔn),也進(jìn)一步確立 Penguin Solutions 在 CXL 先進(jìn)內(nèi)存技術(shù)領(lǐng)域中值得信賴的領(lǐng)導(dǎo)地位。該
    的頭像 發(fā)表于 01-15 15:35 ?1052次閱讀

    自動(dòng)駕駛中毫米波雷達(dá)到底有何作用?

    毫米波雷達(dá)、超聲波雷達(dá)等感知硬件,更像是一個(gè)配角,成為自動(dòng)駕駛技術(shù)實(shí)現(xiàn)的輔助硬件。那在自動(dòng)駕駛中毫米波雷達(dá)到底有何作用?
    的頭像 發(fā)表于 12-10 17:07 ?1867次閱讀
    自動(dòng)駕駛中毫米波雷達(dá)<b class='flag-5'>到底有</b>何作用?

    漢威科技薄膜鉑電阻溫度傳感器到底有多強(qiáng)

    測(cè)量溫度簡(jiǎn)單嗎?簡(jiǎn)單卻也不簡(jiǎn)單,為了測(cè)得準(zhǔn),人類已經(jīng)努力了上千年!薄膜鉑電阻溫度傳感器到底有多強(qiáng)?為何是高端溫度傳感器的代表?
    的頭像 發(fā)表于 11-28 11:51 ?781次閱讀

    64GT/s+8000MT/s:瀾起CXL 3.1芯片破解數(shù)據(jù)中心內(nèi)存瓶頸

    。 ? ? M88MX6852:性能卓越,滿足多元需求 ? M88MX6852芯片全面支持CXL.mem和CXL.io協(xié)議,其核心使命是為下一代數(shù)據(jù)中心服務(wù)器打造更高帶寬、更低延遲內(nèi)存
    的頭像 發(fā)表于 09-02 09:12 ?2599次閱讀
    64GT/s+8000MT/s:瀾起<b class='flag-5'>CXL</b> 3.1芯片破解數(shù)據(jù)中心<b class='flag-5'>內(nèi)存</b>瓶頸

    瀾起科技推出CXL? 3.1內(nèi)存擴(kuò)展控制器,助力下一代數(shù)據(jù)中心基礎(chǔ)設(shè)施性能升級(jí)

    下一代數(shù)據(jù)中心服務(wù)器提供更高帶寬、更低延遲內(nèi)存擴(kuò)展和池化解決方案。 瀾起科技CXL 3.1內(nèi)存擴(kuò)展控制器采用PCIe? 6.2物理層接口,支持最高64 GT/s的傳輸速率(x8通道)
    的頭像 發(fā)表于 09-01 10:56 ?835次閱讀

    電磁干擾“江湖三兄弟”:EMC、EMI、EMS 到底有啥區(qū)別?

    電磁干擾“江湖三兄弟”:EMC、EMI、EMS 到底有啥區(qū)別?
    的頭像 發(fā)表于 08-20 15:16 ?2685次閱讀
    電磁干擾“江湖三兄弟”:EMC、EMI、EMS <b class='flag-5'>到底有</b>啥區(qū)別?

    PCIe協(xié)議分析儀能測(cè)試哪些設(shè)備?

    場(chǎng)景:監(jiān)測(cè)GPU與主機(jī)之間的PCIe通信,分析數(shù)據(jù)傳輸效率、延遲和帶寬利用率。 應(yīng)用價(jià)值:優(yōu)化大規(guī)模AI訓(xùn)練任務(wù)的數(shù)據(jù)加載和模型參數(shù)同步,例如在GPU系統(tǒng)中測(cè)試PCIe交換機(jī)的性能和穩(wěn)定性。 FPGA
    發(fā)表于 07-25 14:09

    漫畫科普 | 功率放大器到底有哪些應(yīng)用?帶你解鎖功放經(jīng)典應(yīng)用場(chǎng)景?。ㄒ唬?/a>

    漫畫科普 | 功率放大器到底有哪些應(yīng)用?帶你解鎖功放經(jīng)典應(yīng)用場(chǎng)景?。ㄒ唬?/div>
    的頭像 發(fā)表于 06-20 20:00 ?981次閱讀
    漫畫科普 | 功率放大器<b class='flag-5'>到底有</b>哪些應(yīng)用?帶你解鎖功放經(jīng)典應(yīng)用場(chǎng)景?。ㄒ唬? />    </a>
</div>                              <div   id=

    超低功耗藍(lán)牙模組的功耗到底有

    對(duì)于BLE(低功耗藍(lán)牙)產(chǎn)品方案來說,功耗低,決定著你的產(chǎn)品待機(jī)、使用壽命是多久,或者是多久需要充一次電,推薦一個(gè)非常的好用的評(píng)估nordicBLE功耗的工具: 利用我們的這個(gè)工具,只需要把你
    發(fā)表于 05-27 22:37

    實(shí)測(cè) PTR54LS05低功耗到底有

    實(shí)測(cè) PTR54LS05低功耗到底有低?
    發(fā)表于 04-27 10:57

    第二代AMD Versal Premium系列SoC滿足各種CXL應(yīng)用需求

    。無論您是高級(jí)自適應(yīng) SoC 開發(fā)人員,還是 CXL 初學(xué)者,第二代 Versal Premium 系列都能提供靈活的 CXL 3.1 子系統(tǒng),非常適合內(nèi)存擴(kuò)展、內(nèi)存池化和
    的頭像 發(fā)表于 04-24 14:52 ?1255次閱讀
    第二代AMD Versal Premium系列SoC滿足各種<b class='flag-5'>CXL</b>應(yīng)用需求

    世邁科技最新 128GB E3.S 2T CMM內(nèi)存模塊榮獲 CXL 聯(lián)盟整合商認(rèn)證

    E3.S 2T CMM (Compute Express Link? 內(nèi)存模塊) 已正式列入 CXL 聯(lián)盟整合商名單。此次SMART再度取得成功認(rèn)證,結(jié)合先前已列入整合商清單的4-DIMM
    的頭像 發(fā)表于 04-16 10:54 ?894次閱讀

    新思科技解讀CXL 3.1標(biāo)準(zhǔn)

    Compute Express Link(CXL)于2019年首次發(fā)布,是處理器與AI加速器、內(nèi)存緩沖區(qū)、智能網(wǎng)絡(luò)接口卡、持久性存儲(chǔ)器和固態(tài)驅(qū)動(dòng)器等設(shè)備之間的開放式行業(yè)標(biāo)準(zhǔn)互連技術(shù)。作為一種行業(yè)標(biāo)準(zhǔn)
    的頭像 發(fā)表于 03-11 15:07 ?1343次閱讀
    新思科技解讀<b class='flag-5'>CXL</b> 3.1標(biāo)準(zhǔn)