91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CXL對(duì)數(shù)據(jù)中心的意義

sakobpqhz6 ? 來(lái)源:IC學(xué)習(xí) ? 作者:IC學(xué)習(xí) ? 2022-12-05 15:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

CXL(Compute Express Link)將成為一種變革性技術(shù),將重新定義數(shù)據(jù)中心的架構(gòu)和構(gòu)建方式。這是因?yàn)?CXL 為跨芯片的緩存一致性、內(nèi)存擴(kuò)展和內(nèi)存池提供了標(biāo)準(zhǔn)化協(xié)議。在本文中,我們將重點(diǎn)介紹微軟正在做的事情,以幫助大家了解CXL對(duì)數(shù)據(jù)中心的意義。

數(shù)據(jù)中心是一件非常昂貴的事情。微軟表示,他們高達(dá)50% 的服務(wù)器成本僅來(lái)自 DRAM。所需的資本支出是巨大的,但您構(gòu)建的服務(wù)器并不是同質(zhì)的。工作負(fù)載不是靜態(tài)的。它們?cè)诓粩嗟爻砷L(zhǎng)和進(jìn)化。計(jì)算資源、DRAM、NAND 和網(wǎng)絡(luò)類(lèi)型的組合將根據(jù)工作負(fù)載而變化。

一刀切的模式是行不通的,這就是為什么您會(huì)看到云提供商擁有數(shù)十種甚至數(shù)百種不同的實(shí)例類(lèi)型。這些正在嘗試針對(duì)不同的工作負(fù)載優(yōu)化硬件產(chǎn)品。即便如此,許多用戶(hù)最終還是為他們真正不需要的東西付費(fèi)。

實(shí)例選擇并不完美,這些實(shí)例與硬件的匹配也不完美。隨之而來(lái)的是平臺(tái)級(jí)內(nèi)存擱淺問(wèn)題。服務(wù)器配置為不合適的實(shí)例類(lèi)型場(chǎng)景。

3e4df38a-73ac-11ed-8abf-dac502259ad0.png

這個(gè)問(wèn)題的解決方案是內(nèi)存池。多個(gè)服務(wù)器可以共享一部分內(nèi)存,并且可以動(dòng)態(tài)地將其分配給不同的服務(wù)器。與其過(guò)度地配置服務(wù)器,不如將它們配置為更接近平均 DRAM 與內(nèi)核的比率,并且可以通過(guò)內(nèi)存池來(lái)解決客戶(hù)的過(guò)多 DRAM 需求。此內(nèi)存池將通過(guò) CXL 協(xié)議進(jìn)行通信。未來(lái),隨著對(duì) CXL 協(xié)議的修訂,服務(wù)器甚至可以共享相同的內(nèi)存來(lái)處理相同的工作負(fù)載,這將進(jìn)一步減少 DRAM 需求。

擁有大規(guī)模應(yīng)用程序的復(fù)雜運(yùn)營(yíng)商可以通過(guò)向其開(kāi)發(fā)人員提供具有不同帶寬和延遲的多層內(nèi)存來(lái)解決這個(gè)問(wèn)題。這對(duì)于亞馬遜、谷歌、微軟和其他公司運(yùn)營(yíng)的公共云環(huán)境來(lái)說(shuō)是站不住腳的。

Microsoft 概述了與公共云環(huán)境中的內(nèi)存池有關(guān)的 3 個(gè)主要功能挑戰(zhàn)。無(wú)法修改客戶(hù)工作負(fù)載,包括guest操作系統(tǒng)。內(nèi)存池系統(tǒng)還必須與虛擬化加速技術(shù)兼容,例如直接將 I/O 設(shè)備分配給 VM 和 SR-IOV。池化還必須可用于商用硬件。

在過(guò)去他們也試過(guò)內(nèi)存池,但它需要自定義硬件設(shè)計(jì)、更改 VM guest并依賴(lài)頁(yè)面錯(cuò)誤。這種組合使其無(wú)法部署在云中。這就是 CXL 的用武之地。英特爾、AMD 和多個(gè) Arm 合作伙伴已經(jīng)加入了該標(biāo)準(zhǔn)。帶有 CXL 的 CPU 將于今年晚些時(shí)候開(kāi)始問(wèn)世。此外,三星、美光和 SKHynix 三大 DRAM 制造商也都承諾支持該標(biāo)準(zhǔn)。

即使有硬件供應(yīng)商的廣泛支持,仍有很多問(wèn)題需要回答。在硬件方面:應(yīng)該如何構(gòu)建內(nèi)存池以及如何平衡池大小與較大池的較高延遲?在軟件方面:如何管理這些池并將池暴露給guest操作系統(tǒng),云工作負(fù)載可以容忍多少額外的內(nèi)存延遲?

在分布層:提供者應(yīng)如何在具有 CXL 內(nèi)存的機(jī)器上調(diào)度 VM,內(nèi)存中的哪些項(xiàng)目應(yīng)存儲(chǔ)在池中與直接連接的內(nèi)存中,它們能否預(yù)測(cè)內(nèi)存行為和延遲敏感性有助于產(chǎn)生更好的性能,如果是,準(zhǔn)確度如何這些是預(yù)測(cè)嗎?

微軟提出了這些問(wèn)題,并試圖回答這些問(wèn)題。我們將在這里概述他們的發(fā)現(xiàn)。他們的第一代的解決方案架構(gòu)取得了令人印象深刻的成果。

隨著未來(lái) CXL 版本的推出和延遲降低,這些收益可能會(huì)進(jìn)一步擴(kuò)大。

首先是硬件層。Microsoft 使用直接連接到 8 到 32 個(gè)插槽 CPU 的多端口外部存儲(chǔ)器對(duì)此進(jìn)行了測(cè)試。內(nèi)存擴(kuò)展是通過(guò)連接 CXL 的外部?jī)?nèi)存控制器 (EMC) 完成的,該控制器具有四個(gè) 80 位 ECC DDR5 池 DRAM 通道和多個(gè) CXL 鏈路,以允許多個(gè) CPU 插槽訪問(wèn)內(nèi)存。此 EMC 管理請(qǐng)求并跟蹤分配給各個(gè)主機(jī)的各個(gè)內(nèi)存區(qū)域的所有權(quán)。

3e7248fc-73ac-11ed-8abf-dac502259ad0.png

CXL x8 通道的帶寬約為 DDR5 內(nèi)存通道的帶寬。每個(gè) CPU 都有自己更快的本地內(nèi)存,但它也可以訪問(wèn)具有更高延遲的 CXL 池化內(nèi)存,相當(dāng)于單個(gè) NUMA 躍點(diǎn)???CXL 控制器和 PHY、可選重定時(shí)器、傳播延遲和外部存儲(chǔ)器控制器的延遲增加了 67ns 到 87ns。

下圖顯示了當(dāng)前本地 DRAM 的固定百分比(10%、30% 和 50%)切換到池化資源。池化內(nèi)存與本地內(nèi)存的百分比越大,節(jié)省的 DRAM 就越多。就 DRAM 節(jié)省而言,增加Socket數(shù)量會(huì)很快消失。

3e99762a-73ac-11ed-8abf-dac502259ad0.png

雖然更大的池大小和更多的socket看起來(lái)是最好的選擇,但這里有更多的性能和延遲影響。如果池大小降為 4 到 8 個(gè) CPU 插槽,則不需要重定時(shí)器。這將延遲從 87ns 降低到 67ns。此外,在這些較小的插槽數(shù)中,EMC 可以直接連接到所有 CPU 插槽。

更大的 32 個(gè)插槽池將 EMC 連接到不同的 CPU 子集。這將允許在更多數(shù)量的 CPU 插槽之間共享,同時(shí)保持 CPU 端口的 EMC 設(shè)備數(shù)量固定。這里需要重定時(shí)器,這導(dǎo)致每個(gè)方向的延遲為 10ns。

3ecb2012-73ac-11ed-8abf-dac502259ad0.png

在軟件方面,解決方案相當(dāng)巧妙。

Microsoft 經(jīng)常部署多插槽系統(tǒng)。在大多數(shù)情況下,VM 足夠小,它們完全適合單個(gè) NUMA 節(jié)點(diǎn)、內(nèi)核和內(nèi)存。Azure 的管理程序嘗試將所有核心和內(nèi)存放在單個(gè) NUMA 節(jié)點(diǎn)上,但在極少數(shù)情況下(2% 的時(shí)間),VM 有一部分資源跨越socket。這不會(huì)暴露給用戶(hù)。

內(nèi)存池在功能上的工作方式相同。內(nèi)存設(shè)備將作為零核虛擬 zNUMA 節(jié)點(diǎn)公開(kāi),沒(méi)有內(nèi)核,只有內(nèi)存。內(nèi)存偏離這個(gè) zNUMA 內(nèi)存節(jié)點(diǎn),但允許溢出。粒度(granularity)是每片內(nèi)存 1GB 。

分布式系統(tǒng)軟件層依賴(lài)于對(duì) VM 的內(nèi)存延遲敏感度的預(yù)測(cè)。未觸及的存儲(chǔ)被稱(chēng)為“frigid memory”。Azure 估計(jì)第 50 個(gè)百分位的 VM 具有 50% 的冷(frigid)內(nèi)存。這個(gè)數(shù)字似乎很圓。預(yù)計(jì)對(duì)內(nèi)存延遲不敏感的 VM 完全支持池 DRAM。為內(nèi)存敏感的 VM 配置了一個(gè) zNUMA 節(jié)點(diǎn),僅用于它們的冷內(nèi)存。預(yù)測(cè)是在虛擬機(jī)部署時(shí)完成的,但它是異步管理的,并在檢測(cè)到預(yù)測(cè)不正確時(shí)更改虛擬機(jī)放置。

這些算法的準(zhǔn)確性對(duì)于節(jié)省基礎(chǔ)設(shè)施成本至關(guān)重要。如果操作不當(dāng),性能影響可能會(huì)很大。

3f01ce6e-73ac-11ed-8abf-dac502259ad0.png

考慮到潛在的性能影響可能是巨大的,將云居民(cloud resident)的內(nèi)存移動(dòng)到 67ns 到 87ns 的池中是非常糟糕的。

因此,Microsoft 在兩種情況下對(duì) 158 個(gè)工作負(fù)載進(jìn)行了基準(zhǔn)測(cè)試。一種是只有本地 DRAM 的控制。另一個(gè)是模擬 CXL 內(nèi)存。應(yīng)該強(qiáng)調(diào)的是,盡管英特爾早前聲稱(chēng)其支持 Sapphire Rapids CXL 的平臺(tái)將于 2021 年底推出?;蛘呗暦Q(chēng) Sapphire Rapids 將于 2022 年初推出。因此,微軟必須模擬延遲影響。Microsoft 使用了 2 路 24C Skylake SP 系統(tǒng)。

3f4d6dd8-73ac-11ed-8abf-dac502259ad0.png

當(dāng)帶寬超過(guò) 80GB/s 時(shí),內(nèi)存訪問(wèn)延遲為 78ns。當(dāng)一個(gè) CPU 跨 NUMA 邊界訪問(wèn)另一個(gè) CPU 的內(nèi)存時(shí),會(huì)導(dǎo)致額外的 64ns 內(nèi)存延遲。這非常接近外部存儲(chǔ)設(shè)備 (EMC) 在低插槽數(shù)系統(tǒng)中的 67ns 額外延遲。

20% 的工作負(fù)載沒(méi)有性能影響。另有 23% 的工作負(fù)載出現(xiàn)了不到 5% 的減速。25% 的工作負(fù)載嚴(yán)重減速,性能下降超過(guò) 20%,其中 12% 的工作負(fù)載甚至出現(xiàn)超過(guò) 30% 的性能下降。根據(jù)工作負(fù)載的本地與池內(nèi)存量,該數(shù)字會(huì)發(fā)生相當(dāng)大的變化。

3f8cdcfc-73ac-11ed-8abf-dac502259ad0.png

這進(jìn)一步強(qiáng)調(diào)了預(yù)測(cè)模型的重要性。Microsoft 的基于隨機(jī)森林(random forest) ML 的預(yù)測(cè)模型更準(zhǔn)確,并且產(chǎn)生的誤報(bào)減速更少。隨著更多的內(nèi)存被池化,越多變得越重要。

隨著 CXL 規(guī)范的改進(jìn)、延遲的降低和預(yù)測(cè)模型的改進(jìn),內(nèi)存池節(jié)省的可能性可能會(huì)增長(zhǎng)到云服務(wù)器成本的兩位數(shù)百分比

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54076

    瀏覽量

    466985
  • NAND
    +關(guān)注

    關(guān)注

    16

    文章

    1758

    瀏覽量

    141142
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    18

    文章

    5671

    瀏覽量

    75081

原文標(biāo)題:為什么看好CXL?一文看懂!

文章出處:【微信號(hào):IC學(xué)習(xí),微信公眾號(hào):IC學(xué)習(xí)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AOC光纖跳線在數(shù)據(jù)中心的應(yīng)用與發(fā)展趨勢(shì)

    數(shù)據(jù)中心作為信息時(shí)代的核心基礎(chǔ)設(shè)施,承擔(dān)著數(shù)據(jù)的存儲(chǔ)、處理和傳輸?shù)戎匾蝿?wù)。隨著云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)的快速發(fā)展,數(shù)據(jù)中心數(shù)據(jù)量呈
    的頭像 發(fā)表于 02-25 09:57 ?133次閱讀

    1分鐘帶你了解數(shù)據(jù)中心供電架構(gòu) #電子元器件 #數(shù)據(jù)中心 #供電架構(gòu)

    數(shù)據(jù)中心
    沛城芯動(dòng)力
    發(fā)布于 :2026年02月03日 15:39:04

    數(shù)據(jù)中心UPS并機(jī)方案:公用電池組的優(yōu)缺點(diǎn)深度分析

    數(shù)據(jù)中心
    上海優(yōu)比施電子科技有限公司
    發(fā)布于 :2026年01月31日 09:32:34

    數(shù)據(jù)中心發(fā)展的三大驅(qū)動(dòng)力

    “新基建”的大背景下,數(shù)據(jù)中心行業(yè)發(fā)展迅猛。數(shù)據(jù)中心是數(shù)字經(jīng)濟(jì)時(shí)代的數(shù)字銀行和數(shù)據(jù)資源庫(kù),新興產(chǎn)業(yè)的未來(lái)發(fā)展,數(shù)據(jù)中心是核心基礎(chǔ)設(shè)施平臺(tái),所有的互聯(lián)網(wǎng)和大
    的頭像 發(fā)表于 12-26 10:34 ?411次閱讀

    CPU 一腳油門(mén)電壓猛跌?疊層超低ESR電容把“過(guò)山車(chē)”拉平 #數(shù)據(jù)中心#網(wǎng)關(guān)

    數(shù)據(jù)中心
    上海永銘電子股份有限公司
    發(fā)布于 :2025年12月22日 14:59:05

    新思科技ZeBu助力富士通數(shù)據(jù)中心創(chuàng)新

    全球企業(yè)和政府正積極尋求解決方案,應(yīng)對(duì)數(shù)據(jù)中心能耗迅速增長(zhǎng)問(wèn)題,開(kāi)發(fā)下一代“綠色”數(shù)據(jù)中心——既具備高性能,又兼具高能效的設(shè)施。全球科技巨頭富士通在先進(jìn)處理器開(kāi)發(fā)領(lǐng)域已領(lǐng)先 60 年,致力于開(kāi)發(fā)更節(jié)能、更可持續(xù)的數(shù)據(jù)中心。
    的頭像 發(fā)表于 12-17 10:26 ?706次閱讀

    人工智能數(shù)據(jù)中心的光纖布線策略

    隨著人工智能(AI)技術(shù)的飛速發(fā)展,數(shù)據(jù)中心的光纖布線策略正面臨前所未有的挑戰(zhàn)和機(jī)遇。AI的高帶寬需求、低延遲要求以及大規(guī)模并行計(jì)算的特點(diǎn),對(duì)數(shù)據(jù)中心的光纖布線提出了更高的要求。本文將從多個(gè)方面探討
    的頭像 發(fā)表于 11-21 10:21 ?439次閱讀

    物聯(lián)網(wǎng)數(shù)據(jù)中心是什么?有什么功能?

    物聯(lián)網(wǎng)數(shù)據(jù)中心是集成和管理物聯(lián)網(wǎng)設(shè)備數(shù)據(jù)的核心平臺(tái),具備數(shù)據(jù)采集、處理、存儲(chǔ)、分析、可視化及安全管控等功能,其本質(zhì)是通過(guò)技術(shù)融合實(shí)現(xiàn)物理世界與數(shù)字世界的雙向交互與智能決策。以下從定義、功能、技術(shù)特點(diǎn)
    的頭像 發(fā)表于 09-22 17:14 ?1125次閱讀

    中型數(shù)據(jù)中心中的差分晶體振蕩器應(yīng)用與匹配方案

    中型數(shù)據(jù)中心的定義與特點(diǎn) 中型數(shù)據(jù)中心通常服務(wù)于中大型企業(yè)、科研機(jī)構(gòu)或地方行業(yè)節(jié)點(diǎn),具備50至200個(gè)機(jī)柜,部署多臺(tái)服務(wù)器、交換設(shè)備、存儲(chǔ)系統(tǒng)與光通信鏈路等,強(qiáng)調(diào)高帶寬、低延遲與高可用性。關(guān)鍵設(shè)備
    發(fā)表于 07-01 16:33

    小型數(shù)據(jù)中心晶振選型關(guān)鍵參數(shù)全解

    小型數(shù)據(jù)中心的定義與應(yīng)用 小型數(shù)據(jù)中心通常是為中小型企業(yè)、邊緣計(jì)算、物聯(lián)網(wǎng)(IoT)設(shè)備及其他特定業(yè)務(wù)需求提供計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)服務(wù)的設(shè)施。與大型數(shù)據(jù)中心相比,小型數(shù)據(jù)中心的物理空間較小
    發(fā)表于 06-11 13:37

    曙光數(shù)創(chuàng)SLiquid智能運(yùn)維系統(tǒng)解決數(shù)據(jù)中心運(yùn)維難題

    對(duì)數(shù)字時(shí)代的海量需求,傳統(tǒng)數(shù)據(jù)中心正遭遇系統(tǒng)性挑戰(zhàn):告警風(fēng)暴引發(fā)的故障定位遲滯、能效困局導(dǎo)致的PUE優(yōu)化瓶頸、資產(chǎn)迷霧造成的資源錯(cuò)配、容量盲區(qū)引發(fā)的規(guī)劃失焦。這些問(wèn)題嚴(yán)重阻礙了數(shù)據(jù)中心從成本
    的頭像 發(fā)表于 06-03 10:21 ?1009次閱讀

    數(shù)據(jù)中心都在用的差分晶振,看完你就懂了

    數(shù)據(jù)中心
    FCom富士晶振
    發(fā)布于 :2025年05月30日 13:12:30

    數(shù)據(jù)中心液冷技術(shù)和風(fēng)冷技術(shù)的比較

    近年來(lái),隨著數(shù)字經(jīng)濟(jì)的蓬勃發(fā)展,數(shù)據(jù)中心建設(shè)規(guī)模不斷擴(kuò)大,導(dǎo)致機(jī)房單位面積功耗居高不下,對(duì)數(shù)據(jù)中心散熱制冷技術(shù)提出了更高的要求。同時(shí),根據(jù)國(guó)家對(duì)數(shù)據(jù)中心的節(jié)能要求,全國(guó)范圍內(nèi)新建數(shù)據(jù)中心
    的頭像 發(fā)表于 05-09 09:41 ?4220次閱讀
    <b class='flag-5'>數(shù)據(jù)中心</b>液冷技術(shù)和風(fēng)冷技術(shù)的比較

    適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)

    和性能隔離能力,以保障不同用戶(hù)任務(wù)互不干擾。 分布式AI計(jì)算與網(wǎng)絡(luò)架構(gòu)設(shè)計(jì) 分布式計(jì)算已成為AI訓(xùn)練的主流方式,通過(guò)將工作負(fù)載分配到多個(gè)GPU節(jié)點(diǎn)并行處理,以加速模型訓(xùn)練。這對(duì)數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)
    發(fā)表于 03-25 17:35

    優(yōu)化800G數(shù)據(jù)中心:高速線纜、有源光纜和光纖跳線解決方案

    隨著技術(shù)的飛速發(fā)展,數(shù)據(jù)中心正在從100G和400G演進(jìn)到800G時(shí)代,對(duì)高速數(shù)據(jù)傳輸?shù)男枨笈c日俱增。因此,選擇高效且可靠的布線解決方案對(duì)于800G數(shù)據(jù)中心至關(guān)重要。本文將深入探討800G數(shù)據(jù)
    發(fā)表于 03-24 14:20