91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

每塊GPU對應(yīng)16TB SSD,英偉達(dá)KV緩存虹吸高性能TLC SSD

晶芯觀察 ? 來源:未知 ? 作者:黃晶晶 ? 2026-02-10 11:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:黃晶晶

不久前,英偉達(dá)宣布其Vera Rubin平臺將采用搭載BlueField-4芯片的ICMS架構(gòu),通過卸載KV Cache突破內(nèi)存瓶頸、提升AI推理性能。該架構(gòu)單臺服務(wù)器每個GPU需額外配置16TB TLC SSD,花旗預(yù)計2026年、2027年將分別帶來占全球NAND需求總量2.8%、9.3%的新增需求。

三星電子在 2025Q4 財報電話會議上透露,除了計劃在本季度啟動 HBM4 內(nèi)存量產(chǎn)交付之外,三星存儲器業(yè)務(wù)計劃全方面積極應(yīng)對AI相關(guān)需求,重點提升面向 AI KV(鍵值)存儲需求的高性能 TLC SSD的銷售。

KV緩存對SSD存儲的需求

花旗最新報告指出,大規(guī)模AI推理面臨顯著的內(nèi)存瓶頸。Transformer模型的核心內(nèi)存優(yōu)化機制——KV Cache,通過存儲已計算的鍵值對來避免重復(fù)運算,并根據(jù)性能與容量需求分層存儲:活躍KV緩存存放于GPU HBM(G1),過渡/溢出KV緩存置于系統(tǒng)DRAM(G2),熱KV緩存則分配至本地SSD(G3)。

為針對性優(yōu)化這一架構(gòu),英偉達(dá)推出了推理上下文內(nèi)存存儲(ICMS)方案。該方案并非替代現(xiàn)有存儲層級,而是在本地SSD(G3)與企業(yè)共享存儲(G4)之間新增一個G3.5層級的專用KV Cache。這一層級能夠高效地將G4中的冷KV上下文數(shù)據(jù)轉(zhuǎn)換為G2中的暖KV緩存,并與HBM協(xié)同工作,從而顯著提升數(shù)據(jù)傳輸效率與整體AI推理性能。

在硬件實現(xiàn)上,Vera Rubin平臺采用16TB TLC SSD作為ICMS存儲介質(zhì),結(jié)合KV緩存管理器與拓?fù)涓兄{(diào)度機制,目標(biāo)實現(xiàn)三大性能突破:每秒處理令牌數(shù)最高提升5倍、能效比最高提升5倍以及更低的延遲。具體配置方面,每臺服務(wù)器搭載72塊GPU,每塊GPU對應(yīng)16TB ICMS專用NAND容量,使得單臺服務(wù)器的總NAND需求達(dá)到1152TB。

與傳統(tǒng)訓(xùn)練場景不同,推理過程依賴于大量的上下文數(shù)據(jù)存儲與快速調(diào)用能力。這一技術(shù)路徑的轉(zhuǎn)變,為NAND閃存開辟了全新的應(yīng)用場景,有望成為繼數(shù)據(jù)中心智能手機之后的重要需求增長點。

包括閃迪、美光、三星等存儲廠商都瞄準(zhǔn)了KV緩存所需SSD這一增量市場。

閃迪

面對推理場景下高并發(fā)、低延遲的嚴(yán)苛IO需求通用存儲方案往往力不從心。SANDISK DC SN861NVMe SSD正是針對此類計算密集型工作負(fù)載進(jìn)行的專項優(yōu)化。SN861容量高達(dá)16TB,其基礎(chǔ)是PCle Gen5接口,提供了翻倍的理論帶寬。

SanDisk DC SN861 NVMe SSD,憑借其卓越的性能和可靠性,獲得NVIDIA GB200 NVL72系統(tǒng)認(rèn)證,為AI模型的訓(xùn)練和推理提供強有力的支持。

美光科技

美光 9550 NVMe固態(tài)硬盤專為處理對速度、擴(kuò)展性和能效有極高要求的關(guān)鍵工作負(fù)載而設(shè)計,例如人工智能(AI)、高性能數(shù)據(jù)庫、緩存、在線事務(wù)處理(OLTP)以及高頻交易等場景。美光 9550 固態(tài)硬盤能夠支持上述及更多類型的工作負(fù)載,可靈活部署于云、數(shù)據(jù)中心、原始設(shè)備制造商(OEM)及系統(tǒng)集成商的設(shè)計方案中。其可用存儲容量最高可達(dá) 30.72TB,有助于確保實現(xiàn)最優(yōu)的存儲密度。

9550 PCIe 5.0 E1.S 形態(tài)數(shù)據(jù)中心固態(tài)硬盤已納入英偉達(dá)針對 GB200 NVL72 系統(tǒng)及衍生型號的推薦供應(yīng)商名錄(RVL)。GB200 NVL72 系統(tǒng)搭載英偉達(dá) GB200 格蕾絲?布萊克韋爾超級芯片,打造出機架級、高能效的 AI 基礎(chǔ)設(shè)施。該系統(tǒng)對 PCIe 5.0 存儲的兼容適配,讓美光 9550 固態(tài)硬盤成為優(yōu)化 AI 工作負(fù)載性能與功耗效率的理想選擇,可支撐大規(guī)模 AI 模型訓(xùn)練、萬億參數(shù)大模型實時推理,以及高性能計算(HPC)等核心場景。

三星電子

如前所述,三星電子在 2025Q4 財報電話會議上透露,計劃重點提升面向 AI KV(鍵值)存儲需求的高性能 TLC SSD的銷售。

韓媒消息稱,三星電子已正式重啟其平澤P4工廠的NAND閃存生產(chǎn)線投資,開始搬入生產(chǎn)設(shè)備。此前,該投資因市場低迷而推遲。作為2026年大規(guī)模投資計劃的一部分,三星計劃追加約10萬億韓元資本支出,重點提升DRAM、NAND閃存及晶圓代工產(chǎn)能。平澤基地擴(kuò)產(chǎn)后,預(yù)計每月將增加NAND芯片產(chǎn)能6萬片,DRAM產(chǎn)能3萬片,晶圓代工產(chǎn)能2萬片。

綠算技術(shù)

近日,本土高性能存儲廠商綠算技術(shù)(ForinnBase)宣布,其旗艦產(chǎn)品GP7000系列全閃存儲平臺已通過英偉達(dá)適配,成為全球首批、也是唯一支持G3級KV Cache分層存儲的國產(chǎn)化解決方案,為下一代AI工廠建設(shè)提供了關(guān)鍵的基礎(chǔ)設(shè)施支撐。

綠算技術(shù)GP7000系列采用以太網(wǎng)閃存簇(EBOF)設(shè)計,單系統(tǒng)配備24個PCIe 5.0 NVMe U.2盤位,通過雙主控板實現(xiàn)冗余。其核心指標(biāo)精準(zhǔn)匹配G3層需求。

單機提供6480萬IOPS、288GB/s帶寬與20μs級延遲,性能較傳統(tǒng)存儲服務(wù)器提升17倍。整機功耗<900W,每GB/s帶寬功耗僅3.1W,滿足AI工廠的5倍能效目標(biāo)。原生支持BlueField-3/4 DPU與Spectrum-X交換機,通過NVMe-oF/RoCEv2/GDS協(xié)議實現(xiàn)GPU直連。

綠算技術(shù)產(chǎn)品總監(jiān)孔維海透露:“GP7000采用DPU+ASIC+FPGA多元異構(gòu)計算架構(gòu),將KV Cache的索引管理、數(shù)據(jù)壓縮和網(wǎng)絡(luò)協(xié)議棧完全硬件卸載,消除了CPU瓶頸?!逼浞植际終V Cache管理器可與英偉達(dá)Dynamo開源項目無縫銜接,實現(xiàn)跨機架的緩存一致性。

GP7000已完成廣泛生態(tài)適配。硬件上支持英偉達(dá)DGX H100/H200/GB300、AMD Instinct MI300、華為昇騰910B/C、沐曦曦云C系列等。軟件適配英偉達(dá)Dynamo/vLLM/TensorRT-LLM、華為UCM、Kubernetes CSI等。國產(chǎn)數(shù)據(jù)庫支持OceanBase、TiDB、GaussDB等。

在大模型推理場景中,GP7000可通過命名空間隔離與智能冷熱分層技術(shù),為每個推理實例分配獨立的KV Cache分區(qū),并將高頻數(shù)據(jù)預(yù)加載至G2層,實現(xiàn)成本與效率的最優(yōu)平衡。

GP7000已于2025年Q3量產(chǎn),并獲得了某頭部云廠商數(shù)千節(jié)點訂單。公司正在研發(fā)基于PCIe 6.0的下一代GP8000,目標(biāo)是將G3級帶寬提升至1TB/s。

市場前景

花旗通過場景分析測算后認(rèn)為,ICMS架構(gòu)的規(guī)?;涞貙槿騈AND市場帶來顯著且確定的需求增量。報告預(yù)計,2026年Vera Rubin服務(wù)器出貨量將達(dá)到3萬臺,對應(yīng)ICMS架構(gòu)的NAND需求將達(dá)3460萬TB,這一需求規(guī)模占當(dāng)年全球NAND 總需求的2.8%;隨著AI 推理需求的進(jìn)一步釋放,2027年Vera Rubin 服務(wù)器出貨量有望增至10萬臺,屆時ICMS帶來的 NAN需求將飆升至1152萬TB,占全球NAND總需求的比例將提升至9.3%。

報告同時指出,當(dāng)前全球NAND市場本就處于供應(yīng)緊張的狀態(tài),近年來AI產(chǎn)業(yè)的爆發(fā)式發(fā)展已推動數(shù)據(jù)存儲需求持續(xù)攀升,NAND作為核心存儲介質(zhì)的供需平衡已較為脆弱。而英偉達(dá) ICMS架構(gòu)帶來的新增需求具有剛性強、規(guī)模大的特點,將直接打破現(xiàn)有供需格局,導(dǎo)致全球NAND供應(yīng)短缺的局面進(jìn)一步加劇。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    DRAM緩存真有那么重要嗎?天碩工業(yè)級SSD固態(tài)硬盤實測告訴你答案!

    在國產(chǎn)固態(tài)硬盤推薦榜中,推薦五花八門,很多用戶疑惑DRAM 緩存 SSD 值得買嗎?不同方案的國產(chǎn) SSD 性能對比差距到底有多大?價格差距不小,
    的頭像 發(fā)表于 01-19 16:49 ?262次閱讀

    高性能16位低功耗模數(shù)轉(zhuǎn)換器:TLC4545

    ? 在電子設(shè)計領(lǐng)域,模數(shù)轉(zhuǎn)換器(ADC)是連接模擬世界和數(shù)字世界的關(guān)鍵橋梁。今天,我們要深入探討德州儀器(TI)的兩款高性能16位低功耗模數(shù)轉(zhuǎn)換器——TLC4541和TLC4545,它
    的頭像 發(fā)表于 12-07 09:31 ?1680次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>16</b>位低功耗模數(shù)轉(zhuǎn)換器:<b class='flag-5'>TLC</b>4545

    PCIe 5.0 8TB SSD挺進(jìn)消費級市場

    電子發(fā)燒友網(wǎng)綜合報道,隨著AI應(yīng)用的廣泛落地,用戶對存儲速率和容量的需求與日俱增。近期高端消費級SSD市場不斷出現(xiàn)PCIe 5.0?8TB SSD產(chǎn)品。 ? 三星于2025年推出PCIe 5.0旗艦
    的頭像 發(fā)表于 11-22 08:05 ?4866次閱讀

    SSD為何需要DRAM緩存?天碩工業(yè)級SSD帶來深度解析!

    在當(dāng)今數(shù)字化轉(zhuǎn)型的浪潮中,工業(yè)存儲設(shè)備的選擇直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和效率。天碩工業(yè)級SSD固態(tài)硬盤憑借其卓越的DRAM緩存技術(shù),在眾多應(yīng)用場景中展現(xiàn)出獨特優(yōu)勢。本文將采用問答形式,深入探討這一關(guān)
    的頭像 發(fā)表于 10-20 17:59 ?867次閱讀
    <b class='flag-5'>SSD</b>為何需要DRAM<b class='flag-5'>緩存</b>?天碩工業(yè)級<b class='flag-5'>SSD</b>帶來深度解析!

    華納云為游戲數(shù)據(jù)庫選擇高性能NVMe SSD存儲

    游戲數(shù)據(jù)庫對速度、可靠性和可擴(kuò)展性有極高要求。隨著在線游戲的發(fā)展,開發(fā)者越來越依賴NVMe SSD存儲來提供服務(wù)器租用和服務(wù)器托管解決方案。本文將指導(dǎo)您了解為游戲數(shù)據(jù)庫選擇高性能NVMe SSD存儲
    的頭像 發(fā)表于 09-30 16:03 ?1064次閱讀

    為什么推薦 SSD 而不是 HDD 的電腦?

    。? 機械硬盤(HDD):依靠旋轉(zhuǎn)的磁盤和移動的磁頭讀寫數(shù)據(jù),類似“小型CD播放機”。盤片轉(zhuǎn)速和磁頭移動速度直接限制性能,且怕震動、噪音明顯。 ? 這種原理差異是“SSD全面優(yōu)于HDD”的核心:機械結(jié)構(gòu)的物理限制,讓HDD在速度、穩(wěn)定性等方面難以突破;而
    的頭像 發(fā)表于 09-25 16:19 ?1279次閱讀
    為什么推薦 <b class='flag-5'>SSD</b> 而不是 HDD 的電腦?

    英偉達(dá)自研HBM基礎(chǔ)裸片

    "后的下一代AI GPU "Feynman"。 ? 有分析指出,英偉達(dá)此舉或是將部分GPU功能集成到基礎(chǔ)裸片中,旨在提高HBM和GPU的整體
    的頭像 發(fā)表于 08-21 08:16 ?2792次閱讀

    沒有掉電保護(hù)的SSD為什么不適合工業(yè)級場景?

    在電力、工業(yè)自動化、軌道交通等領(lǐng)域,數(shù)據(jù)安全容不得半點馬虎。然而很多人并不知道,普通SSD在突發(fā)斷電時面臨著巨大的風(fēng)險:DRAM緩存中的數(shù)據(jù)可能還未寫入NAND閃存,就因掉電而徹底丟失。那么,沒有
    的頭像 發(fā)表于 07-16 10:54 ?610次閱讀
    沒有掉電保護(hù)的<b class='flag-5'>SSD</b>為什么不適合工業(yè)級場景?

    工業(yè)級SSD為什么需要掉電保護(hù)?天碩工業(yè)級SSD固態(tài)硬盤告訴你答案

    問題專門設(shè)計了硬件級PLP(Power Loss Protection)掉電保護(hù)技術(shù)。 PLP掉電保護(hù)通過在SSD內(nèi)部加入鉭電容陣列,在主機斷電瞬間提供短時間電力,保證數(shù)據(jù)從緩存區(qū)及時寫入閃存,避免數(shù)據(jù)丟失。與普通消費級SSD
    的頭像 發(fā)表于 07-09 17:05 ?820次閱讀

    SSD電源管理系統(tǒng)設(shè)計解決方案

    高性能計算的發(fā)展,也推動著存儲技術(shù)的演進(jìn),這些年固態(tài)硬盤(SSD)市場的火熱,就是一個例證。
    的頭像 發(fā)表于 07-07 14:16 ?1988次閱讀
    <b class='flag-5'>SSD</b>電源管理系統(tǒng)設(shè)計解決方案

    企業(yè)級SSD的核心技術(shù)與市場趨勢

    。 ? 企業(yè)級SSD的核心部件示意圖 ? 主控芯片(控制大腦) 控制數(shù)據(jù)讀寫,直接決定SSD性能、可靠性固件(操作系統(tǒng)) 確保SSD高效穩(wěn)定運行 NAND Flash、DRAM(存
    的頭像 發(fā)表于 07-06 05:34 ?7124次閱讀
    企業(yè)級<b class='flag-5'>SSD</b>的核心技術(shù)與市場趨勢

    高性能緩存設(shè)計:如何解決緩存偽共享問題

    緩存行,引發(fā)無效化風(fēng)暴,使看似無關(guān)的變量操作拖慢整體效率。本文從緩存結(jié)構(gòu)原理出發(fā),通過實驗代碼復(fù)現(xiàn)偽共享問題(耗時從3709ms優(yōu)化至473ms),解析其底層機制;同時深入剖析高性能緩存
    的頭像 發(fā)表于 07-01 15:01 ?759次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>緩存</b>設(shè)計:如何解決<b class='flag-5'>緩存</b>偽共享問題

    QLC SSD在數(shù)據(jù)中心的用途

    QLC技術(shù)通過在HDD和TLC SSD之間形成中間層來解決這些挑戰(zhàn)。與現(xiàn)有的TLC SSD相比,QLC具有更高的密度、更高的功率效率和更低的成本。
    的頭像 發(fā)表于 05-14 09:02 ?1271次閱讀
    QLC <b class='flag-5'>SSD</b>在數(shù)據(jù)中心的用途

    GPU 維修干貨 | 英偉達(dá) GPU H100 常見故障有哪些?

    上漲,英偉達(dá)H100GPU憑借其強大的算力,成為AI訓(xùn)練、高性能計算領(lǐng)域的核心硬件。然而,隨著使用場景的復(fù)雜化,H100服務(wù)器故障率也逐漸攀升,輕則影響業(yè)務(wù)進(jìn)度,重
    的頭像 發(fā)表于 05-05 09:03 ?2982次閱讀
    <b class='flag-5'>GPU</b> 維修干貨 | <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b> <b class='flag-5'>GPU</b> H100 常見故障有哪些?

    多流技術(shù):不同壽命數(shù)據(jù)存在SSD的不同塊

    根據(jù)數(shù)據(jù)的壽命將數(shù)據(jù)存放在SSD的不同塊內(nèi)可以顯著提高SSD的GC效率、減少WAF、提高SSD的壽命和性能
    的頭像 發(fā)表于 03-17 14:52 ?1195次閱讀
    多流技術(shù):不同壽命數(shù)據(jù)存在<b class='flag-5'>SSD</b>的不同塊