男人天堂Av社区,日韩色视频区亚洲另类婷婷,人人操AV人人操

新聞?wù)?/p>

NVIDIA BlueField-4 為 NVIDIA 推理上下文記憶存儲(chǔ)平臺(tái)提供支持，這是一種專為超大規(guī)模推理而設(shè)計(jì)的新型 AI 原生存儲(chǔ)基礎(chǔ)設(shè)施，旨在加速和擴(kuò)展代理式 AI。

全新存儲(chǔ)處理器平臺(tái)專為長(zhǎng)上下文處理的代理式 AI 系統(tǒng)而構(gòu)建，并具備超快速的長(zhǎng)短期記憶功能。

推理上下文記憶存儲(chǔ)平臺(tái)可擴(kuò)展 AI 智能體的長(zhǎng)期記憶，并實(shí)現(xiàn)了機(jī)架級(jí) AI 系統(tǒng)集群之間的高帶寬上下文共享，從而將每秒處理的 token 數(shù)量和能效提升高達(dá) 5 倍。

憑借 NVIDIA Spectrum-X 以太網(wǎng)，多輪 AI 智能體的擴(kuò)展上下文記憶可提高響應(yīng)速度、提高每個(gè) GPU 的吞吐量，并支持智能體推理的高效擴(kuò)展。

拉斯維加斯 —— CES —— 太平洋時(shí)間 2026 年 1 月 5 日—NVIDIA 宣布，NVIDIA BlueField?-4 數(shù)據(jù)處理器作為全棧NVIDIA BlueField平臺(tái)的一部分，為 NVIDIA 推理上下文記憶存儲(chǔ)平臺(tái)提供支持，這是一種新型 AI 原生存儲(chǔ)基礎(chǔ)設(shè)施，專為 AI 新前沿而打造。

隨著 AI 模型擴(kuò)展到數(shù)萬(wàn)億參數(shù)和多步驟推理，它們會(huì)生成大量的上下文數(shù)據(jù)，并以鍵值 (KV) 緩存表示，這對(duì)準(zhǔn)確性、用戶體驗(yàn)和連續(xù)性至關(guān)重要。

鍵值 (KV) 緩存無法長(zhǎng)期存儲(chǔ)在 GPU 上，因?yàn)檫@會(huì)成為多智能體系統(tǒng)中實(shí)時(shí)推理的瓶頸。AI 原生應(yīng)用需要一種新型的可擴(kuò)展基礎(chǔ)設(shè)施來存儲(chǔ)和共享這些數(shù)據(jù)。

NVIDIA 推理上下文記憶存儲(chǔ)平臺(tái)通過擴(kuò)展 GPU 內(nèi)存容量，為上下文記憶提供基礎(chǔ)設(shè)施，實(shí)現(xiàn)跨節(jié)點(diǎn)的高速共享，與傳統(tǒng)存儲(chǔ)相比，可將每秒處理的 token 數(shù)量和能效提升高達(dá) 5 倍。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示：“AI 正在徹底改變整個(gè)計(jì)算堆棧，現(xiàn)在，存儲(chǔ)也加入了這場(chǎng)變革。AI 不再是那種單次交互的聊天機(jī)器人，而是能夠理解物理世界、進(jìn)行長(zhǎng)期推理、基于事實(shí)、使用工具完成實(shí)際工作并兼具短期和長(zhǎng)期記憶的智能協(xié)作伙伴。借助 BlueField-4，NVIDIA 及其軟硬件合作伙伴正在為 AI 新前沿重塑存儲(chǔ)堆棧。”

NVIDIA 推理上下文記憶存儲(chǔ)平臺(tái)可提升鍵值 (KV) 緩存容量，并加速機(jī)架級(jí) AI 系統(tǒng)集群之間的上下文共享，同時(shí)為多輪 AI 智能體的上下文持久地提高響應(yīng)速度和 AI 工廠吞吐量，并支持長(zhǎng)上下文、多智能體推理的高效擴(kuò)展。

基于 NVIDIA BlueField-4 提供支持的平臺(tái)，主要功能包括：

NVIDIA Rubin集群級(jí)鍵值 (KV) 緩存容量，可提供長(zhǎng)上下文、多輪智能體推理所需的規(guī)模和效率。

與傳統(tǒng)存儲(chǔ)相比，能效提升高達(dá) 5 倍。

基于 NVIDIA DOCA? 框架，實(shí)現(xiàn)了 AI 節(jié)點(diǎn)之間鍵值 (KV) 緩存的智能加速共享，并與 NVIDIA NIXL 庫(kù)和 NVIDIA Dynamo 軟件緊密集成，從而更大限度地提高每秒 token 處理數(shù)量，縮短首個(gè) token 生成所需的時(shí)間，并提高多輪響應(yīng)速度。

由 NVIDIA BlueField-4 管理的硬件加速鍵值 (KV) 緩存部署可消除元數(shù)據(jù)開銷，減少數(shù)據(jù)傳輸，并確保從 GPU 節(jié)點(diǎn)進(jìn)行安全隔離的訪問。

NVIDIA Spectrum-X? 以太網(wǎng)實(shí)現(xiàn)了高效的數(shù)據(jù)共享和檢索，為基于 RDMA 訪問的 AI 原生鍵值 (KV) 緩存提供了高性能網(wǎng)絡(luò)架構(gòu)。

包括 AIC、Cloudian、DDN、Dell Technologies、HPE、Hitachi Vantara、IBM、Nutanix、Pure Storage、Supermicro、VAST Data 和WEKA在內(nèi)的存儲(chǔ)領(lǐng)域創(chuàng)新者，已率先使用了 BlueField-4 構(gòu)建新一代 AI 存儲(chǔ)平臺(tái)，并將于 2026 年下半年上市。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴