91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA BlueField-4數(shù)據(jù)處理器重塑新型AI原生存儲(chǔ)基礎(chǔ)設(shè)施

NVIDIA英偉達(dá) ? 來源:NVIDIA英偉達(dá) ? 2026-01-09 10:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

新聞?wù)?/p>

NVIDIA BlueField-4 為 NVIDIA 推理上下文記憶存儲(chǔ)平臺(tái)提供支持,這是一種專為超大規(guī)模推理而設(shè)計(jì)的新型 AI 原生存儲(chǔ)基礎(chǔ)設(shè)施,旨在加速和擴(kuò)展代理式 AI。

全新存儲(chǔ)處理器平臺(tái)專為長(zhǎng)上下文處理的代理式 AI 系統(tǒng)而構(gòu)建,并具備超快速的長(zhǎng)短期記憶功能。

推理上下文記憶存儲(chǔ)平臺(tái)可擴(kuò)展 AI 智能體的長(zhǎng)期記憶,并實(shí)現(xiàn)了機(jī)架級(jí) AI 系統(tǒng)集群之間的高帶寬上下文共享,從而將每秒處理的 token 數(shù)量和能效提升高達(dá) 5 倍。

憑借 NVIDIA Spectrum-X 以太網(wǎng),多輪 AI 智能體的擴(kuò)展上下文記憶可提高響應(yīng)速度、提高每個(gè) GPU 的吞吐量,并支持智能體推理的高效擴(kuò)展。

拉斯維加斯 —— CES —— 太平洋時(shí)間 2026 年 1 月 5 日—NVIDIA 宣布,NVIDIA BlueField?-4 數(shù)據(jù)處理器作為全棧NVIDIA BlueField平臺(tái)的一部分,為 NVIDIA 推理上下文記憶存儲(chǔ)平臺(tái)提供支持,這是一種新型 AI 原生存儲(chǔ)基礎(chǔ)設(shè)施,專為 AI 新前沿而打造。

隨著 AI 模型擴(kuò)展到數(shù)萬(wàn)億參數(shù)和多步驟推理,它們會(huì)生成大量的上下文數(shù)據(jù),并以鍵值 (KV) 緩存表示,這對(duì)準(zhǔn)確性、用戶體驗(yàn)和連續(xù)性至關(guān)重要。

鍵值 (KV) 緩存無法長(zhǎng)期存儲(chǔ)在 GPU 上,因?yàn)檫@會(huì)成為多智能體系統(tǒng)中實(shí)時(shí)推理的瓶頸。AI 原生應(yīng)用需要一種新型的可擴(kuò)展基礎(chǔ)設(shè)施來存儲(chǔ)和共享這些數(shù)據(jù)。

NVIDIA 推理上下文記憶存儲(chǔ)平臺(tái)通過擴(kuò)展 GPU 內(nèi)存容量,為上下文記憶提供基礎(chǔ)設(shè)施,實(shí)現(xiàn)跨節(jié)點(diǎn)的高速共享,與傳統(tǒng)存儲(chǔ)相比,可將每秒處理的 token 數(shù)量和能效提升高達(dá) 5 倍。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“AI 正在徹底改變整個(gè)計(jì)算堆棧,現(xiàn)在,存儲(chǔ)也加入了這場(chǎng)變革。AI 不再是那種單次交互的聊天機(jī)器人,而是能夠理解物理世界、進(jìn)行長(zhǎng)期推理、基于事實(shí)、使用工具完成實(shí)際工作并兼具短期和長(zhǎng)期記憶的智能協(xié)作伙伴。借助 BlueField-4,NVIDIA 及其軟硬件合作伙伴正在為 AI 新前沿重塑存儲(chǔ)堆棧。”

NVIDIA 推理上下文記憶存儲(chǔ)平臺(tái)可提升鍵值 (KV) 緩存容量,并加速機(jī)架級(jí) AI 系統(tǒng)集群之間的上下文共享,同時(shí)為多輪 AI 智能體的上下文持久地提高響應(yīng)速度和 AI 工廠吞吐量,并支持長(zhǎng)上下文、多智能體推理的高效擴(kuò)展。

基于 NVIDIA BlueField-4 提供支持的平臺(tái),主要功能包括:

NVIDIA Rubin集群級(jí)鍵值 (KV) 緩存容量,可提供長(zhǎng)上下文、多輪智能體推理所需的規(guī)模和效率。

與傳統(tǒng)存儲(chǔ)相比,能效提升高達(dá) 5 倍。

基于 NVIDIA DOCA? 框架,實(shí)現(xiàn)了 AI 節(jié)點(diǎn)之間鍵值 (KV) 緩存的智能加速共享,并與 NVIDIA NIXL 庫(kù)和 NVIDIA Dynamo 軟件緊密集成,從而更大限度地提高每秒 token 處理數(shù)量,縮短首個(gè) token 生成所需的時(shí)間,并提高多輪響應(yīng)速度。

由 NVIDIA BlueField-4 管理的硬件加速鍵值 (KV) 緩存部署可消除元數(shù)據(jù)開銷,減少數(shù)據(jù)傳輸,并確保從 GPU 節(jié)點(diǎn)進(jìn)行安全隔離的訪問。

NVIDIA Spectrum-X? 以太網(wǎng)實(shí)現(xiàn)了高效的數(shù)據(jù)共享和檢索,為基于 RDMA 訪問的 AI 原生鍵值 (KV) 緩存提供了高性能網(wǎng)絡(luò)架構(gòu)。

包括 AIC、Cloudian、DDN、Dell Technologies、HPE、Hitachi Vantara、IBM、Nutanix、Pure Storage、Supermicro、VAST Data 和WEKA在內(nèi)的存儲(chǔ)領(lǐng)域創(chuàng)新者,已率先使用了 BlueField-4 構(gòu)建新一代 AI 存儲(chǔ)平臺(tái),并將于 2026 年下半年上市。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20248

    瀏覽量

    252119
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5592

    瀏覽量

    109704
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39707

    瀏覽量

    301302

原文標(biāo)題:CES 2026 | NVIDIA BlueField-4 助力新型 AI 原生存儲(chǔ)基礎(chǔ)設(shè)施,推動(dòng) AI 邁向新前沿

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    DPU數(shù)據(jù)處理器的核心功能和應(yīng)用領(lǐng)域

    DPU,全稱數(shù)據(jù)處理器(Data Processing Unit),是一種專門用于處理數(shù)據(jù)中心中數(shù)據(jù)流動(dòng)與基礎(chǔ)設(shè)施任務(wù)的專用
    的頭像 發(fā)表于 02-02 13:52 ?520次閱讀
    DPU<b class='flag-5'>數(shù)據(jù)處理器</b>的核心功能和應(yīng)用領(lǐng)域

    NVIDIA BlueField-4為推理上下文記憶存儲(chǔ)平臺(tái)提供強(qiáng)大支持

    隨著代理式 AI 工作流將上下文窗口擴(kuò)展到數(shù)百萬(wàn)個(gè) token,并將模型規(guī)模擴(kuò)展到數(shù)百萬(wàn)億個(gè)參數(shù),AI 原生企業(yè)正面臨著越來越多的擴(kuò)展挑戰(zhàn)。這些系統(tǒng)目前依賴于智能體長(zhǎng)期記憶來存儲(chǔ)跨多輪
    的頭像 發(fā)表于 02-02 10:29 ?991次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>BlueField-4</b>為推理上下文記憶<b class='flag-5'>存儲(chǔ)</b>平臺(tái)提供強(qiáng)大支持

    NVIDIA在CES 2026發(fā)布新一代Rubin AI平臺(tái)

    通過跨 NVIDIA Vera CPU、Rubin GPU、NVLink 6 交換機(jī)、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太網(wǎng)交換機(jī)的極致協(xié)同設(shè)計(jì),大幅縮短訓(xùn)練時(shí)間,降低推理 token 生成成本。
    的頭像 發(fā)表于 01-09 10:23 ?608次閱讀

    NVIDIA在ISC 2025分享最新超級(jí)計(jì)算進(jìn)展

    NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代網(wǎng)絡(luò)和量子技術(shù)實(shí)現(xiàn)了飛躍。在 SC25 上展示的加速系統(tǒng)突顯了全球超級(jí)計(jì)算和 AI 的進(jìn)展
    的頭像 發(fā)表于 11-25 10:59 ?889次閱讀
    <b class='flag-5'>NVIDIA</b>在ISC 2025分享最新超級(jí)計(jì)算進(jìn)展

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服務(wù)為
    的頭像 發(fā)表于 11-03 14:48 ?967次閱讀

    NVIDIA通過全新 Omniverse庫(kù)、Cosmos物理AI模型及AI計(jì)算基礎(chǔ)設(shè)施,為機(jī)器人領(lǐng)域開啟新篇章

    NVIDIA 通過全新 Omniverse 庫(kù)、Cosmos 物理 AI 模型及 AI 計(jì)算基礎(chǔ)設(shè)施,為機(jī)器人領(lǐng)域開啟新篇章 ? ·?全新 NVID
    的頭像 發(fā)表于 08-12 11:29 ?1766次閱讀
    <b class='flag-5'>NVIDIA</b>通過全新 Omniverse庫(kù)、Cosmos物理<b class='flag-5'>AI</b>模型及<b class='flag-5'>AI</b>計(jì)算<b class='flag-5'>基礎(chǔ)設(shè)施</b>,為機(jī)器人領(lǐng)域開啟新篇章

    NVIDIA DOCA 3.0版本的亮點(diǎn)解析

    NVIDIA DOCA 框架已發(fā)展成為新一代 AI 基礎(chǔ)設(shè)施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發(fā)布,每個(gè)版本都擴(kuò)展了
    的頭像 發(fā)表于 07-04 14:27 ?1233次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA 3.0版本的亮點(diǎn)解析

    歐洲聯(lián)手NVIDIA打造AI基礎(chǔ)設(shè)施

    NVIDIA 于近日宣布,其正在攜手歐洲各國(guó)、科技和行業(yè)領(lǐng)導(dǎo)者,共同建造 NVIDIA Blackwell AI 基礎(chǔ)設(shè)施,以強(qiáng)化數(shù)字主權(quán)、支撐經(jīng)濟(jì)增長(zhǎng),并推動(dòng)歐洲大陸成為
    的頭像 發(fā)表于 06-16 14:25 ?1422次閱讀

    維諦加速推進(jìn)人工智能基礎(chǔ)設(shè)施演進(jìn),助力NVIDIA 800 VDC 電源架構(gòu)發(fā)布

    :VRT)今日宣布與NVIDIA在人工智能發(fā)展路線圖方面達(dá)成高度戰(zhàn)略協(xié)同。NVIDIA發(fā)布全新規(guī)劃,旨在為下一代AI數(shù)據(jù)中心部署800VDC電源基礎(chǔ)
    的頭像 發(fā)表于 05-22 14:18 ?1093次閱讀
    維諦加速推進(jìn)人工智能<b class='flag-5'>基礎(chǔ)設(shè)施</b>演進(jìn),助力<b class='flag-5'>NVIDIA</b> 800 VDC 電源架構(gòu)發(fā)布

    英偉達(dá)GTC2025亮點(diǎn):NVIDIA認(rèn)證計(jì)劃擴(kuò)展至企業(yè)存儲(chǔ)領(lǐng)域,加速AI工廠部署

    全新的存儲(chǔ)認(rèn)證和參考架構(gòu)讓企業(yè) IT 部門能更輕松地選擇和部署 AI 基礎(chǔ)設(shè)施,實(shí)現(xiàn)最優(yōu)的性能和能效。 AI 部署的成功依靠速度、數(shù)據(jù)和規(guī)模
    的頭像 發(fā)表于 03-21 19:38 ?2046次閱讀

    英偉達(dá)GTC2025亮點(diǎn):Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    基礎(chǔ)設(shè)施以及生成式 AI 服務(wù)首次實(shí)現(xiàn)集成,以幫助全球企業(yè)組織加速創(chuàng)建代理式 AI 應(yīng)用。 此次 Oracle Cloud Infrastructure (OCI) 與 NVIDIA
    的頭像 發(fā)表于 03-21 12:01 ?1424次閱讀
    英偉達(dá)GTC2025亮點(diǎn):Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業(yè)加速代理式<b class='flag-5'>AI</b>推理

    英偉達(dá)GTC2025亮點(diǎn):NVIDIA與行業(yè)領(lǐng)先存儲(chǔ)企業(yè)共同推出面向AI時(shí)代的新型企業(yè)基礎(chǔ)設(shè)施

    存儲(chǔ)提供商構(gòu)建搭載 AI 查詢智能體的基礎(chǔ)設(shè)施,利用 NVIDIA 計(jì)算、網(wǎng)絡(luò)和軟件,針對(duì)復(fù)雜查詢進(jìn)行推理并快速生成準(zhǔn)確響應(yīng) NVIDIA
    的頭像 發(fā)表于 03-21 09:42 ?1318次閱讀

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計(jì)算和推理軟件與 Oracle 的 AI 基礎(chǔ)設(shè)施以及生成式 AI 服務(wù)首
    發(fā)表于 03-19 15:24 ?575次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)加速代理式 <b class='flag-5'>AI</b> 推理

    NVIDIA 與行業(yè)領(lǐng)先的存儲(chǔ)企業(yè)共同推出面向 AI 時(shí)代的新型企業(yè)基礎(chǔ)設(shè)施

    3 月 18 日 —— NVIDIA 今日推出了 NVIDIA AI 數(shù)據(jù)平臺(tái) —— 一項(xiàng)可自定義的參考設(shè)計(jì),領(lǐng)先的存儲(chǔ)提供商可用來構(gòu)建全
    發(fā)表于 03-19 10:11 ?496次閱讀
    <b class='flag-5'>NVIDIA</b> 與行業(yè)領(lǐng)先的<b class='flag-5'>存儲(chǔ)</b>企業(yè)共同推出面向 <b class='flag-5'>AI</b> 時(shí)代的<b class='flag-5'>新型</b>企業(yè)<b class='flag-5'>基礎(chǔ)設(shè)施</b>

    Vgg16模型無法使用模型優(yōu)化器重塑怎么解決?

    Vgg16 模型無法使用模型優(yōu)化器重塑
    發(fā)表于 03-06 06:29