91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA Vera Rubin平臺開啟代理式AI前沿

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 2026-03-18 14:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

七款全新芯片全面投產,旨在通過為 AI 各階段(從預訓練、后訓練、測試時擴展,到智能體式推理)提供全面優(yōu)化的可配置 AI 基礎設施,擴展全球最大 AI 工廠的規(guī)模。

新聞摘要:

NVIDIA Vera Rubin 平臺正開啟下一個 AI 前沿:

Vera Rubin NVL72 GPU 機架

Vera CPU 機架

NVIDIA Groq 3 LPX 推理加速器機架

NVIDIA BlueField-4 STX 存儲機架

NVIDIA Spectrum-6 SPX 以太網機架

加利福尼亞州圣何塞 — GTC — 太平洋時間 2026 年 3 月 16 日— NVIDIA 今日宣布,NVIDIA Vera Rubin 平臺正開啟代理式 AI 的下一個前沿。目前,該平臺搭載的七款新芯片現(xiàn)已全面投產,旨在擴展全球最大 AI 工廠的規(guī)模。

該平臺集成了 NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink? 6 交換機、NVIDIA ConnectX?-9 SuperNIC、NVIDIA BlueField?-4 DPU 和 NVIDIA Spectrum?-6 以太網交換機,以及新納入的 NVIDIA Groq 3 LPU。這些芯片設計為協(xié)同運作,構成一臺強大的 AI 超級計算機,可為 AI 的各個階段提供動力——從大規(guī)模預訓練、后訓練、測試階段擴展到實時智能體式推理。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“Vera Rubin 是一次劃時代的飛躍——七款突破性芯片、五種機架、一臺巨型超級計算機——旨在為 AI 的每個階段提供澎湃動力。代理式 AI 的拐點已經到來,Vera Rubin 正拉開歷史上最大規(guī)模的基礎設施建設序幕。”

“企業(yè)和開發(fā)者正在使用 Claude 進行日益復雜的推理、智能體工作流以及關鍵任務的決策,這要求基礎設施必須能夠跟上步伐?!盇nthropic CEO 兼聯(lián)合創(chuàng)始人 Dario Amodei 表示。“NVIDIA 的 Vera Rubin 平臺為我們提供了計算、網絡和系統(tǒng)設計,使我們在不斷提升客戶所依賴的安全性和可靠性的同時,能夠持續(xù)提供卓越性能?!?/p>

OpenAI 首席執(zhí)行官 Sam Altman 表示:“NVIDIA 的基礎設施是讓我們不斷推動 AI 前沿發(fā)展的基石。借助 NVIDIA Vera Rubin,我們將能夠以大規(guī)模運行更強大的模型和智能體,并為數億用戶提供更快速、更可靠的系統(tǒng)?!?/p>

轉向 POD 級系統(tǒng)

AI 基礎設施正快速演進——從分立芯片和單機服務器,向完全集成的機架級擴展系統(tǒng)、POD 級部署、AI 工廠和主權 AI 發(fā)展。這些進步正推動性能實現(xiàn)跨越式增長,并為各個行業(yè)各種規(guī)模的機構提升成本效益,從初創(chuàng)公司、中型企業(yè),到公共和私營機構和大型企業(yè)。同時,這也有助于普及 AI 技術,并提高能效,從而為全球最嚴苛的工作負載提供動力。

通過跨計算、網絡與存儲的深度協(xié)同設計,并依托由 80 多家 NVIDIA MGX 生態(tài)系統(tǒng)合作伙伴組成的全球供應鏈,NVIDIA Vera Rubin 提供了迄今規(guī)模最大的 NVIDIA POD 級平臺——這是一款超級計算機,其中多個專為 AI 設計的機架協(xié)同運作,構成一個龐大且統(tǒng)一的強大系統(tǒng)。

NVIDIA Vera Rubin NVL72 機架

Vera Rubin NVL72 集成了通過 NVLink 6 互連的 72 個 Rubin GPU 和 36 個 Vera CPU,并配備了 ConnectX-9 SuperNIC 與 BlueField-4 DPU,從而實現(xiàn)了突破性的效率表現(xiàn)。與 NVIDIA Blackwell 平臺相比,Vera Rubin NVL72 僅需四分之一數量的 GPU 即可訓練大型混合專家模型,每瓦特推理吞吐量最高可提升 10 倍的同時,每 Token 成本僅為原平臺的十分之一。

NVL72 專為全球超大規(guī)模 AI 工廠設計,通過 NVIDIA Quantum-X800 InfiniBand 和 Spectrum-X 以太網實現(xiàn)無縫擴展,保持大規(guī)模 GPU 集群的高利用率,同時縮短訓練時間并降低總體擁有成本。

NVIDIA Vera CPU 機架

強化學習和代理式 AI 工作負載依賴大量基于 CPU 的環(huán)境,來測試和驗證在 GPU 系統(tǒng)上運行的模型所生成的結果。

NVIDIA Vera CPU 機架提供基于 NVIDIA MGX 打造的高密度液冷基礎設施,單機架集成 256 個 Vera CPU,以全球領先的單線程性能,提供可擴展且高能效的算力,從而解鎖大規(guī)模代理式 AI 的潛力。

與 Spectrum-X 以太網集成后,Vera CPU 機架確保 CPU 環(huán)境在整個 AI 工廠內保持高度同步。與 GPU 計算機架協(xié)同,它們?yōu)榇笠?guī)模代理式 AI 與強化學習提供堅實的 CPU 基礎——Vera 的性能表現(xiàn)比傳統(tǒng) CPU 效率提升一倍,速度提升了 50%。

NVIDIA Groq 3 LPX 機架

NVIDIA Groq 3 LPX 標志著加速計算領域的一個重要里程碑。專為智能體系統(tǒng)的低延遲和長上下文需求而設計,LPX 與 Vera Rubin 強強聯(lián)合,匯聚了兩款處理器的極致性能,使得每兆瓦的推理吞吐量提升高達 35 倍,并為萬億參數模型帶來了多達 10 倍的營收機遇。

大規(guī)模部署時,由 LPU 組成的集群能夠作為一個巨大的單一邏輯處理器運行,提供快速、確定性的推理加速。LPX 機架搭載 256 個 LPU 處理器,配備 128GB 片上 SRAM 和 640 TB/s 的縱向擴展帶寬。與 Vera Rubin NVL72 協(xié)同部署時,Rubin GPU 和 LPU 通過協(xié)同計算 AI 模型的每一層來生成每一個 Token,從而顯著提升解碼速度。

為萬億參數模型和百萬級 Token 上下文而優(yōu)化協(xié)同設計的 LPX 架構,與 Vera Rubin 強強聯(lián)合,最大限度地提高了功耗、內存和計算方面的效率。每瓦特吞吐量和 Token 性能的提升,開啟了超高端、萬億參數、百萬上下文推理的新紀元,為所有 AI 提供商拓展了營收機遇。該架構采用全液冷設計,并基于 MGX 基礎設施構建,可無縫集成到下一代 Vera Rubin AI 工廠中,預計將在今年下半年面世。

NVIDIA BlueField-4 STX 存儲機架

NVIDIA BlueField-4 STX機架級擴展系統(tǒng)作為 AI 原生存儲基礎設施,可在整個 POD 中無縫擴展 GPU 內存。STX 由 BlueField-4 提供支持,集成了 NVIDIA Vera CPU 與 NVIDIA ConnectX-9 SuperNIC。該平臺提供了高帶寬共享層,且優(yōu)化了存儲和檢索大語言模型與代理式 AI 工作流產生的海量 KV 緩存數據。

全新推出的 DOCA 軟件框架 NVIDIA DOCA Memos? 可顯著提升 BlueField-4 存儲性能。通過專用的 KV 緩存存儲處理技術,與通用存儲架構相比,可將推理吞吐量提升 5 倍,并顯著提高能效。最終實現(xiàn) POD 范圍內的上下文共享,從而加快與 AI 智能體的多輪交互速度,提供更具可擴展性的 AI 服務,并提高整體基礎設施利用率。

Mistral AI 聯(lián)合創(chuàng)始人兼首席技術官 Timothée Lacroix 表示:“NVIDIA BlueField-4 STX 機架級擴展上下文記憶存儲系統(tǒng)將提供關鍵的性能提升,使我們能夠實現(xiàn)代理式 AI 的指數級擴展。通過提供一個專為 AI 智能體記憶設計的全新存儲層,STX 能夠確保我們的模型在跨海量數據集進行推理時依然保持連貫性和速度?!?/p>

NVIDIA Spectrum-6 SPX 以太網機架

Spectrum-6 SPX 以太網專為加速 AI 工廠“東西向”流量而設計。該機架可靈活配置 Spectrum-X 以太網交換機或 NVIDIA Quantum-X800 InfiniBand 交換機,能夠在大規(guī)模部署中提供低延遲、高吞吐量的機架間互連。

采用光電一體封裝 (CPO) 的 Spectrum-X 以太網硅光技術,相比傳統(tǒng)可插拔收發(fā)器,光學能效最高提升 5 倍,系統(tǒng)可靠性提高 10 倍。

提升可靠性與能效

NVIDIA 攜手超過 200 家數據中心基礎設施合作伙伴,共同推出了針對 Vera Rubin 的 NVIDIA DSX 平臺,其包含 DSX Max-Q,旨在為整個 AI 工廠實現(xiàn)動態(tài)供電,從而在固定功率的數據中心內部署的 AI 基礎設施數量可增加 30%。此外,全新的 DSX Flex 軟件使 AI 工廠轉變?yōu)殡娋W柔性資產,從而釋放 1000 億瓦的閑置電網容量。

NVIDIA 今日還發(fā)布了Vera Rubin DSX AI Factory 參考設計,為協(xié)同設計的 AI 基礎設施提供藍圖,旨在最大化每瓦特 Token 產出和整體有效吞吐,增強系統(tǒng)可靠性,并縮短首次投產時間。

通過深度集成計算、網絡、存儲、供電與冷卻系統(tǒng),該架構顯著提升了能源效率,確保 AI 工廠在持續(xù)、高強度負載下,仍能可靠擴展,實現(xiàn)最大化的正常運行時間。

廣泛的生態(tài)系統(tǒng)支持

今年下半年,合作伙伴將陸續(xù)推出基于 Vera Rubin 的產品,包括領先的云服務提供商 Amazon Web Services、Google Cloud、Microsoft Azure 和 Oracle Cloud Infrastructure,以及 NVIDIA 云合作伙伴 CoreWeave、Crusoe、Lambda、Nebius、Nscale和 Together AI。

思科、戴爾科技、HPE、聯(lián)想和 Supermicro 等全球系統(tǒng)制造商預計將推出一系列基于 Vera Rubin 產品的服務器,包括Aivres、華碩、Foxconn、技嘉、Inventec、Pegatron、Quanta Cloud Technology (QCT)、Wistron 和 Wiwynn 在內的其他廠商也將提供相關產品。

包括 Anthropic、Meta、Mistral AI 和 OpenAI 在內的 AI 實驗室與前沿大模型開發(fā)商,計劃采用 NVIDIA Vera Rubin 平臺訓練規(guī)模更大、能力更強的模型,并以比以往 GPU 更低的延遲和成本提供長上下文與多模態(tài)系統(tǒng)服務。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5627

    瀏覽量

    109874
  • AI
    AI
    +關注

    關注

    91

    文章

    40126

    瀏覽量

    301745

原文標題:GTC2026 | NVIDIA Vera Rubin 開啟代理式 AI 前沿

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA發(fā)布Vera Rubin DSX AI Factory參考設計

    NVIDIA 今日宣布推出 NVIDIA Vera Rubin DSX AI Factory 參考設計,這是一份用于構建協(xié)同設計的
    的頭像 發(fā)表于 03-18 14:42 ?92次閱讀

    NVIDIA推出Vera CPU以顯著提升系統(tǒng)性能與能效

    NVIDIA 今日發(fā)布 NVIDIA Vera CPU,這是全球首款專為代理式 AI 與強化學習時代打造的處理器,其效率是傳統(tǒng)機架級 CPU
    的頭像 發(fā)表于 03-18 14:33 ?172次閱讀

    英偉達Rubin平臺引入微通道冷板技術,100%全液冷設計

    電子發(fā)燒友網報道(文/李彎彎)英偉達在近期舉辦的 CES 2026 展會上,正式推出了其全新的 Vera Rubin 計算平臺。作為繼 Blackwell 架構之后的又一力作,Rubin
    的頭像 發(fā)表于 01-19 07:15 ?1.2w次閱讀

    NVIDIA DGX SuperPOD為Rubin平臺橫向擴展提供藍圖

    NVIDIA DGX Rubin 系統(tǒng)整合了 NVIDIA 在計算、網絡和軟件領域的最新突破,將推理 token 成本降至 NVIDIA Blackwell
    的頭像 發(fā)表于 01-14 09:14 ?677次閱讀

    NVIDIA在CES 2026發(fā)布新一代Rubin AI平臺

    通過跨 NVIDIA Vera CPU、Rubin GPU、NVLink 6 交換機、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太網交換機的極致協(xié)同設計,大幅縮短訓練時間
    的頭像 發(fā)表于 01-09 10:23 ?651次閱讀

    Supermicro宣布支持即將推出的NVIDIA Vera Rubin NVL72與HGX Rubin NVL8,并擴大機柜制造產能,提供更佳的液冷AI解決方案

    /邊緣領域的全方位IT解決方案供應商,宣布擴大制造產能、強化液冷技術,并與NVIDIA展開合作,推動NVIDIA Vera RubinRubin
    的頭像 發(fā)表于 01-07 16:49 ?748次閱讀
    Supermicro宣布支持即將推出的<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Vera</b> <b class='flag-5'>Rubin</b> NVL72與HGX <b class='flag-5'>Rubin</b> NVL8,并擴大機柜制造產能,提供更佳的液冷<b class='flag-5'>AI</b>解決方案

    代理式 AI 重構 EDA:從對話助手到虛擬工程師

    電子發(fā)燒友網報道(文?/?吳子鵬)代理式?AI(Agentic AI)作為?AI?領域的新興方向,是一種能夠通過自主感知、推理、規(guī)劃與執(zhí)行,獨立完成復雜多步驟任務的?
    的頭像 發(fā)表于 08-28 07:54 ?3226次閱讀

    代理式AIAI智能體在不同行業(yè)中的實際應用

    代理式 AI 的時代已經到來。如今,代理式 AI 已經驅動應用邁向深度場景融合與規(guī)?;涞?。這波演進浪潮標志著 AI 能力向自主執(zhí)行的躍遷。
    的頭像 發(fā)表于 07-28 14:28 ?1243次閱讀

    NVIDIA全棧加速代理式AI應用落地

    在近期舉辦的 AWS 中國峰會上,NVIDIA 聚焦于“NVIDIA 全棧加速代理式 AI 應用落地”,深入探討了代理式
    的頭像 發(fā)表于 07-14 11:41 ?1346次閱讀

    Blue Lion超級計算機將在NVIDIA Vera Rubin上運行

    德國萊布尼茨超算中心(LRZ)將迎來全新超級計算機 Blue Lion,其算力比該中心現(xiàn)有的 SuperMUC-NG 高性能計算機提升了約 30 倍。這臺新的超級計算機將在 NVIDIA Vera Rubin 架構上運行。
    的頭像 發(fā)表于 06-12 15:39 ?1184次閱讀

    NVIDIA攜手微軟加速代理式AI發(fā)展

    代理式 AI 正在重新定義科學探索,推動各行各業(yè)的研究突破和創(chuàng)新發(fā)展。NVIDIA 和微軟正通過深化合作提供先進的技術,從云到 PC 加速代理式 A
    的頭像 發(fā)表于 05-27 14:03 ?1089次閱讀

    基于代理式AI建立網絡安全防御體系

    NVIDIA AI 安全棧為先進的代理式系統(tǒng)提供信任、控制和管理支持。
    的頭像 發(fā)表于 05-07 14:29 ?1187次閱讀

    英偉達GTC2025亮點:Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    Oracle 數據庫與 NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,
    的頭像 發(fā)表于 03-21 12:01 ?1480次閱讀
    英偉達GTC2025亮點:Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業(yè)加速<b class='flag-5'>代理式</b><b class='flag-5'>AI</b>推理

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    Oracle 數據庫與 NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI ? ? ? 美國加利福尼亞州圣何塞 —— GTC? —— 2025 年 3 月 18 日
    發(fā)表于 03-19 15:24 ?586次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)加速<b class='flag-5'>代理式</b> <b class='flag-5'>AI</b> 推理

    NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構建代理式 AI 平臺

    NVIDIA 后訓練的全新 Llama Nemotron 推理模型,為代理式 AI 提供業(yè)務就緒型基礎 埃森哲、Amdocs、Atlassian、Box、Cadence、CrowdStrike
    發(fā)表于 03-19 09:31 ?403次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開放推理 <b class='flag-5'>AI</b> 模型系列,助力開發(fā)者和企業(yè)構建<b class='flag-5'>代理式</b> <b class='flag-5'>AI</b> <b class='flag-5'>平臺</b>