91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

全新NVIDIA Nemotron 3 Super模型重磅發(fā)布

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2026-03-16 16:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一款全新的開放 1,200 億參數(shù)混合式 MoE (mixture?of?experts) 模型,專為 NVIDIA Blackwell 進(jìn)行了優(yōu)化,可解決拖慢自主智能體工作流的長時(shí)推理和上下文爆炸的成本難題。

NVIDIA Nemotron 3 Super 于今日發(fā)布,其為一款 1,200 億參數(shù)開放模型,擁有 120 億個(gè)活躍參數(shù),旨在大規(guī)模運(yùn)行復(fù)雜的代理式 AI 系統(tǒng)。

該模型現(xiàn)已上線,融合先進(jìn)的推理能力,能夠高效并精準(zhǔn)地完成自主智能體的任務(wù)。

AI 原生公司:Perplexity 不僅為用戶提供 Nemotron 3 Super 訪問權(quán)限用于搜索,還將其作為 ‘Computer’ 平臺中 20 個(gè)編排模型的組成部分。CodeRabbit、Factory 和 Greptile 等提供軟件開發(fā)智能體的公司將該模型與自有模型結(jié)合,并集成到 AI 智能體中,在降低成本的同時(shí)提升準(zhǔn)確性。Edison Scientific 和 Lila Sciences 等生命科學(xué)及前沿 AI 機(jī)構(gòu)則將借助該模型為其智能體賦予深度文獻(xiàn)檢索、數(shù)據(jù)科學(xué)與分子理解能力。

企業(yè)軟件平臺:Amdocs、Palantir、Cadence、達(dá)索系統(tǒng)和西門子等行業(yè)領(lǐng)先企業(yè),正部署并定制該模型,用于電信、網(wǎng)絡(luò)安全、半導(dǎo)體設(shè)計(jì)與制造等領(lǐng)域的工作流自動化。

企業(yè)從聊天機(jī)器人向多智能體應(yīng)用演進(jìn)時(shí),會面臨兩大制約因素。

第一個(gè)制約因素是上下文爆炸。與標(biāo)準(zhǔn)聊天相比,多智能體工作流生成的 token 數(shù)量多達(dá)其 15 倍,因?yàn)槊看谓换ザ夹枰匦掳l(fā)送完整的歷史記錄,包括工具輸出和中間推理結(jié)果。

在長任務(wù)中,這樣龐大的上下文不僅增加了成本,還可能導(dǎo)致目標(biāo)偏離,即智能體在執(zhí)行過程中逐漸脫離最初設(shè)定的任務(wù)目標(biāo)。

第二個(gè)制約因素則是思考稅。復(fù)雜智能體每一步都必須進(jìn)行推理,但如果每個(gè)子任務(wù)都使用大模型,多智能體應(yīng)用就會變得成本高昂和遲緩,難以投入實(shí)際使用。

Nemotron 3 Super 擁有一個(gè) 100 萬 token 的上下文窗口,允許智能體在顯存中保留完整的工作流狀態(tài),并防止目標(biāo)偏離。

Nemotron 3 Super 樹立了新標(biāo)準(zhǔn),在 Artificial Analysis 的效率和開放性排名中位居榜首,并在同等規(guī)模的模型中展現(xiàn)出領(lǐng)先的準(zhǔn)確性。

該模型還助力 NVIDIA AI-Q 研究智能體在 DeepResearch Bench 和 DeepResearch Bench II 排行榜上取得第一名。這些基準(zhǔn)測試旨在衡量 AI 系統(tǒng)在海量文檔中開展全面多步驟研究,并保持推理連貫性的能力。

混合架構(gòu)

Nemotron 3 Super 采用了混合 MoE (mixture?of?experts) 架構(gòu),結(jié)合了三項(xiàng)主要?jiǎng)?chuàng)新,與之前的 Nemotron Super 模型相比,實(shí)現(xiàn)了高達(dá) 5 倍的吞吐量提升和高達(dá) 2 倍的準(zhǔn)確率提升。

混合架構(gòu):Mamba 層實(shí)現(xiàn) 4 倍顯存與計(jì)算效率提升,Transformer 層則提供高級推理能力。

混合專家 (MoE):在其 1,200 億參數(shù)中,推理時(shí)僅激活 120 億參數(shù)。

潛在混合專家 (MoE) 架構(gòu):這是一種新的推理技術(shù),它以單個(gè)專家的成本來激活四個(gè)專家,從而顯著提升 token 生成的準(zhǔn)確率。

多 token 預(yù)測:能夠同時(shí)預(yù)測多個(gè)未來的詞語,從而使推理速度提高 3 倍。

在 NVIDIA Blackwell 平臺上,該模型以 NVFP4 精度運(yùn)行,降低了顯存需求,并使推理速度較之在 NVIDIA Hopper 平臺上使用 FP8 至高提升 4 倍,同時(shí)不損失準(zhǔn)確性。

開放權(quán)重、數(shù)據(jù)和方案

NVIDIA 將 Nemotron 3 Super 的權(quán)重完全開放,并配以寬松許可協(xié)議。開發(fā)者可在工作站、數(shù)據(jù)中心或云端來進(jìn)行部署和定制。

Nemotron 3 Super 基于前沿推理模型生成的合成數(shù)據(jù)訓(xùn)練而成。NVIDIA 將公布完整的訓(xùn)練方法,其中包括超過 10 萬億個(gè) token 的預(yù)訓(xùn)練和后訓(xùn)練數(shù)據(jù)集,15 個(gè)用于強(qiáng)化學(xué)習(xí)的訓(xùn)練環(huán)境以及評估方案。研究人員還可借助 NVIDIA NeMo 平臺對模型進(jìn)行微調(diào)或構(gòu)建專屬模型。

在代理式系統(tǒng)中的應(yīng)用

Nemotron 3 Super 旨在處理多智能體系統(tǒng)中的復(fù)雜子任務(wù)。

一個(gè)軟件開發(fā)智能體可以一次性將整個(gè)代碼庫加載到上下文中,從而實(shí)現(xiàn)端到端的代碼生成和調(diào)試,且無需進(jìn)行文檔分割。

在金融分析中,它能夠?qū)?shù)千頁的報(bào)告加載到顯存中,避免在長對話中重復(fù)推理,從而提高效率。

Nemotron 3 Super 具有高精度的工具調(diào)用能力,確保自主智能體能夠在海量的函數(shù)庫中導(dǎo)航,避免在高風(fēng)險(xiǎn)環(huán)境中出現(xiàn)執(zhí)行錯(cuò)誤 (例如網(wǎng)絡(luò)安全中的自主安全編排)。

如何獲取

NVIDIA Nemotron 3 Super 作為 Nemotron 3 系列的一部分,可通過 NVIDIA 官網(wǎng)、Perplexity、OpenRouter 和 Hugging Face 獲取。戴爾科技公司正將該模型引入 Hugging Face 上的 Dell Enterprise Hub,并針對 Dell AI Factory 的本地部署進(jìn)行了優(yōu)化,以推動多智能體 AI 工作流的發(fā)展。慧與 (HPE) 也將 NVIDIA Nemotron 引入其 Agents Hub,幫助確保在企業(yè)中擴(kuò)展應(yīng)用代理式 AI 。

企業(yè)與開發(fā)者可通過多家合作伙伴部署該模型:

云服務(wù)提供商:谷歌云的 Vertex AI、Oracle Cloud Infrastructure;即將登陸亞馬遜云科技的 Amazon Bedrock 及 Microsoft Azure。

NVIDIA 云合作伙伴:Coreweave、Crusoe、Nebius 與 Together AI。

推理服務(wù)提供商:Baseten、CloudFlare、DeepInfra、Fireworks AI、Inference.net、Lightning AI、Modal 和 FriendliAI。

數(shù)據(jù)平臺與服務(wù):Distyl、Dataiku、DataRobot、德勤、安永及塔塔咨詢服務(wù)。

該模型以 NVIDIA NIM 形式提供,支持從本地系統(tǒng)到云端的部署。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5608

    瀏覽量

    109856
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40040

    瀏覽量

    301684
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3767

    瀏覽量

    52138

原文標(biāo)題:全新 NVIDIA Nemotron 3 Super 將代理式 AI 吞吐量提升 5 倍

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA Jetson模型賦能AI在邊緣端落地

    開源生成式 AI 模型不再局限于數(shù)據(jù)中心,而是開始深入到現(xiàn)實(shí)世界的各種機(jī)器中。從 Orin 到 Thor,NVIDIA Jetson 系列正在成為運(yùn)行 NVIDIA Nemotron、
    的頭像 發(fā)表于 03-16 16:27 ?116次閱讀
    <b class='flag-5'>NVIDIA</b> Jetson<b class='flag-5'>模型</b>賦能AI在邊緣端落地

    利用NVIDIA Nemotron開放模型構(gòu)建智能文檔處理系統(tǒng)

    基于 NVIDIA Nemotron 開放模型的 AI 驅(qū)動文檔智能,增強(qiáng)科學(xué)研究、金融和法律等領(lǐng)域工作流。
    的頭像 發(fā)表于 02-25 11:21 ?492次閱讀

    NVIDIA在CES 2026發(fā)布全新開放模型、數(shù)據(jù)和工具

    為擴(kuò)展開放模型生態(tài),NVIDIA 發(fā)布全新開放模型、數(shù)據(jù)和工具,推動各行業(yè) AI 技術(shù)的發(fā)展。
    的頭像 發(fā)表于 01-09 10:42 ?587次閱讀

    深入解析NVIDIA Nemotron 3系列開放模型

    這一全新開放模型系列引入了開放的混合 Mamba-Transformer MoE 架構(gòu),使多智能體系統(tǒng)能夠進(jìn)行快速長上下文推理。
    的頭像 發(fā)表于 12-24 10:34 ?4134次閱讀
    深入解析<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b> <b class='flag-5'>3</b>系列開放<b class='flag-5'>模型</b>

    NVIDIA 推出 Nemotron 3 系列開放模型

    新聞?wù)?● Nemotron 3 系列開放模型包含 Nano、Super 和 Ultra 三種規(guī)模,具有極高的效率和領(lǐng)先的精度,適用于代理式 AI 應(yīng)用開發(fā)。 ●
    的頭像 發(fā)表于 12-16 09:27 ?659次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>Nemotron</b> <b class='flag-5'>3</b> 系列開放<b class='flag-5'>模型</b>

    NVIDIA攜手Mistral AI發(fā)布全新開源大語言模型系列

    全新 Mistral 3 系列涵蓋從前沿級到緊湊型模型,針對 NVIDIA 平臺進(jìn)行了優(yōu)化,助力 Mistral AI 實(shí)現(xiàn)云到邊緣分布式智能愿景。
    的頭像 發(fā)表于 12-13 09:58 ?1275次閱讀

    NVIDIA推動面向數(shù)字與物理AI的開源模型發(fā)展

    NVIDIA 發(fā)布一系列涵蓋語音、安全與輔助駕駛領(lǐng)域的全新 AI 工具,其中包括面向移動出行領(lǐng)域的行業(yè)級開源視覺-語言-動作推理模型(Reasoning VLA)
    的頭像 發(fā)表于 12-13 09:50 ?1369次閱讀

    使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025構(gòu)建高性能AI應(yīng)用

    搜索和調(diào)用外部 AI 模型的 SQL 原生 API。NVIDIA 與微軟共同將 SQL Server 2025 與 NVIDIA Nemotron RAG 開放
    的頭像 發(fā)表于 12-01 09:31 ?830次閱讀
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b> RAG和Microsoft SQL Server 2025構(gòu)建高性能AI應(yīng)用

    面向科學(xué)仿真的開放模型系列NVIDIA Apollo正式發(fā)布

    用于加速工業(yè)和計(jì)算工程的開放模型系列 NVIDIA Apollo 于近日舉行的 SC25 大會上正式發(fā)布。
    的頭像 發(fā)表于 11-25 11:15 ?7.4w次閱讀

    NVIDIA Nemotron模型如何推動AI發(fā)展

    Nemotron 開源技術(shù)能夠幫助開發(fā)者與企業(yè)構(gòu)建強(qiáng)大的通用和專用智能系統(tǒng)。
    的頭像 發(fā)表于 10-13 11:12 ?1055次閱讀

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準(zhǔn)確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?1824次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b> Nano 2推理<b class='flag-5'>模型</b><b class='flag-5'>發(fā)布</b>

    歐洲借助NVIDIA Nemotron優(yōu)化主權(quán)大語言模型

    NVIDIA 正攜手歐洲和中東的模型構(gòu)建商與云提供商,共同優(yōu)化主權(quán)大語言模型 (LLM),加速該地區(qū)各行業(yè)采用企業(yè)級 AI。
    的頭像 發(fā)表于 06-12 15:42 ?1224次閱讀

    ServiceNow攜手NVIDIA構(gòu)建150億參數(shù)超級助手

    Apriel Nemotron 15B 開源大語言模型 (LLM) 使用 NVIDIA NeMo、NVIDIA Llama Nemotron
    的頭像 發(fā)表于 05-12 15:37 ?944次閱讀

    企業(yè)使用NVIDIA NeMo微服務(wù)構(gòu)建AI智能體平臺

    發(fā)布的 NeMo 微服務(wù)可與合作伙伴平臺集成,作為創(chuàng)建 AI 智能體的構(gòu)建模塊,使用商業(yè)智能與強(qiáng)大的邏輯推理模型 (包括 NVIDIA Llama Nemotron) 處理更多任務(wù)。
    的頭像 發(fā)表于 04-27 15:05 ?1318次閱讀

    NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺

    NVIDIA 后訓(xùn)練的全新 Llama Nemotron 推理模型,為代理式 AI 提供業(yè)務(wù)就緒型基礎(chǔ) 埃森哲、Amdocs、Atlassian、Box、Cadence、Crowd
    發(fā)表于 03-19 09:31 ?402次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開放推理 AI <b class='flag-5'>模型</b>系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺