自發(fā)布以來,NVIDIA 通過持續(xù)的軟件優(yōu)化以及與軟件合作伙伴和開源社區(qū)的緊密協(xié)作,不斷提升基于 Grace Blackwell 架構(gòu)的DGX Spark的性能。這些舉措在推理、訓(xùn)練和創(chuàng)意工作流方面都取得了顯著的成效。
在 CES 2026 上,全新的 DGX Spark 軟件版本結(jié)合新的模型更新和開源庫,為 DGX Spark 以及基于 GB10 的 OEM 系統(tǒng)帶來了顯著的性能提升。
使用統(tǒng)一內(nèi)存和NVFP4本地擴展大模型
DGX Spark 專為大模型本地化應(yīng)用而設(shè)計,配備 128GB 統(tǒng)一內(nèi)存,并采用緊湊的桌面形態(tài)。兩臺 DGX Spark 系統(tǒng)互連可提供 256GB 的組合內(nèi)存,支持開發(fā)者能夠在本地運行更大的模型。
系統(tǒng)通過 ConnectX-7 網(wǎng)絡(luò)連接,提供 200Gbps 帶寬,實現(xiàn)高速、低延遲的多節(jié)點工作負載。
支持 NVIDIA NVFP4 數(shù)據(jù)格式,可使新一代模型大幅降低內(nèi)存占用,同時提升吞吐量。例如,在相同的雙 DGX Spark 配置上,使用 NVFP4 精度和推測解碼運行 Qwen-235B 模型,相比 FP8 執(zhí)行性能最高提升 2.6 倍。
使用 FP8 精度時,該模型會耗盡兩臺系統(tǒng)的組合內(nèi)存,從而限制多任務(wù)處理和整體響應(yīng)速度。將模型量化為 NVFP4 后,可將內(nèi)存使用量減少約 40%,同時保持高精度,使開發(fā)者能夠在獲得 FP8 等效結(jié)果的同時實現(xiàn)更高性能,并釋放足夠內(nèi)存以同時運行其他工作負載。最終使本地 AI 開發(fā)體驗更加響應(yīng)迅速且高效。
為創(chuàng)作者打造的強大桌面平臺
DGX Spark 不僅是 AI 開發(fā)者的卓越平臺,創(chuàng)作者也能充分利用其桌面級功能。
通過將 AI 工作負載轉(zhuǎn)移到 DGX Spark,創(chuàng)作者可以使自己的筆記本電腦或 PC 在內(nèi)容生成過程中保持響應(yīng)。
阿里巴巴的 Qwen-Image 等領(lǐng)先的擴散模型正利用 NVFP4 減少內(nèi)存占用,同時實現(xiàn)更高性能。
AI 視頻生成尤其適合 DGX Spark,因為它需要大量的內(nèi)存和算力。采用 NVFP8 優(yōu)化權(quán)重的音視頻生成模型相比上一代性能顯著提升,使高質(zhì)量視頻生成在桌面端成為可能。
DGX Spark現(xiàn)已納入NVIDIA認證系統(tǒng)計劃
NVIDIA 認證系統(tǒng)計劃用于驗證系統(tǒng)在廣泛加速圖形處理、計算和 AI 工作負載方面的性能表現(xiàn)。NVIDIA 認證系統(tǒng)為 AI 開發(fā)、桌面推理、數(shù)據(jù)科學(xué)、設(shè)計和內(nèi)容創(chuàng)作工作負載提供了可信的基礎(chǔ),同時也對數(shù)據(jù)中心和云資源進行增強。
DGX Spark 和基于 GB10 的 OEM 系統(tǒng)現(xiàn)已納入該計劃,DGX Spark 及合作伙伴系統(tǒng)目前正在測試中。
快速上手
了解我們?nèi)绾螏椭_發(fā)者立即提高生產(chǎn)力,展示 Blackwell GPU 的可能性,包括:
Nemotron 3 Nano:本地運行 NVIDIA 高效的 30B 參數(shù) MoE 模型,以用于 LLM 實驗。
Live VLM WebUI:將網(wǎng)絡(luò)攝像頭畫面輸入數(shù)據(jù)流傳輸至視覺語言模型中進行實時分析,并利用 GPU 進行處理。
Isaac Sim / Lab:利用 GPU 加速的仿真與強化學(xué)習(xí),構(gòu)建并訓(xùn)練機器人應(yīng)用。
SGLang 與 vLLM 服務(wù) Playbook:清晰的模型支持矩陣能夠顯示已測試與支持的模型及量化選項。
GPU 加速的量化金融與基因組學(xué) Playbook:與基于 CPU 的實現(xiàn)相比,這些工作流所需的代碼改動極少。
使用 PyTorch 微調(diào):通過 FSDP 與 LoRA,在兩臺 DGX Spark 系統(tǒng)上分布式微調(diào),支持參數(shù)最高達 70B 的 LLM。
簡單可靠、步驟清晰且實用的故障排除指南,已在最新 DGX OS 上驗證配置,能夠讓用戶減少設(shè)置時間,將更多時間用于構(gòu)建。
使用NVIDIA Brev隨時隨地訪問DGX Spark
借助NVIDIA Brev,用戶可以通過安全連接隨時隨地訪問 DGX Spark。Brev 讓開發(fā)者能夠輕松創(chuàng)建 AI 云實例,利用Launchables功能,實現(xiàn)一鍵即可配置 AI 環(huán)境。在 CES 上,Brev 的更新展示了注冊本地計算(如 DGX Spark)的能力。在 Brev 完成注冊后,用戶即可隨時隨地訪問 DGX Spark,并安全地與團隊共享訪問權(quán)限。
Brev 支持本地與云模型的混合部署。借助路由層,用戶可以將電子郵件或?qū)S袛?shù)據(jù)處理等敏感任務(wù)保留在運行于 DGX Spark 上的本地開源模型上,同時將一般推理任務(wù)路由至云端的前沿模型。實現(xiàn)細節(jié)可參閱 NVIDIA LLM Router 開發(fā)者示例。
Brev 對本地計算的支持將在 CES 上進行預(yù)覽,正式支持將于 2026 年春季推出。
打造專屬智能體
如需進一步探索,NVIDIA 與 Hugging Face 合作展示如何構(gòu)建個人桌面 AI 助手。使用 DGX Spark 搭配 Reachy Mini,用戶可以創(chuàng)建一個私有 AI 助手,在本地私密的處理數(shù)據(jù)。請參閱NVIDIA 與 Hugging Face 教程開始體驗。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5592瀏覽量
109702 -
開源
+關(guān)注
關(guān)注
3文章
4203瀏覽量
46109 -
模型
+關(guān)注
關(guān)注
1文章
3750瀏覽量
52091
原文標題:CES 2026 | 全新軟件與模型優(yōu)化為 NVIDIA DGX Spark 注入強大動力
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Microchip發(fā)布專為NVIDIA DGX Spark而設(shè)計的MEC1723嵌入式控制器定制固件
NVIDIA DGX Spark桌面級AI超級計算機助力開發(fā)者構(gòu)建AI模型
NVIDIA DGX Spark系統(tǒng)恢復(fù)過程與步驟
NVIDIA DGX Spark助力構(gòu)建自己的AI模型
在NVIDIA DGX Spark平臺上對NVIDIA ConnectX-7 200G網(wǎng)卡配置教程
NVIDIA宣布開源Aerial軟件
NVIDIA黃仁勛向SpaceX馬斯克交付DGX Spark
NVIDIA DGX Spark新一代AI超級計算機正式交付
MediaTek攜手NVIDIA開啟個人AI算力新紀元
NVIDIA DGX Spark桌面AI計算機開啟預(yù)訂
NVIDIA發(fā)布AI優(yōu)先DGX個人計算系統(tǒng)
NVIDIA GTC2025 亮點 NVIDIA推出 DGX Spark個人AI計算機
NVIDIA 宣布推出 DGX Spark 個人 AI 計算機
全新軟件與模型優(yōu)化為NVIDIA DGX Spark注入強大動力
評論