NVIDIA RTX PRO 5000 Blackwell是 NVIDIA RTX 5000 Ada Generation 的升級迭代產(chǎn)品,其各項(xiàng)核心指標(biāo)均針對 GPU 加速工作流的高性能需求進(jìn)行了優(yōu)化設(shè)計(jì)。無論是 CUDA 核心計(jì)算性能、實(shí)時渲染能力,還是 AI 推理效率,亦或顯存帶寬與容量的顯著提升,均使得新一代 RTX PRO 5000 Blackwell GPU 能夠輕松應(yīng)對更復(fù)雜、更嚴(yán)苛的工作負(fù)載。
今天,我們帶來全新 NVIDIA RTX PRO 5000 Blackwell 的深度評測,通過對比上一代 RTX 5000 Ada Generation,揭秘其性能與能效的全面升級。
測試環(huán)境

軟件測試列表

顯卡規(guī)格

軟件測試結(jié)果及分析
1. 實(shí)時渲染性能
1.1 FurMark
FurMark 作為 GPU 測試領(lǐng)域的經(jīng)典工具,專用于 OpenGL 圖形性能與系統(tǒng)穩(wěn)定性評估。本次測試將聚焦兩大核心維度:其一,通過 4K 分辨率實(shí)時渲染場景測試 OpenGL 圖形處理性能;其二,在標(biāo)準(zhǔn)室溫環(huán)境下監(jiān)測 GPU 的散熱效能與溫度穩(wěn)定性。

▲ RTX PRO 5000 Blackwell 測試結(jié)果截圖

▲ 測試結(jié)果圖表
從 FurMark 的實(shí)時渲染測試結(jié)果中可以看出,RTX PRO 5000 的 OpenGL 4K 性能是 RTX 5000 Ada 的1.61倍。通過長時間烤機(jī)(穩(wěn)定性測試),RTX PRO 5000 的溫度控制在 86 度以下。RTX PRO 5000 的目標(biāo)控制溫度是 86 度,GPU 控制功耗的閾值越高,越能發(fā)揮 GPU 的性能,在高負(fù)載下溫度控制穩(wěn)定。
1.2 3DMark
3DMark 作為專業(yè)級圖形性能測試工具,專注于評估顯卡在大型 3D 場景中的渲染能力。本次測試選取了兩個高復(fù)雜度場景進(jìn)行壓力測試,同時涵蓋 DirectX 與 Vulkan API 的性能表現(xiàn),并通過 Port Royal 測試模塊專項(xiàng)評估光線追蹤性能。

▲ RTX PRO 5000 Blackwell 測試結(jié)果截圖

▲ 測試結(jié)果圖表
從 3DMark Steel Nomad 的測試結(jié)果看,基于 DX 的環(huán)境 RTX PRO 5000 的性能是 RTX 5000 Ada 的1.54倍。Port Royal 光追的性能測試,RTX PRO 5000 的性能是 RTX 5000 Ada 的1.29倍。在 Steel Nomad Vulkan 的測試中 RTX PRO 5000 是 RTX 5000 Ada 的1.35倍。RTX PRO 5000 的 API 的管線渲染性能和光追性能都有了很大的提高。
1.3 NVIDIA Omniverse 工作流實(shí)時渲染
NVIDIA Omniverse 是一個包含 API、SDK 和服務(wù)的平臺,使開發(fā)者能夠?qū)?OpenUSD、NVIDIA RTX 渲染技術(shù)和生成式物理 AI 集成到工業(yè)和機(jī)器人用例的現(xiàn)有軟件工具和仿真工作流中。可以支持多人同時在線進(jìn)行 3D 立體場景的協(xié)同搭建,支持豐富的 DCC 生態(tài)融合,可以支持光線追蹤極具真實(shí)感的實(shí)時渲染。

▲ RTX PRO 5000 Blackwell 測試結(jié)果截圖

▲ 測試結(jié)果圖表
▲實(shí)時渲染性能對比視頻
在 Omniverse 實(shí)時渲染中,分別對開啟 NVIDIA DLSS 和關(guān)閉 DLSS 的性能進(jìn)行測試。針對相同場景的 4K 實(shí)時渲染,在啟用 DLSS 時 RTX PRO 5000 的性能是 RTX 5000 Ada 的2.6倍,在不啟用 DLSS 時,RTX PRO 5000 的性能是 RTX 5000 Ada 的1.25倍。
2. 離線渲染軟件
渲染技術(shù)作為媒體娛樂、工業(yè)設(shè)計(jì)及建筑可視化等領(lǐng)域的核心工具,已廣泛應(yīng)用于影視特效、產(chǎn)品建模、虛擬建筑等場景。當(dāng)前主流渲染器均支持 GPU 加速渲染,其執(zhí)行效率直接取決于顯卡的計(jì)算性能。
2.1 V-Ray Benchmark
V-Ray Benchmark 是一款免費(fèi)的獨(dú)立渲染速度測試軟件,可精準(zhǔn)評估計(jì)算機(jī)的渲染速度。它可以簡單快速的測試兩種渲染引擎:
> V-Ray GPU CUDA — GPU 渲染模式測試
> V-Ray GPU RTX — RTX GPU 渲染模式測試
本次測試不同 GPU 在不同 V-Ray 5 渲染引擎下的離線渲染性能,并記錄最終得分。

▲ RTX PRO 5000 Blackwell 測試結(jié)果截圖

▲ 測試結(jié)果圖表
在使用 RTX 渲染測試中,RTX PRO 5000 的性能都是 RTX 5000 Ada 的1.7倍。在使用 CUDA 測試中,RTX PRO 5000 的性能都是 RTX 5000 Ada 的1.4倍。
2.2 Blender Benchmark
在 Blender Benchmark 測試中,我們選取了 Monster、Junkshop 和 Classroom 三個標(biāo)準(zhǔn)場景進(jìn)行渲染性能評估。

▲ RTX PRO 5000 Blackwell 測試結(jié)果截圖

▲ 測試結(jié)果圖表
其中在 Monster 場景的測試中,RTX PRO 5000 是 RTX 5000 Ada 的1.39倍。在 Junkshop 的測試中 RTX PRO 5000 是 RTX 5000 Ada 的1.81倍。在 Classroom 的測試中 RTX PRO 5000 是 RTX 5000 Ada 的1.47倍。
2.3 Octanebench
Octane 渲染器作為業(yè)界主流的 GPU 渲染引擎,率先支持基于光線追蹤技術(shù)的實(shí)時渲染。我們采用其官方提供的基準(zhǔn)測試工具(Benchmark)對 GPU 渲染性能進(jìn)行量化評估。

▲ 測試結(jié)果圖表
從測試結(jié)果來看,在 Octane 渲染器上的性能 RTX PRO 5000 是 RTX 5000 Ada 的1.6倍。
3. AI 性能測試
在 AI 性能測試環(huán)節(jié),我們聚焦當(dāng)前主流應(yīng)用場景,分別針對文生圖(Text-to-Image)和大模型文本生成(LLM)展開專項(xiàng)評估。
-文生圖測試?:采用業(yè)界廣泛應(yīng)用的 ComfyUI 工具,使用其默認(rèn)工作流參數(shù)及預(yù)設(shè)提示詞,通過統(tǒng)計(jì)單次圖像生成耗時進(jìn)行性能對比。
-大模型文本生成測試?:基于 MLPerf Client v1.5 基準(zhǔn)測試套件,重點(diǎn)測量首 Token 生成時間(TTFT)和每秒處理 Token 數(shù)(TPS)兩大核心指標(biāo)。
3.1 Picture Generation Benchmark
在此項(xiàng)測試中,我們使用 ComfyUI Text to Picture 的工作流來測試。我們在此只關(guān)注 GPU 計(jì)算的時間來對比性能。

▲ RTX PRO 5000 Blackwell 測試結(jié)果截圖

▲ 測試結(jié)果圖表
從測試結(jié)果來看使用 ComfyUI 中常用的 Flux1-dev-fp8 模型進(jìn)行推理性能測試,RTX PRO 5000 是 RTX 5000 Ada 性能的1.3倍。
3.2 Video Generation Benchmark
在此項(xiàng)測試中,我們使用 ComfyUI Text to Video 的工作流來測試。我們在此只關(guān)注 GPU 計(jì)算的時間來對比性能。

▲ RTX PRO 5000 Blackwell 測試結(jié)果截圖

▲ 測試結(jié)果圖表
Workflow 使用的是 ComfyUI 默認(rèn)的采用混元大模型的文生視頻默認(rèn)設(shè)置。對比生成所用的時間,RTX PRO 5000 Blackwell 的性能是 RTX 5000 Ada Generation 的1.38倍。
3.3 MLPerf Client v1.5 Benchmark
在軟件測試環(huán)節(jié),我們采用了多款主流語言模型(LLM)進(jìn)行性能評估。大型語言模型作為當(dāng)前最具影響力的生成式人工智能形態(tài)之一,能夠通過自然語言交互實(shí)現(xiàn)多任務(wù)處理。選擇聚焦 LLM 測試,源于其在客戶端本地部署場景中展現(xiàn)出廣闊應(yīng)用前景,涵蓋智能聊天交互、AI 代理服務(wù)及個性化信息管理等領(lǐng)域。因此,我們選用 MLPerf 這一權(quán)威基準(zhǔn)測試平臺,重點(diǎn)評估 GPU 加速大模型的首 Token 生成時間(TTFT)及每秒處理 Token 數(shù)(TPS)兩大核心指標(biāo)。

▲ RTX PRO 5000 Blackwell 測試結(jié)果截圖

▲ 測試結(jié)果圖表

▲ 測試結(jié)果圖表
從測試結(jié)果來看在大模型推理性能上,響應(yīng)時間提高了20%~50%,還是每秒處理的 Tokens 數(shù)量,RTX PRO 5000 對比 RTX 5000 Ada 提高了70%~90%的性能,AI 大模型的性能提升幅度非常大。
總結(jié)

▲ NVIDIA RTX PRO 5000 Blackwell 官方渲染圖
作為 NVIDIA 專業(yè)顯卡產(chǎn)品線中的高端型號,RTX PRO 5000 Blackwell 通過配備更多 CUDA 核心與更大容量顯存,展現(xiàn)出卓越的計(jì)算密集型任務(wù)處理能力。隨著 AI 技術(shù)的持續(xù)演進(jìn),該顯卡在日益豐富的 AI 應(yīng)用場景中均能提供穩(wěn)定高效的性能輸出。
圖形 API 的處理性能,OpenGL 提高了 61%,DirectX 提高了 53%,Vulkan 提高了 35%,性能提升很大。
在離線渲染方面也有了 40%~70% 的性能提升,雖然單精度浮點(diǎn)運(yùn)算性能沒有增加,但是綜合渲染能力,在硬件綜合提升下,仍然有了很大的提升。
在 AI 性能方面,ComfyUI 文生視頻和文生圖都有 30% 以上的提升。在大模型推理的應(yīng)用場景中,首次響應(yīng)時間提升了 20%~50%,每秒處理的 Tokens 數(shù)量,則有 70%~90% 的提升。
綜上所述,NVIDIA RTX PRO 5000 Blackwell 作為高端專業(yè) GPU 的中流砥柱,在 GPU 計(jì)算密集型應(yīng)用場景中實(shí)現(xiàn)了顯著的性能提升。尤其在大型模型推理任務(wù)中,該產(chǎn)品能夠提供更快的響應(yīng)速度,并支持更多用戶并行處理,為 AI 技術(shù)在各行業(yè)的深度應(yīng)用提供了強(qiáng)大的加速支持。在 AI 技術(shù)持續(xù)滲透各領(lǐng)域的今天,它無疑是加速應(yīng)用落地的首選解決方案。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5592瀏覽量
109704 -
gpu
+關(guān)注
關(guān)注
28文章
5194瀏覽量
135412 -
顯卡
+關(guān)注
關(guān)注
16文章
2520瀏覽量
71485
原文標(biāo)題:RTX PRO 5000 Blackwell vs 前代:性能差距有多大?實(shí)測數(shù)據(jù)揭秘
文章出處:【微信號:Leadtek,微信公眾號:麗臺科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
NVIDIA RTX PRO 2000 Blackwell GPU性能測試
進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片
英偉達(dá)發(fā)布新一代 GPU 架構(gòu)圖靈和 GPU 系列 Quadro RTX
NVIDIA RTX A4500強(qiáng)勢發(fā)布,一款高端RTX專業(yè)圖形顯卡
NVIDIA發(fā)布 GeForce RTX 40 系列 GPU
NVIDIA RTX 4500 Ada與NVIDIA RTX A5000的對比
NVIDIA Blackwell數(shù)據(jù)手冊與NVIDIA Blackwell架構(gòu)技術(shù)解析
NVIDIA Blackwell白皮書:NVIDIA Blackwell Architecture Technical Brief
使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)
NVIDIA Blackwell推動流式傳輸和數(shù)據(jù)分析的未來發(fā)展
NVIDIA桌面GPU系列擴(kuò)展新產(chǎn)品
NVIDIA RTX PRO 5000 72GB Blackwell GPU現(xiàn)已全面上市
NVIDIA RTX PRO 4000 Blackwell GPU性能測試
NVIDIA RTX PRO 5000 Blackwell GPU的深度評測
評論