從開普勒開始的所有 NVIDIA GPUs 都支持完全加速的硬件視頻編碼; GPUs 從費米開始支持完全加速的硬件視頻解碼。最近發(fā)布的圖靈硬件提供了張量核心和更好的機器學(xué)習(xí)性能,但新的 GPU 還加入了新的多媒體功能,如改進的 NVENC 單元,以在視頻編解碼器中提供更好的壓縮和圖像質(zhì)量。
讓我們更仔細地看一看圖靈設(shè)計的新的 NVENC 單元的性能和質(zhì)量。
NVENC 性能測試設(shè)置
H.264 出現(xiàn)于 15 年前,已經(jīng)成為一種無處不在的視頻編碼標準。它已經(jīng)成為業(yè)界最重要和最廣泛的編解碼器。這些測試展示了 Tesla T4 與著名的開源編碼器 libx264 在兩種情況下的性能:
高質(zhì)量模式,代表最常見的編碼方案與 VBR 控制和 B 幀啟用。
低延遲快速模式,適用于對延遲敏感的應(yīng)用程序,如遠程游戲或視頻會議。
為此,測試計算機的配置如表 1 所示:

我們使用了各種輸入視頻進行 RD 估計,如 basketball _ drive 、 bq _ terrace 、仙人掌、 crowd _ run 、 ducks _ take _ off 、 jokey 、和服,以及更多分辨率為 1280 × 720 、 1920 × 1080 和 3840 × 2160 的視頻。
績效和質(zhì)量結(jié)果
平衡序列
圖 1 到圖 4 顯示, Tesla T4 在高質(zhì)量模式下為 libx264 提供相同或稍好的視覺質(zhì)量,如 Kimono、 BQ Terrace 和 Park Scene 。


與 libx264 相比, T4 顯示了更好的預(yù)測和過濾。
紅皮艇和仙人掌序列分別包含顯著的混沌運動和圓周運動。與 libx264 相比, NVENC 在這些包含復(fù)雜內(nèi)部預(yù)測的場景中顯示出明顯的優(yōu)勢。
Tesla T4 NVENC 在低延遲模式下的性能很容易超過 libx264 。請注意 Tesla T4 如何在高分辨率下更有效,在相同的比特率下提供 1db 更好的視覺質(zhì)量。

圖靈 GPUs 配備了功能強大的 NVENC 視頻編碼單元,與 libx264 等復(fù)雜的軟件編碼器相比,它提供了更高的視頻壓縮效率,因為它結(jié)合了更高的性能和更低的能耗。理想的代碼轉(zhuǎn)換解決方案需要具有成本效益(美元/流)和節(jié)能(瓦/流)。讓我們看看在多個測試序列中平均的性能和功耗結(jié)果,如圖 13 和 14 所示。

圖 13 。在高質(zhì)量模式下以每秒 30 幀同時編碼的流數(shù)

圖 14 。在低延遲模式下以每秒 30 幀同時編碼的流數(shù)。
T4 以高質(zhì)量模式同時編碼 22 個 720p 流。 GPU 還可以平均處理 10 個 1080p 的流和 2 到 3 個超高清( 2160p )分辨率的流。這相當(dāng)于在相同的視覺質(zhì)量級別上幾乎是 libx264 的兩倍。
在低延遲模式下運行顯示出 T4 更大的優(yōu)勢。它可以編碼 37 個 720p 分辨率的流, 17-18 個 1080p , 4-5 個超高清,性能比 libx264 高 2-2.7 倍,具有更高的視覺質(zhì)量。您可以在圖 15 和圖 16 中看到每個流的瓦特數(shù)。

圖 15 。高質(zhì)量模式下平均每流功耗瓦特

圖 16 。低延遲模式下平均每流功耗瓦特
Tesla 還顯示出很高的功率效率,在高質(zhì)量模式下優(yōu)于 libx264 2-4x ,在低延遲模式下高達 5 倍,同時保持低負載。
結(jié)論
與前幾代相比, NVIDIA 的 Tesla T4 的編碼能力有了很大的提高。與 libx264 這樣的軟件編碼器相比,它在高質(zhì)量模式下顯示出相同或更好的視覺質(zhì)量,而在低延遲模式下則優(yōu)于它們。這相當(dāng)于在功耗降低 2-5 倍時性能提高了一倍。
關(guān)于作者
Roman Arzumanyan擁有俄羅斯南部羅曼大學(xué)( Rostov-on-Don , 2012 )和羅曼大學(xué)應(yīng)用數(shù)學(xué)碩士學(xué)位。之后,他在俄羅斯三星研發(fā)院( 2012-2015 )、英特爾公司( 2015-2017 )工作。目前,他在莫斯科擔(dān)任開發(fā)技術(shù)工程師。他的研究興趣包括視頻編碼、高性能和 GPGPU 。
審核編輯:郭婷
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5627瀏覽量
109874 -
gpu
+關(guān)注
關(guān)注
28文章
5213瀏覽量
135615
發(fā)布評論請先 登錄
ADP5041:高性能微功率管理單元的詳細解析
ADP5043:高性能微電源管理單元的全面解析
ADP5042:高性能微電源管理單元的深度解析
Xsens/Movella的新款A(yù)vior慣性測量單元
資料] 汽車軟件質(zhì)量躍遷的系統(tǒng)性路徑:基于ISO 26262標準的單元測試體系重構(gòu)與中日實踐深度對比(2026學(xué)術(shù)研究報告)
汽車軟件質(zhì)量躍遷的系統(tǒng)性路徑:基于ISO 26262標準的單元測試體系重構(gòu)與中日實踐深度對比(2026學(xué)術(shù)研究報告)
喜報 | 回映電子 品牌公司「圖靈腦機」完成天使輪融資,開啟事業(yè)新征程!
RDMA設(shè)計11:性能監(jiān)測單元設(shè)計
嵌入軟件單元測試的全面研究與實踐
新能源汽車質(zhì)量保證體系與傳統(tǒng)汽車單元測試規(guī)范的融合研究
新品 | Unit Fingerprint2,高性能指紋識別傳感器單元
電能質(zhì)量在線監(jiān)測裝置的精度等級如何影響其性能和應(yīng)用?
NVMe高速傳輸之?dāng)[脫XDMA設(shè)計之六:性能監(jiān)測單元設(shè)計
NVMe IP高速傳輸卻不依賴XDMA設(shè)計之六:性能監(jiān)測單元設(shè)計
圖靈設(shè)計NVENC單元的性能和質(zhì)量
評論