91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖靈設(shè)計NVENC單元的性能和質(zhì)量

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Roman Arzumanyan ? 2022-04-28 15:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從開普勒開始的所有 NVIDIA GPUs 都支持完全加速的硬件視頻編碼; GPUs 從費米開始支持完全加速的硬件視頻解碼。最近發(fā)布的圖靈硬件提供了張量核心和更好的機器學(xué)習(xí)性能,但新的 GPU 還加入了新的多媒體功能,如改進的 NVENC 單元,以在視頻編解碼器中提供更好的壓縮和圖像質(zhì)量。

讓我們更仔細地看一看圖靈設(shè)計的新的 NVENC 單元的性能和質(zhì)量。

NVENC 性能測試設(shè)置

H.264 出現(xiàn)于 15 年前,已經(jīng)成為一種無處不在的視頻編碼標準。它已經(jīng)成為業(yè)界最重要和最廣泛的編解碼器。這些測試展示了 Tesla T4 與著名的開源編碼器 libx264 在兩種情況下的性能:

高質(zhì)量模式,代表最常見的編碼方案與 VBR 控制和 B 幀啟用。

低延遲快速模式,適用于對延遲敏感的應(yīng)用程序,如遠程游戲或視頻會議。

為此,測試計算機的配置如表 1 所示:

poYBAGJqRkWAMOQBAABkGfjAF4w897.png

我們使用了各種輸入視頻進行 RD 估計,如 basketball _ drive 、 bq _ terrace 、仙人掌、 crowd _ run 、 ducks _ take _ off 、 jokey 、和服,以及更多分辨率為 1280 × 720 、 1920 × 1080 和 3840 × 2160 的視頻。

績效和質(zhì)量結(jié)果

平衡序列

圖 1 到圖 4 顯示, Tesla T4 在高質(zhì)量模式下為 libx264 提供相同或稍好的視覺質(zhì)量,如 Kimono、 BQ Terrace 和 Park Scene 。

poYBAGJqReqAeGu1AADRnbCAPGs298.png

pYYBAGJqRfOAJWLxAADBfsd4PzE341.png

與 libx264 相比, T4 顯示了更好的預(yù)測和過濾。

紅皮艇和仙人掌序列分別包含顯著的混沌運動和圓周運動。與 libx264 相比, NVENC 在這些包含復(fù)雜內(nèi)部預(yù)測的場景中顯示出明顯的優(yōu)勢。

Tesla T4 NVENC 在低延遲模式下的性能很容易超過 libx264 。請注意 Tesla T4 如何在高分辨率下更有效,在相同的比特率下提供 1db 更好的視覺質(zhì)量。

poYBAGJqRieAaoeBAADFobyJrNk315.png

圖靈 GPUs 配備了功能強大的 NVENC 視頻編碼單元,與 libx264 等復(fù)雜的軟件編碼器相比,它提供了更高的視頻壓縮效率,因為它結(jié)合了更高的性能和更低的能耗。理想的代碼轉(zhuǎn)換解決方案需要具有成本效益(美元/流)和節(jié)能(瓦/流)。讓我們看看在多個測試序列中平均的性能和功耗結(jié)果,如圖 13 和 14 所示。

poYBAGJqRbWAWNgLAAAr-zX6VSQ870.png

圖 13 。在高質(zhì)量模式下以每秒 30 幀同時編碼的流數(shù)

poYBAGJqRbeAFAGrAAAsdAzr5H8030.png

圖 14 。在低延遲模式下以每秒 30 幀同時編碼的流數(shù)。

T4 以高質(zhì)量模式同時編碼 22 個 720p 流。 GPU 還可以平均處理 10 個 1080p 的流和 2 到 3 個超高清( 2160p )分辨率的流。這相當(dāng)于在相同的視覺質(zhì)量級別上幾乎是 libx264 的兩倍。

在低延遲模式下運行顯示出 T4 更大的優(yōu)勢。它可以編碼 37 個 720p 分辨率的流, 17-18 個 1080p , 4-5 個超高清,性能比 libx264 高 2-2.7 倍,具有更高的視覺質(zhì)量。您可以在圖 15 和圖 16 中看到每個流的瓦特數(shù)。

pYYBAGJqRb6AMc3bAAAvq-wAxCA408.png

圖 15 。高質(zhì)量模式下平均每流功耗瓦特

poYBAGJqRcGAZk8xAAAvASLNIxE444.png

圖 16 。低延遲模式下平均每流功耗瓦特

Tesla 還顯示出很高的功率效率,在高質(zhì)量模式下優(yōu)于 libx264 2-4x ,在低延遲模式下高達 5 倍,同時保持低負載。

結(jié)論

與前幾代相比, NVIDIA 的 Tesla T4 的編碼能力有了很大的提高。與 libx264 這樣的軟件編碼器相比,它在高質(zhì)量模式下顯示出相同或更好的視覺質(zhì)量,而在低延遲模式下則優(yōu)于它們。這相當(dāng)于在功耗降低 2-5 倍時性能提高了一倍。

關(guān)于作者

Roman Arzumanyan擁有俄羅斯南部羅曼大學(xué)( Rostov-on-Don , 2012 )和羅曼大學(xué)應(yīng)用數(shù)學(xué)碩士學(xué)位。之后,他在俄羅斯三星研發(fā)院( 2012-2015 )、英特爾公司( 2015-2017 )工作。目前,他在莫斯科擔(dān)任開發(fā)技術(shù)工程師。他的研究興趣包括視頻編碼、高性能和 GPGPU 。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5627

    瀏覽量

    109874
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5213

    瀏覽量

    135615
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    ADP5041:高性能微功率管理單元的詳細解析

    ADP5041:高性能微功率管理單元的詳細解析 在電子設(shè)備的設(shè)計中,電源管理是至關(guān)重要的一環(huán)。今天我們要深入探討的就是 Analog Devices 推出的 ADP5041 微功率管理單元
    的頭像 發(fā)表于 03-10 14:00 ?68次閱讀

    ADP5043:高性能微電源管理單元的全面解析

    ADP5043:高性能微電源管理單元的全面解析 在電子設(shè)備的設(shè)計中,電源管理單元(PMU)起著至關(guān)重要的作用。它不僅要為各個組件提供穩(wěn)定的電源,還要確保系統(tǒng)的高效運行和可靠性。今天,我們就來深入探討
    的頭像 發(fā)表于 03-10 14:00 ?69次閱讀

    ADP5042:高性能微電源管理單元的深度解析

    ADP5042:高性能微電源管理單元的深度解析 在電子設(shè)備的設(shè)計中,電源管理單元(PMU)起著至關(guān)重要的作用,它直接影響著設(shè)備的性能、穩(wěn)定性和功耗。今天,我們就來深入探討一款高
    的頭像 發(fā)表于 03-10 14:00 ?72次閱讀

    Xsens/Movella的新款A(yù)vior慣性測量單元

    Xsens/Movella的新款A(yù)vior慣性測量單元。Avior慣性測量單元為工業(yè)、ROV、AUV、UAV、機器人、相機/載荷穩(wěn)定和嵌入式應(yīng)用提供實時方向及慣性數(shù)據(jù)。MovellaAviorIMU
    的頭像 發(fā)表于 01-21 12:04 ?545次閱讀
    Xsens/Movella的新款A(yù)vior慣性測量<b class='flag-5'>單元</b>

    資料] 汽車軟件質(zhì)量躍遷的系統(tǒng)性路徑:基于ISO 26262標準的單元測試體系重構(gòu)與中日實踐深度對比(2026學(xué)術(shù)研究報告)

    各位伙伴,請問一個問題,[資料] 汽車軟件質(zhì)量躍遷的系統(tǒng)性路徑:基于ISO 26262標準的單元測試體系重構(gòu)與中日實踐深度對比(2026學(xué)術(shù)研究報告),這份數(shù)據(jù)誰有源參考文獻,有酬感謝
    發(fā)表于 01-08 10:09

    汽車軟件質(zhì)量躍遷的系統(tǒng)性路徑:基于ISO 26262標準的單元測試體系重構(gòu)與中日實踐深度對比(2026學(xué)術(shù)研究報告)

    ?!?研究命題 :在速度與質(zhì)量的博弈中,單元測試不僅是技術(shù)問題,更是戰(zhàn)略安全防線。 2. 理論基石:ISO 26262與ASPICE的合規(guī)性框架 2.1 ISO 26262-6:2018對單元測試的法定
    發(fā)表于 01-05 14:58

    喜報 | 回映電子 品牌公司「圖靈腦機」完成天使輪融資,開啟事業(yè)新征程!

    當(dāng)腦科學(xué)的探索突破邊界,當(dāng)智能技術(shù)的革新席卷而來,科技革命正加速演進。今日,我們滿懷喜悅與期待,恭賀回映電子品牌公司——圖靈腦機科技有限公司正式成立,并成功斬獲天使輪投資!這一里程碑事件,不僅標志著
    的頭像 發(fā)表于 12-25 19:06 ?695次閱讀
    喜報 | 回映電子 品牌公司「<b class='flag-5'>圖靈</b>腦機」完成天使輪融資,開啟事業(yè)新征程!

    RDMA設(shè)計11:性能監(jiān)測單元設(shè)計

    本文主要交流設(shè)計思路,在本博客已給出相關(guān)博文一百多篇,希望對初學(xué)者有用。注意這里只是拋磚引玉,切莫認為參考這就可以完成商用IP設(shè)計。 性能監(jiān)測單元負責(zé)監(jiān)測 RoCE v2 高速數(shù)據(jù)傳輸系統(tǒng)的運行
    發(fā)表于 12-24 09:50

    嵌入軟件單元測試的全面研究與實踐

    引言 嵌入軟件單元測試是確保嵌入式系統(tǒng)質(zhì)量和可靠性的關(guān)鍵環(huán)節(jié)。嵌入式系統(tǒng)廣泛應(yīng)用于汽車電子、工業(yè)控制、醫(yī)療設(shè)備等關(guān)鍵領(lǐng)域,其軟件直接操控硬件,任何微小的錯誤都可能導(dǎo)致嚴重后果。單元
    的頭像 發(fā)表于 12-01 14:31 ?611次閱讀

    新能源汽車質(zhì)量保證體系與傳統(tǒng)汽車單元測試規(guī)范的融合研究

    摘要 隨著新能源汽車產(chǎn)業(yè)的快速發(fā)展,其質(zhì)量保證體系面臨前所未有的挑戰(zhàn)。本文探討了將傳統(tǒng)汽車成熟的單元測試規(guī)范應(yīng)用于新能源汽車領(lǐng)域的可行性,重點分析了ISO 26262標準體系在新能源汽車電子控制系統(tǒng)
    的頭像 發(fā)表于 11-07 10:10 ?300次閱讀

    新品 | Unit Fingerprint2,高性能指紋識別傳感器單元

    UnitFingerprint2是一款高性能指紋識別傳感器單元,內(nèi)部集成STM32核心主控與A-K323CP一體化指紋識別模組,采用半導(dǎo)體電容式傳感器,具備指紋采集、特征提取、注冊、比對、存儲、檢索
    的頭像 發(fā)表于 10-17 17:41 ?1391次閱讀
    新品 | Unit Fingerprint2,高<b class='flag-5'>性能</b>指紋識別傳感器<b class='flag-5'>單元</b>

    電能質(zhì)量在線監(jiān)測裝置的精度等級如何影響其性能和應(yīng)用?

    電能質(zhì)量在線監(jiān)測裝置的精度等級直接決定了其 性能上限 和 應(yīng)用邊界 —— 等級越高,測量準確性、參數(shù)覆蓋范圍、環(huán)境適應(yīng)性越強,但成本也越高;等級越低,性能越基礎(chǔ),僅適配簡單場景。這種影響可從 “
    的頭像 發(fā)表于 10-15 17:31 ?910次閱讀

    NVMe高速傳輸之?dāng)[脫XDMA設(shè)計之六:性能監(jiān)測單元設(shè)計

    性能監(jiān)測單元負責(zé)監(jiān)測 NVMe over PCIe 邏輯加速引擎的運行狀態(tài)和統(tǒng)計信息, 包括復(fù)位后 運行時間信息、 NVMe 指令數(shù)量統(tǒng)計信息、 數(shù)據(jù)操作數(shù)量統(tǒng)計信息、 IOPS 性能統(tǒng)計 信息
    發(fā)表于 07-02 19:51

    NVMe IP高速傳輸卻不依賴XDMA設(shè)計之六:性能監(jiān)測單元設(shè)計

    性能監(jiān)測單元負責(zé)監(jiān)測 NVMe over PCIe 邏輯加速引擎的運行狀態(tài)和統(tǒng)計信息, 包括復(fù)位后 運行時間信息、 NVMe 指令數(shù)量統(tǒng)計信息、 數(shù)據(jù)操作數(shù)量統(tǒng)計信息、 IOPS 性能統(tǒng)計 信息、 指令延遲統(tǒng)計信息等。
    的頭像 發(fā)表于 07-02 19:49 ?502次閱讀
    NVMe IP高速傳輸卻不依賴XDMA設(shè)計之六:<b class='flag-5'>性能</b>監(jiān)測<b class='flag-5'>單元</b>設(shè)計

    如何評估CAN總線信號質(zhì)量

    CAN總線網(wǎng)絡(luò)的性能在很大程度上取決于其信號質(zhì)量。信號質(zhì)量差可能導(dǎo)致通信錯誤,進而引發(fā)系統(tǒng)故障、效率降低甚至安全隱患。因此,評估和確保CAN總線信號質(zhì)量是維護系統(tǒng)健康和可靠性的關(guān)鍵。
    發(fā)表于 06-07 08:46