91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達開發(fā)新AI算法,視頻通話的流量最高壓縮90%以上

工程師鄧生 ? 來源:量子位 ? 作者:凹非寺 ? 2020-12-02 14:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

為了讓網(wǎng)速慢的用戶用上高清通話,英偉達可謂絞盡腦汁。他們開發(fā)的新AI算法,可以將視頻通話的流量最高壓縮90%以上。

和其他視頻相比,通話的場景比較單一,基本上只有人的頭部在運動。因此只要能把頭像數(shù)據(jù)大規(guī)模壓縮,就能大大節(jié)約流量。

英偉達的新算法face vid2vid正是從這一點出發(fā)。只要一張圖片,就能實現(xiàn)重建各種頭部姿勢圖片。

H.264視頻所需的帶寬是這種新算法的2~12倍,從前面的演示也能看出,如果讓二者使用相同比特率,那么H.264視頻幾乎不可用。

轉(zhuǎn)動面部不扭曲

英偉達提供了一個試用Demo,可以在Pitch(俯仰角)、Yaw(偏航角)、Roll(翻滾角)三個方向上任意旋轉(zhuǎn)。

輸入一張人臉,最多可以在每個方向上最多旋轉(zhuǎn)30度。以下是三個方向上旋轉(zhuǎn)到最大角度生成的圖片。

與相比之前的方法,英偉達的這種技術(shù)即使在面部轉(zhuǎn)動幅度較大時,人臉也不會扭曲變形。

然而,圖片終究是不動的,要把生成的人臉放在運動的視頻中還要多一個步驟。

合成面部視頻

我們把上傳的清晰照片作為源圖像,從中獲取外貌特征。然后把視頻中一幀幀畫面作為重構(gòu)視頻的依據(jù),從中提取出面部表情和頭部姿勢等信息。

而表情和姿勢這兩個數(shù)據(jù)可以通過關(guān)鍵點進行編碼,這樣就分離了人物身份信息和運動信息。在傳輸視頻時只要有運動信息即可,從而節(jié)約了流量。

從源圖像s中,我們得到了兩組數(shù)據(jù):關(guān)鍵點坐標(biāo)x和雅可比矩陣J。這兩組參數(shù)與面部的具體特征無關(guān),只包含人的幾何特征。

其中,雅可比矩陣表示如何通過仿射變換將關(guān)鍵點周圍的局部補丁轉(zhuǎn)換為另一幅圖像中的補丁。如果是恒等雅可比矩陣,則補丁將直接復(fù)制并粘貼到新位置。

下圖展示了計算前5個關(guān)鍵點的流程。給定源圖像以及模型預(yù)測的規(guī)范關(guān)鍵點。

從運動視頻估計的旋轉(zhuǎn)和平移應(yīng)用于關(guān)鍵點,帶動頭部姿勢的變化。然后可以感知表情的變形將關(guān)鍵點調(diào)整為目標(biāo)表情。

接下來開始合成視頻。使用源和運動的關(guān)鍵點與其雅可比矩陣來估計流wk,從生成流組合成掩碼m,將這兩組進行線性組合即可產(chǎn)生合成流場w。

接著輸入人臉面部特征f,即可生成輸出圖像y。

這種方法不僅能用于視頻通話,也有其他“新玩法”。

比如覺得人物頭像有點歪,可以手動輸入糾正后的數(shù)據(jù),從而將面部轉(zhuǎn)正。

又或者是,把一個人的面部特征點和雅可比矩陣用于另一個人,實現(xiàn)面部視頻動作的遷移。

團隊簡介

這篇文章的第一作者是來自英偉達的高級研究員Ting-Chun Wang。

文章的通訊作者是英偉達的著名研究員劉洺堉。

如果你長期關(guān)注CV領(lǐng)域,一定對這兩位作者非常熟悉。他們在圖像風(fēng)格遷移、GAN等方面做出了大量的工作。

△ GauGAN

兩人之前已經(jīng)有過多次合作。比如。無監(jiān)督圖像遷移網(wǎng)絡(luò)(NIPS 2017),還有從涂鴉生成照片的GauGAN(CVPR 2019),都是出自這二位之手。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4785

    瀏覽量

    98140
  • 開發(fā)
    +關(guān)注

    關(guān)注

    0

    文章

    378

    瀏覽量

    42163
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40001

    瀏覽量

    301644
  • 視頻通話
    +關(guān)注

    關(guān)注

    0

    文章

    49

    瀏覽量

    12406
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4091

    瀏覽量

    99279
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    企業(yè)級AI Agent王炸! 英偉GTC將開源 NemoClaw

    消息人士透露,英偉計劃在下周在美國圣荷西舉行的年度開發(fā)者大會前后正式公布 NemoClaw。據(jù)知情人士向 WIRED 透露,該平臺允許企業(yè)部署 AI 代理為內(nèi)部團隊執(zhí)行任務(wù),且不限于
    的頭像 發(fā)表于 03-10 11:35 ?8653次閱讀
    企業(yè)級<b class='flag-5'>AI</b> Agent王炸! <b class='flag-5'>英偉</b><b class='flag-5'>達</b>GTC將開源 NemoClaw

    英偉電話會看Agentic AI推理與FPGA價值

    2026年2月,英偉發(fā)布2026財年Q4財報:營收681億美元,同比增長73%,數(shù)據(jù)中心業(yè)務(wù)增長75%——預(yù)期中的超預(yù)期。更值得關(guān)注的,是電話會中反復(fù)出現(xiàn)的幾個關(guān)鍵詞:Agentic AI、推理
    的頭像 發(fā)表于 03-04 17:07 ?1092次閱讀
    從<b class='flag-5'>英偉</b><b class='flag-5'>達</b>電話會看Agentic <b class='flag-5'>AI</b>推理與FPGA價值

    英偉重磅出手!AI 推理存儲全面覺醒

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)近日,有消息稱,英偉將以大約200億美元收購人工智能芯片初創(chuàng)公司Groq,這將是英偉迄今為止規(guī)模最大的一筆收購。但
    的頭像 發(fā)表于 12-26 08:44 ?1.2w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>重磅出手!<b class='flag-5'>AI</b> 推理存儲全面覺醒

    黃仁勛:英偉AI芯片訂單排到2026年 英偉上季營收加速增長62%再超預(yù)期

    AI芯片總龍頭英偉的財報終于帶來了驚喜;英偉公司發(fā)布財報數(shù)據(jù)顯示,上季營收加速增長62%;再超華爾街預(yù)期。業(yè)界都比較振奮,
    的頭像 發(fā)表于 11-20 11:36 ?1283次閱讀

    應(yīng)用于暫態(tài)波形存儲的數(shù)據(jù)壓縮算法需要考慮哪些因素?

    、還原精度與關(guān)鍵特征保留:確保數(shù)據(jù) “可用” 暫態(tài)波形的核心價值是支撐故障分析(如電壓暫降原因定位、諧波源追溯),壓縮算法需優(yōu)先保障 關(guān)鍵信息不丟失 ,而非單純追求高壓縮比。 還原誤差的可控性 需明確誤差允許范圍: 故障溯源
    的頭像 發(fā)表于 11-05 15:02 ?337次閱讀

    適用于中高壓(最高90V)系統(tǒng)設(shè)計:FP135/136/137 高端電流檢測芯片

    適用于中高壓最高90V)輸入的高端電流檢測芯片。FP137適用于30V至48V的中壓范圍;FP135與FP136則適用于48V以上高壓
    的頭像 發(fā)表于 10-27 16:48 ?453次閱讀
    適用于中<b class='flag-5'>高壓</b>(<b class='flag-5'>最高</b><b class='flag-5'>90</b>V)系統(tǒng)設(shè)計:FP135/136/137 高端電流檢測芯片

    今日看點:蘋果認(rèn)證中國快充品牌遭美調(diào)查;英偉擬向OpenAI投資最高1000億美元

    英偉擬向OpenAI投資最高1000億美元 近日,英偉和OpenAI宣布達成合作,包括建設(shè)龐大數(shù)據(jù)中心計劃,以及
    發(fā)表于 09-23 10:09 ?468次閱讀

    外媒:英偉開發(fā)新款中國特供芯片B30A 或為旗艦AI芯品B300的閹割版

    我們看到英偉的旗艦新品 B300備受關(guān)注;但是受限于美國實施出口限制措施,英偉不會出貨,就像此前英偉
    的頭像 發(fā)表于 08-20 15:19 ?3646次閱讀
    外媒:<b class='flag-5'>英偉</b><b class='flag-5'>達</b>正<b class='flag-5'>開發(fā)</b>新款中國特供芯片B30A 或為旗艦<b class='flag-5'>AI</b>芯品B300的閹割版

    繼HBM之后,英偉帶火又一AI內(nèi)存模組!顛覆AI服務(wù)器與PC

    Attached Memory Module,即小型化壓縮附加內(nèi)存模組,是英偉主導(dǎo)開發(fā)的一種新型內(nèi)存模塊,是適用于數(shù)據(jù)中心 AI 服務(wù)器
    的頭像 發(fā)表于 07-27 07:50 ?4799次閱讀

    英偉AI人才,去了華為

    電子發(fā)燒友網(wǎng)綜合報道 近日,英偉首席科學(xué)家比爾·戴利(Bill Dally)表示,美國對中國實施的人工智能出口管制禁令,讓中國獲得很大的發(fā)展空間,過去替英偉撰寫程序的中國人工智能研
    的頭像 發(fā)表于 06-06 00:05 ?7360次閱讀

    德州儀器宣布與英偉合作,推動 AI 基礎(chǔ)設(shè)施實現(xiàn)高效配電

    上海2025年5月28日?/美通社/ -- TI 技術(shù)將助力?NVIDIA 未來面向下一代?AI 數(shù)據(jù)中心的?800V 高壓直流配電系統(tǒng) 前沿動態(tài) 德州儀器?(TI) 今日宣布,正與英偉
    的頭像 發(fā)表于 05-28 16:07 ?596次閱讀

    IBM攜手英偉AI數(shù)據(jù)平臺推動企業(yè)級AI創(chuàng)新

    近日,IBM(紐約證券交易所:IBM)宣布與英偉(納斯達克股票代碼:NVDA)開展全新合作,雙方將基于英偉 AI 數(shù)據(jù)平臺參考架構(gòu)(re
    發(fā)表于 03-24 19:20 ?526次閱讀

    英偉GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發(fā)表于 03-20 15:35 ?1600次閱讀

    新思科技亮相英偉GTC 2025大會

    為了實現(xiàn)這一速度提升,新思科技在GTC全球AI大會上宣布,正在使用英偉 CUDA-X庫優(yōu)化其下一代半導(dǎo)體開發(fā)解決方案。公司還在擴大對英偉
    的頭像 發(fā)表于 03-19 17:53 ?1333次閱讀