91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

搜狗陳偉:AI主播將加入肢體動作,讓主播的表達方式更加多元化

產業(yè)大視野 ? 來源:楊湘祁 ? 作者:電子發(fā)燒友 ? 2019-03-20 10:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2018年底,在第五屆世界互聯(lián)網(wǎng)大會上,“克隆”于真人主播邱浩的全球首個AI合成男主播“首秀”,由新華社聯(lián)合搜狗發(fā)布,很快在全球范圍內引起熱議。

陳偉,搜狗語音交互技術中心高級總監(jiān),同時也是新華社AI主播項目的負責人。他表示,從去年11月到現(xiàn)在,新華社工作的兩位AI主播已經播報了幾千余條新聞,沒有出現(xiàn)過失誤。

今年2月19日,男主播升級成為站立式AI合成主播“新小浩”,站立式“新小浩”不僅能坐著播報新聞,還能站起來,帶著手勢、姿態(tài)等多種肢體動作,更接近于真人。與此同時,雙方還推出了首個AI合成女主播“新小萌”。

在新華社,基于兩位真實主播的聲音、表情等真實數(shù)據(jù)生成模型,工作人員僅需要輸入新聞稿,就可以讓AI形象自動根據(jù)文字播報。并且,無需進行二次視頻編輯,AI主播將自動識別語義并配上對應音調及表情。

“我們提供的系統(tǒng),新華社只要每天在想要播報的新聞,過幾秒鐘生成一個完整的視頻,中文、英文不同類型的新聞視頻就可以馬上出來?!标悅ケ硎?。我們看到,AI主播的能力在不斷進化,2月發(fā)布的“新小浩”開始加入肢體動作,讓主播的表達方式更加多元化。

AI合成主播來自于搜狗AI分身項目的落地,基于多種模態(tài)識別融合的技術,包括語音、手寫、唇語等維度的識別和模擬,僅需數(shù)個小時的視頻資料就可以合成一個比較逼真的真人形象。

“逼真度”是衡量AI主播效果的一個重要指標。陳偉向機器之心表示,在初期,團隊采用主觀的方式來衡量AI分身的真實度,最近逐漸考慮采用一些客觀標準,比如與真人視頻每一幀畫面進行比對。

近日,一段“換臉楊冪版”的《射雕英雄傳》在網(wǎng)上廣泛流傳,關于AI換臉和模擬真人技術的討論上升到社會層面,比如將技術用于不正當目的的倫理問題。

陳偉對此回應,首先, “分身”與“換臉”(deepfakes)在技術層面有著本質的差別,“換臉實際上是把一個人臉映射到另一個人臉上,前期投入成本很大,但‘分身’一旦建模之后,只需要輸入文字就可以生成視頻,不需要任何表演成本在里面?!?/p>

在技術使用的規(guī)范問題上,陳偉表示, “搜狗選擇和明確的公司、在明確的領域合作,盡量通過場景圈定技術的使用范圍,這樣的好處就是不會把技術濫用。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 搜狗
    +關注

    關注

    0

    文章

    91

    瀏覽量

    14260
  • AI
    AI
    +關注

    關注

    91

    文章

    39794

    瀏覽量

    301456

原文標題:對話搜狗陳偉:AI合成主播下一步將如何進化?

文章出處:【微信號:robotn,微信公眾號:產業(yè)大視野】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    東風汽車全新天元智駕T500系統(tǒng)重磅亮相

    AI學會“老司機思維”,TA將成為你的下一個駕駛伙伴,行業(yè)首個量產級生成式“端到端智駕方案”——東風全新天元智駕T500系統(tǒng),一個可能徹底改變你開車方式的技術來了,今天就跟東風
    的頭像 發(fā)表于 03-04 15:53 ?600次閱讀

    歡迎使用中國香河英茂科工豆包智能體

    (替你出鏡/直播) 適合:短視頻、直播、虛擬、口 1. 剪映(最快,免費) 導入你的30秒+說話視頻(單人、清晰) 底部工具欄 → 文本 → 滑到數(shù)字人 → 選克隆視頻形象 上傳視頻 → 等待1
    發(fā)表于 02-14 07:22

    CastFox利用Google開放模型Gemma 3n重塑客互動體驗

    Guru Network Limited 是一家全球的娛樂與游戲公司,其開發(fā)的 CastFox 徹底改變了用戶與客的交互方式,應用上線僅 3 周下載量就突破 100 萬次。
    的頭像 發(fā)表于 02-09 14:50 ?436次閱讀

    兩個RS485(Modbus RTU)站與站之間如何通訊

    本產品能很好解決Master-1站向模塊寫入數(shù)據(jù),Master-2站讀取數(shù)據(jù);Master-2站向模塊寫入數(shù)據(jù),Master-1站讀取數(shù)據(jù)。由此解決兩個
    的頭像 發(fā)表于 02-08 15:32 ?645次閱讀
    兩個RS485(Modbus RTU)<b class='flag-5'>主</b>站與<b class='flag-5'>主</b>站之間如何通訊

    兩個RS485-Modbus站如何通訊

    本產品能很好解決Master-1站向模塊寫入數(shù)據(jù),Master-2站讀取數(shù)據(jù);Master-2站向模塊寫入數(shù)據(jù),Master-1站讀取數(shù)據(jù)。由此解決兩個
    發(fā)表于 02-08 15:32 ?0次下載

    變頻器電路故障分析和處理

    ?變頻器作為現(xiàn)代工業(yè)自動控制系統(tǒng)中不可或缺的關鍵設備,其電路故障直接影響生產效率和設備安全。電路是變頻器的核心部分,主要由整流單元、中間直流環(huán)節(jié)和逆變單元三大部分組成。在實際運行過程中,
    的頭像 發(fā)表于 01-21 12:04 ?310次閱讀
    變頻器<b class='flag-5'>主</b>電路故障分析和處理

    IBM Rhapsody AI 助手:系統(tǒng)工程更智能

    IBM Rhapsody AI 能力的加入,標志著系統(tǒng)工程正逐步邁入智能新階段。它模型不再只是“被動表達設計意圖”的工具,而成為能理解、
    的頭像 發(fā)表于 01-06 11:34 ?306次閱讀
    IBM Rhapsody <b class='flag-5'>AI</b> 助手:<b class='flag-5'>讓</b>系統(tǒng)工程更智能

    進迭客 | Vol.3對話孫彥邦:用胡子賭一個未來,RISC-V是AI時代的“終極答案”

    進迭客「RISC-V圓桌白話錄」「RISC-V圓桌白話錄」第三期客上線!本期客我們邀請到對話進迭時空聯(lián)合創(chuàng)始人、總裁孫彥邦,一起深入探討RISC-V如何成為AI時代的"終極答案
    的頭像 發(fā)表于 11-07 20:26 ?720次閱讀
    進迭<b class='flag-5'>播</b>客 | Vol.3對話孫彥邦:用胡子賭一個未來,RISC-V是<b class='flag-5'>AI</b>時代的“終極答案”

    進迭客 | Vol.2 對話志堅:離開大廠RISC-V芯片創(chuàng)業(yè)4年,見500投資人,被拒 90%,我為何從沒想過放棄?

    進迭客「RISC-V圓桌白話錄」「RISC-V圓桌白話錄」第二期客來啦!本期節(jié)目延續(xù)上期RISC-V芯片的行業(yè)趨勢——我們與進迭時空創(chuàng)始人、CEO志堅一起,聊聊他4年的RISC-V芯片創(chuàng)業(yè)故事
    的頭像 發(fā)表于 10-27 18:34 ?926次閱讀
    進迭<b class='flag-5'>播</b>客 | Vol.2 對話<b class='flag-5'>陳</b>志堅:離開大廠RISC-V芯片創(chuàng)業(yè)4年,見500投資人,被拒 90%,我為何從沒想過放棄?

    進迭客 |「RISC-V 圓桌白話錄」首期正式上線!

    ”解讀技術原理,分享真實創(chuàng)業(yè)故事,提供前沿行業(yè)視角,在AI驅動科技變革的時代,持續(xù)追蹤開源芯片領域的核心動態(tài)與未來趨勢。首期亮點特邀進迭時空創(chuàng)始人兼CEO志堅,進
    的頭像 發(fā)表于 10-16 17:42 ?1370次閱讀
    進迭<b class='flag-5'>播</b>客 |「RISC-V 圓桌白話錄」首期正式上線!

    CW32L011電機開發(fā)板測評

    都有問題,這里把初始放在這里(因為懶惰,以前比較喜歡cubemax,面對這一堆配置,
    發(fā)表于 08-20 19:49

    探索工業(yè)自動核心:ZMC 系列 EtherCAT 站控制器

    ZLG致遠電子的ZMC系列EtherCAT站控制器,憑借多元內核、豐富接口、卓越通信能力及開放開發(fā)環(huán)境,為工業(yè)自動提供全方位解決方案,助力企業(yè)智能升級。前言在工業(yè)自動
    的頭像 發(fā)表于 08-18 11:35 ?1266次閱讀
    探索工業(yè)自動<b class='flag-5'>化</b>核心:ZMC 系列 EtherCAT <b class='flag-5'>主</b>站控制器

    索尼中標浙江廣播電視集團10個制項目

    近日,索尼(中國)有限公司宣布成功核心產品中標浙江廣播電視集團10個制相關項目,涵蓋了從4K超高清攝像機、轉播車視頻系統(tǒng)、小型演播室系統(tǒng)到后期制作系統(tǒng)和播出設備等,進一步鞏固了其在4K超高清制領域的重要地位。此次中標不僅展示了索尼產品在技術上的優(yōu)異表現(xiàn),也體現(xiàn)了索尼產
    的頭像 發(fā)表于 07-10 17:57 ?871次閱讀

    重新理解傳音:市場擴容,多元化AI突圍

    的成長性和業(yè)務的多元化能力。另一方面,AI等技術對硬件同樣帶來沖擊,需要手機廠商作出回應。AI被視為重構智能手機形態(tài)的一個新的抓手,而如何迅猛發(fā)展的
    的頭像 發(fā)表于 05-21 14:17 ?895次閱讀
    重新理解傳音:市場擴容,<b class='flag-5'>多元化</b>和<b class='flag-5'>AI</b>突圍

    AR互動與傳統(tǒng)的交互方式相比更加豐富多元

    AR 互動的另一個顯著特點,是其豐富多元的互動方式。與傳統(tǒng)的交互方式相比,AR 互動不再局限于鼠標、鍵盤、觸摸屏等有限的輸入方式,而是通過多種先進的技術手段,實現(xiàn)了
    的頭像 發(fā)表于 03-10 17:48 ?1057次閱讀
    AR互動與傳統(tǒng)的交互<b class='flag-5'>方式</b>相比<b class='flag-5'>更加</b>豐富<b class='flag-5'>多元</b>