91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI使用音頻剪輯對(duì)與語(yǔ)音匹配的真實(shí)感面部建模

倩倩 ? 來(lái)源:新經(jīng)網(wǎng) ? 2020-04-11 10:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

您是否曾經(jīng)僅僅根據(jù)他們的聲音來(lái)構(gòu)造一個(gè)從未見(jiàn)過(guò)的人的心理形象?人工智能AI)現(xiàn)在可以做到這一點(diǎn),僅使用簡(jiǎn)短的音頻剪輯作為參考即可生成人臉的數(shù)字圖像。

這個(gè)名為“ Speech2Face” 的神經(jīng)網(wǎng)絡(luò)(一種以類(lèi)似于人腦的方式“思考”的計(jì)算機(jī))經(jīng)過(guò)科學(xué)家培訓(xùn),接受了來(lái)自互聯(lián)網(wǎng)的數(shù)百萬(wàn)個(gè)教育視頻,顯示了100,000多個(gè)不同的人在說(shuō)話(huà)。

研究人員在一項(xiàng)新研究中寫(xiě)道,Speech2Face通過(guò)該數(shù)據(jù)集學(xué)習(xí)了語(yǔ)音提示與人臉某些物理特征之間的關(guān)聯(lián)。然后,AI使用音頻剪輯對(duì)與語(yǔ)音匹配的真實(shí)感面部建模。

值得慶幸的是,人工智能還不能僅僅根據(jù)他們的聲音確切地知道特定的人是什么樣。研究作者報(bào)告說(shuō),神經(jīng)網(wǎng)絡(luò)識(shí)別語(yǔ)音中的某些標(biāo)記,這些標(biāo)記指向性別,年齡和種族,是許多人共有的特征。

科學(xué)家寫(xiě)道:“因此,該模型只會(huì)產(chǎn)生看上去普通的面孔?!?“它不會(huì)產(chǎn)生特定個(gè)人的圖像?!?/p>

盡管坦率地說(shuō),對(duì)貓的解釋有點(diǎn)讓人恐懼,但AI已經(jīng)證明它可以產(chǎn)生出異常準(zhǔn)確的人臉。

由Speech2Face生成的臉部-均面向正面并具有中性表情-與聲音背后的人并不完全匹配。但是,根據(jù)這項(xiàng)研究,這些圖像通常確實(shí)可以捕捉到正確的年齡范圍,種族和性別。

但是,該算法的解釋遠(yuǎn)非完美。當(dāng)面對(duì)語(yǔ)言變化時(shí),Speech2Face表現(xiàn)出“混合表現(xiàn)”。例如,當(dāng)AI收聽(tīng)亞洲人講中文的音頻片段時(shí),該程序會(huì)產(chǎn)生亞洲人臉的圖像。然而,據(jù)科學(xué)家報(bào)道,當(dāng)同一個(gè)人用不同的音頻片段講英語(yǔ)時(shí),人工智能產(chǎn)生了白人的面孔。

該算法還顯示出性別偏見(jiàn),將低音調(diào)的聲音與男性面孔相關(guān)聯(lián),將高音調(diào)的聲音與女性面孔相關(guān)聯(lián)。研究人員寫(xiě)道,由于訓(xùn)練數(shù)據(jù)集僅代表YouTube上的教育視頻,因此“并不代表整個(gè)世界人口?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)字圖像
    +關(guān)注

    關(guān)注

    2

    文章

    122

    瀏覽量

    19581
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50095

    瀏覽量

    265310
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26190
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    一文了解語(yǔ)音AI的運(yùn)作方式

    語(yǔ)音 AI 是對(duì)話(huà)式 AI 的一個(gè)子集,包括可將人類(lèi)語(yǔ)音轉(zhuǎn)換為文本的自動(dòng)語(yǔ)音識(shí)別 (ASR) 和文本轉(zhuǎn)語(yǔ)
    的頭像 發(fā)表于 02-27 16:10 ?302次閱讀
    一文了解<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>AI</b>的運(yùn)作方式

    語(yǔ)音跳線(xiàn):構(gòu)建高效音頻傳輸系統(tǒng)的核心組件

    在會(huì)議系統(tǒng)、錄音棚、廣播電臺(tái)等專(zhuān)業(yè)音頻場(chǎng)景中,語(yǔ)音跳線(xiàn)作為連接麥克風(fēng)、調(diào)音臺(tái)、功放等設(shè)備的“神經(jīng)末梢”,其性能直接影響聲音信號(hào)的保真度與傳輸穩(wěn)定性。本文從技術(shù)原理、應(yīng)用場(chǎng)景、選型要點(diǎn)三個(gè)維度,解析
    的頭像 發(fā)表于 01-19 10:12 ?201次閱讀
    <b class='flag-5'>語(yǔ)音</b>跳線(xiàn):構(gòu)建高效<b class='flag-5'>音頻</b>傳輸系統(tǒng)的核心組件

    應(yīng)用 I 音頻接口防護(hù)方案

    放電損害,怎么讓產(chǎn)品穩(wěn)定可靠的運(yùn)行,成為我們迫切需要處理的問(wèn)題。兩種信號(hào)的優(yōu)缺點(diǎn)一、模擬信號(hào)優(yōu)點(diǎn):自然真實(shí)感強(qiáng)、實(shí)時(shí)性好、簡(jiǎn)單易用、無(wú)需轉(zhuǎn)換。缺點(diǎn):抗干擾能力弱、
    的頭像 發(fā)表于 12-29 13:37 ?213次閱讀
    應(yīng)用 I <b class='flag-5'>音頻</b>接口防護(hù)方案

    新品 | Module ASR,AI智能離線(xiàn)語(yǔ)音模塊

    ModuleASR是一款基于CI1302芯片設(shè)計(jì)的AI智能離線(xiàn)語(yǔ)音模塊。配備麥克風(fēng)用于清晰音頻采集,并內(nèi)置揚(yáng)聲器提供高質(zhì)量的音頻反饋。同時(shí)支持中途語(yǔ)
    的頭像 發(fā)表于 12-05 18:15 ?676次閱讀
    新品 | Module ASR,<b class='flag-5'>AI</b>智能離線(xiàn)<b class='flag-5'>語(yǔ)音</b>模塊

    深度解析:康謀雙模態(tài)仿真測(cè)試解決方案!

    隨著端到端自動(dòng)駕駛架構(gòu)的興起,傳統(tǒng)基于規(guī)則的仿真測(cè)試正面臨“真實(shí)感不足”與“場(chǎng)景泛化難”的雙重挑戰(zhàn)。本文深入解析康謀推出的雙模態(tài)仿真測(cè)試解決方案:一方面依托aiSim提供確定性的物理級(jí)傳感器建模;另一方面通過(guò)WorldExtractor實(shí)現(xiàn)基于3DGS
    的頭像 發(fā)表于 11-21 17:32 ?8869次閱讀
    深度解析:康謀雙模態(tài)仿真測(cè)試解決方案!

    安信可小智AI語(yǔ)音模組實(shí)測(cè):實(shí)現(xiàn)語(yǔ)音控制關(guān)燈

    以下作品由安信可社區(qū)用戶(hù) zzbinfo 制作 ? 這次評(píng)測(cè)的是安信可科技出品的Ai-WV01-32S的小智AI語(yǔ)音模組。 將從 開(kāi)箱、配網(wǎng)、語(yǔ)音測(cè)試 ,到最終通過(guò) 串口指令控制 一個(gè)
    的頭像 發(fā)表于 11-19 16:09 ?1074次閱讀
    安信可小智<b class='flag-5'>AI</b><b class='flag-5'>語(yǔ)音</b>模組實(shí)測(cè):實(shí)現(xiàn)<b class='flag-5'>語(yǔ)音</b>控制關(guān)燈

    AI語(yǔ)音模組】自制小智管家?安信可Ai-WV01-32S測(cè)試體驗(yàn)

    項(xiàng)目名:默語(yǔ)小智管家 模組支持: 安信可科技 AI語(yǔ)音模組 作者:安信可論壇用戶(hù) molun 這兩年, AI 硬件又卷起來(lái)了。 ? 語(yǔ)音助手、AI
    的頭像 發(fā)表于 11-19 16:06 ?604次閱讀
    【<b class='flag-5'>AI</b><b class='flag-5'>語(yǔ)音</b>模組】自制小智管家?安信可<b class='flag-5'>Ai</b>-WV01-32S測(cè)試體驗(yàn)

    炬芯科技亮相2025亞洲AI音頻大會(huì)

    近日,2025亞洲AI音頻大會(huì)在深圳成功舉辦,作為中國(guó)行業(yè)現(xiàn)象級(jí)盛會(huì)之一,大會(huì)分享和展示音頻技術(shù)的最新成果。炬芯科技便攜式音頻事業(yè)部產(chǎn)品總監(jiān)張洪波受邀出席,以《全場(chǎng)景
    的頭像 發(fā)表于 09-29 11:36 ?4521次閱讀

    廣州唯創(chuàng)電子混音IC播報(bào)語(yǔ)音芯片:革新音頻應(yīng)用的新力量

    音頻源智能混音,開(kāi)啟音頻交互新紀(jì)元在智能化浪潮席卷各行各業(yè)的今天,音頻處理技術(shù)正經(jīng)歷著革命性的變革。傳統(tǒng)的單一路徑語(yǔ)音播放已無(wú)法滿(mǎn)足日益復(fù)雜的應(yīng)用場(chǎng)景需求,混音播報(bào)
    的頭像 發(fā)表于 09-24 09:25 ?561次閱讀
    廣州唯創(chuàng)電子混音IC播報(bào)<b class='flag-5'>語(yǔ)音</b>芯片:革新<b class='flag-5'>音頻</b>應(yīng)用的新力量

    唯創(chuàng)知音AI語(yǔ)音交互芯片與模組介紹

    AI語(yǔ)音交互已經(jīng)成為智能產(chǎn)品的基礎(chǔ)配置,比如常見(jiàn)的AI玩具、智能家居、帶AI功能的藍(lán)牙音響,還有汽車(chē)的智能車(chē)機(jī)和智能穿戴設(shè)備等。唯創(chuàng)知音順應(yīng)市場(chǎng)趨勢(shì)推出了WT2606A系列的
    的頭像 發(fā)表于 09-17 15:51 ?747次閱讀
    唯創(chuàng)知音<b class='flag-5'>AI</b><b class='flag-5'>語(yǔ)音</b>交互芯片與模組介紹

    解鎖高品質(zhì)音頻體驗(yàn):探索音頻質(zhì)量評(píng)估與測(cè)試的科學(xué)之道

    高品質(zhì)音頻的科學(xué)世界!二、音頻質(zhì)量評(píng)估簡(jiǎn)介語(yǔ)音質(zhì)量評(píng)估就是通過(guò)人類(lèi)或自動(dòng)化的方法評(píng)價(jià)語(yǔ)音質(zhì)量。在實(shí)踐中,有很多主觀和客觀的方法評(píng)價(jià)語(yǔ)音質(zhì)量。
    發(fā)表于 07-22 11:15

    最新人工智能硬件培訓(xùn)AI基礎(chǔ)入門(mén)學(xué)習(xí)課程參考2025版(離線(xiàn)AI語(yǔ)音視覺(jué)識(shí)別篇)

    端側(cè)離線(xiàn) AI 智能硬件作為 AI 技術(shù)的重要載體之一,憑借其無(wú)需依賴(lài)網(wǎng)絡(luò)即可實(shí)現(xiàn)智能功能的特性,在一些網(wǎng)絡(luò)條件受限或?qū)?shù)據(jù)隱私有較高要求的場(chǎng)景中,發(fā)揮著不可或缺的作用。本章基于CSK6大模型語(yǔ)音
    發(fā)表于 07-04 11:14

    AI玩具爆發(fā),音頻編解碼器如何滿(mǎn)足語(yǔ)音交互需求

    電子發(fā)燒友網(wǎng)綜合報(bào)道,在AI玩具已經(jīng)開(kāi)始逐漸爆發(fā)的當(dāng)下,人機(jī)交互已經(jīng)成為標(biāo)配功能,而最重要的便是語(yǔ)音控制。而語(yǔ)音控制的第一步,便需要讓AI玩具聽(tīng)懂你在說(shuō)什么這就需要用到
    的頭像 發(fā)表于 06-20 01:07 ?7252次閱讀

    90元打造小智AI腕表,語(yǔ)音交互超有趣!

    ,分辨率 240*280,支持觸摸。 語(yǔ)音交互:內(nèi)置麥克風(fēng),支持語(yǔ)音喚醒和語(yǔ)音指令。 音頻播放:1609 8Ω/1W 喇叭。 外殼設(shè)計(jì):智能手表。 鋰電池:302535 320mAh,
    發(fā)表于 04-16 14:26

    借助Arm技術(shù)革新未來(lái)手游體驗(yàn)

    手游正在不斷得到重塑。隨著內(nèi)容創(chuàng)作、真實(shí)感和沉浸式體驗(yàn)的顯著發(fā)展,移動(dòng)設(shè)備上的游戲開(kāi)發(fā)和體驗(yàn)方式正在發(fā)生快速演變。
    的頭像 發(fā)表于 03-10 09:17 ?1244次閱讀