91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

首例“AI聲音侵權(quán)案”,聲音AI化用于短視頻

Carol Li ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-12-20 00:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)AI技術(shù)的應(yīng)用,給我們的生活帶來(lái)了巨大改變。同時(shí),它的不當(dāng)使用也帶來(lái)了侵權(quán)、詐騙等風(fēng)險(xiǎn)。近日,北京互聯(lián)網(wǎng)法院首次組成五人合議庭,依法公開(kāi)審理全國(guó)首例“AI聲音侵權(quán)案”。

該案中,原告殷某某以配音為職業(yè),曾錄制多部有聲作品。殷某某意外發(fā)現(xiàn),自己的聲音被AI化后,在一款名為“魔音工坊”的APP上以“魔小璇”的名義對(duì)外出售。因此,殷某某以被告行為侵害其聲音權(quán)為由,將“魔音工坊”的運(yùn)營(yíng)主體北京小問(wèn)智能科技有限公司等五被告起訴到北京互聯(lián)網(wǎng)法院。

AI聲音侵權(quán)案始末

目前,該案件仍在審理中,五被告均否認(rèn)侵權(quán)。北京小問(wèn)智能科技有限公司認(rèn)為,其APP中的聲音產(chǎn)品有合法來(lái)源,來(lái)自于微軟(中國(guó))有限公司。微軟(中國(guó))有限公司稱(chēng)其使用的聲音來(lái)源于中廣影音(北京)文化傳媒有限公司。

中廣影音(北京)文化傳媒有限公司認(rèn)為其與原告有過(guò)合作,約定經(jīng)原告錄制形成的作品著作權(quán)歸屬其所有。上海藍(lán)云網(wǎng)絡(luò)科技有限公司和北京信諾時(shí)代科技發(fā)展有限公司辯稱(chēng),其分別為微軟中國(guó)的平臺(tái)運(yùn)營(yíng)商與涉案產(chǎn)品的經(jīng)銷(xiāo)商,不構(gòu)成侵權(quán)。

原告則認(rèn)為,他人利用原告聲音的配音作品在抖音、直播吧等APP廣泛流傳,其中抖音用戶(hù)“小禾侃劇”自2021年9月7日至今,共發(fā)布使用原告聲音的作品119部。經(jīng)聲音篩選和溯源,發(fā)現(xiàn)上述聲音作品中的聲音來(lái)自于被告北京小問(wèn)智能科技有限公司運(yùn)營(yíng)的“魔音工坊”APP。

被告中廣影音(北京)文化傳媒有限公司將原告為其錄制的3本書(shū)的音頻交給被告微軟(中國(guó))有限公司,被告微軟(中國(guó))有限公司將原告的聲音進(jìn)行AI化處理,并向被告上海藍(lán)云網(wǎng)絡(luò)科技有限公司和被告北京信諾時(shí)代科技發(fā)展有限公司授權(quán)對(duì)外出售。

但是,原告從未授權(quán)過(guò)任何第三人將其錄制的聲音進(jìn)行AI化并對(duì)外銷(xiāo)售,上述被告的行為已經(jīng)嚴(yán)重侵犯了原告的聲音權(quán),應(yīng)承擔(dān)停止侵權(quán)、賠禮道歉及賠償原告經(jīng)濟(jì)損失、精神損失的侵權(quán)責(zé)任。

北京小問(wèn)智能科技有限公司是出門(mén)問(wèn)問(wèn)旗下公司,魔音工坊是出門(mén)問(wèn)問(wèn)面向AI配音場(chǎng)景推出的新一代AI配音產(chǎn)品。在大模型技術(shù)的加持下,“魔音工坊”是全球首款搭載了大模型AI寫(xiě)作功能的配音平臺(tái),覆蓋了AI寫(xiě)作、AI配音和剪輯等多個(gè)場(chǎng)景。用戶(hù)可以在它的輔助下輕松完成影視解說(shuō)、有聲書(shū)、在線(xiàn)教育、新聞播報(bào)等集文案與配音于一體的內(nèi)容創(chuàng)作。

如今,短視頻、有聲書(shū)市場(chǎng)蓬勃發(fā)展,這也使得聲音合成技術(shù)有了廣泛的應(yīng)用空間。在應(yīng)用市場(chǎng)和深度學(xué)習(xí)技術(shù)的發(fā)展下,語(yǔ)音合成技術(shù)已經(jīng)非常成熟??梢钥吹缴鲜銮闆r是,原告給某公司錄過(guò)幾本書(shū),它的聲音在沒(méi)被授權(quán)的情況下通過(guò)AI化之后,進(jìn)行出售。

這其實(shí)就是現(xiàn)在大家談到的聲音克隆,也稱(chēng)為語(yǔ)音合成定制,是一種深度學(xué)習(xí)算法。平臺(tái)方可以通過(guò)各種渠道獲得某人的聲音之后,哪怕這個(gè)人只是說(shuō)了幾段話(huà),通過(guò)AI技術(shù)都可以合成與原說(shuō)話(huà)人非常相似的聲音。

語(yǔ)音合成歷史及應(yīng)用趨勢(shì)

語(yǔ)音合成,又稱(chēng)文語(yǔ)轉(zhuǎn)換(Text to Speech)技術(shù),能將任意文字信息實(shí)時(shí)轉(zhuǎn)化為標(biāo)準(zhǔn)流暢的語(yǔ)音朗讀出來(lái),相當(dāng)于給機(jī)器裝上了人工嘴巴。它涉及聲學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科技術(shù),是中文信息處理領(lǐng)域的一項(xiàng)前沿技術(shù),解決的主要問(wèn)題就是如何將文字信息轉(zhuǎn)化為可聽(tīng)的聲音信息,也即讓機(jī)器像人一樣開(kāi)口說(shuō)話(huà)。

事實(shí)上,早在18到19世紀(jì),語(yǔ)音合成技術(shù)就已經(jīng)出現(xiàn),當(dāng)時(shí)是用機(jī)械裝置來(lái)模擬人的發(fā)聲,那時(shí)候科學(xué)家們會(huì)制作出一些精巧的氣囊和風(fēng)箱去搭建發(fā)聲的系統(tǒng),可以合成出一些元音和單音。20世紀(jì)初,出現(xiàn)了用電子合成器來(lái)模擬人發(fā)聲的技術(shù),最具代表性的就是貝爾實(shí)驗(yàn)室的Dudley,他在1939年推出了名為“VODER”的電子發(fā)聲器,使用電子器件來(lái)模擬聲音的諧振。

到了20世紀(jì)80年代,隨著集成電路技術(shù)的發(fā)展,出現(xiàn)了比較復(fù)雜的組合型的電子發(fā)生器,比較代表性的KLATT在1980年發(fā)布的串/并聯(lián)混合共振峰合成器。到了20世紀(jì)80、90年代隨著PSOLA方法的提出和計(jì)算機(jī)能力的發(fā)展,單元挑選和波形拼接技術(shù)逐漸走向成熟,90年代末劉慶峰博士提出聽(tīng)感量化思想,首次將中文語(yǔ)音合成技術(shù)做到了實(shí)用化地步。

在20世紀(jì)末期,還有另外一種基于HMM的參數(shù)合成技術(shù)出現(xiàn)。而近些年,隨著AI技術(shù)不斷發(fā)展,基于深度學(xué)習(xí)的語(yǔ)音合成技術(shù)逐漸被人們所知道,DNN/CNN/RNN等各種神經(jīng)網(wǎng)絡(luò)構(gòu)型都可以用來(lái)做語(yǔ)音合成系統(tǒng)的訓(xùn)練,深度學(xué)習(xí)的算法可以更好地模擬人聲變化規(guī)律。語(yǔ)音合成技術(shù)應(yīng)用也迎來(lái)了高速發(fā)展。

當(dāng)下,AI聲音合成技術(shù)的市場(chǎng)需求確實(shí)非常明顯。直播、短視頻、有聲書(shū)的市場(chǎng)需求空間大,然而未接受過(guò)聲音培訓(xùn)的普通人對(duì)于自己的聲音滿(mǎn)意度并不高。而通過(guò)AI技術(shù)讓配音,或者美化自己的聲音正在成為趨勢(shì)。上文提到的魔音工坊正是通過(guò)技術(shù)手段為用戶(hù)提供好聽(tīng)的聲音。

小結(jié)

當(dāng)前來(lái)說(shuō),AI技術(shù)侵權(quán)的問(wèn)題仍然還未得到解決,就如之前使用圖片所有權(quán)人的圖片進(jìn)行訓(xùn)練,生成的圖片,這是否構(gòu)成對(duì)圖片所有權(quán)人的圖片的侵權(quán)。聲音訓(xùn)練也是如此,使用某人的聲音訓(xùn)練出了跟這個(gè)人類(lèi)似的聲音,這個(gè)合成的聲音所有權(quán)算誰(shuí)的?這些還需要進(jìn)一步探討出相應(yīng)的規(guī)范才行。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39911

    瀏覽量

    301545
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    邊緣AI算力臨界點(diǎn):深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價(jià)值

    ) 根據(jù)昇騰社區(qū)開(kāi)發(fā)者分享的實(shí)戰(zhàn)經(jīng)驗(yàn),OrangePi AI Station已被用于部署具身智能領(lǐng)域的 ACT (Action Chunking with Transformers) 模型 。在這一例中
    發(fā)表于 03-10 14:19

    如何查看小智是否成功進(jìn)入聲音設(shè)置?

    你可以通過(guò)后臺(tái)頁(yè)面狀態(tài)、設(shè)備反饋、語(yǔ)音測(cè)試三種方式,快速確認(rèn)小智是否成功進(jìn)入聲音設(shè)置并生效。 一、后臺(tái)頁(yè)面直接查看(最準(zhǔn)) 登錄小智AI后臺(tái):https://xiaozhi.me/console
    發(fā)表于 02-16 06:39

    歡迎使用中國(guó)香河英茂科工豆包智能體

    (替你出鏡/直播) 適合:短視頻、直播、虛擬主播、口播 1. 剪映(最快,免費(fèi)) 導(dǎo)入你的30秒+說(shuō)話(huà)視頻(單人、清晰) 底部工具欄 → 文本 → 滑到數(shù)字人 → 選克隆視頻形象 上傳視頻
    發(fā)表于 02-14 07:22

    使用NORDIC AI的好處

    運(yùn)動(dòng)/手勢(shì)識(shí)別、可穿戴健康監(jiān)測(cè)、預(yù)測(cè)性維護(hù)、樓宇與工業(yè)傳感網(wǎng)絡(luò)本地分析、聲音/關(guān)鍵詞/圖像識(shí)別等,都有官方明確提到的典型用例。[Unlock Edge AI 博客; Nordic Edge AI 技術(shù)頁(yè)]
    發(fā)表于 01-31 23:16

    IC聲音放大芯片怎么焊接區(qū)分啊,好小感覺(jué)四面都一樣?

    想做一個(gè)簡(jiǎn)單的基于ESP32的AI語(yǔ)音識(shí)別助手,焊接好的聲音輸出一直是000。
    發(fā)表于 12-09 22:08

    VS680 HDMI AI分析解決方案 #目標(biāo)識(shí)別 #視頻翻譯 #AI #芯片

    AI
    深蕾半導(dǎo)體
    發(fā)布于 :2025年11月12日 10:29:33

    如何進(jìn)行聲音定位?

    文章主要介紹了如何利用一種簡(jiǎn)單的TDOA算法進(jìn)行聲音點(diǎn)位,并使用數(shù)據(jù)采集卡進(jìn)行聲音定位的實(shí)驗(yàn)。
    的頭像 發(fā)表于 09-23 15:47 ?1843次閱讀
    如何進(jìn)行<b class='flag-5'>聲音</b>定位?

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    配備科學(xué)發(fā)現(xiàn)仍需人類(lèi)的直覺(jué)和靈感 ④正價(jià)可解釋性和透明性 ⑤解決倫理和道德問(wèn)題六、AI芯片用于AI科學(xué)家”系統(tǒng) AI芯片的作用:七、用量子啟發(fā)AI
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:從AI硬件到AI濕件

    想到,除了研究大腦的抽象數(shù)學(xué)模型外,能否拋棄傳統(tǒng)的芯片實(shí)現(xiàn)方式,以化學(xué)物質(zhì)和生物組件、材料及相關(guān)現(xiàn)象來(lái)構(gòu)建人工神經(jīng)網(wǎng)絡(luò)或提取其功能來(lái)用于AI處理,甚至直接用生物體來(lái)實(shí)現(xiàn)AI功能,這就是從AI
    發(fā)表于 09-06 19:12

    關(guān)于NanoEdge AI用于n-Class的問(wèn)題求解

    我想請(qǐng)教一下關(guān)于NanoEdge AI用于n-Class的問(wèn)題。我使用NanoEdge AI的n-Class模式,訓(xùn)練好模型,設(shè)計(jì)了3個(gè)分類(lèi),使用PC端的模擬工具測(cè)試過(guò),模型可以正常對(duì)數(shù)據(jù)進(jìn)行分類(lèi)
    發(fā)表于 08-11 06:44

    聲源定位模塊-AR1105# 聲源定位# 聲音定位

    聲音降噪
    深圳市聲訊電子有限公司
    發(fā)布于 :2025年08月01日 16:01:09

    AI視頻分析和算法集合

    AI
    jf_02235694
    發(fā)布于 :2025年07月23日 16:10:12

    正點(diǎn)原子 AI BOX0 智能伴侶,1.54寸高清屏+長(zhǎng)效續(xù)航,語(yǔ)音暢聊,情景對(duì)話(huà),知識(shí)科普,多色可選,隨身攜帶!

    品非它莫屬! 為什么選擇小智AI? 真人級(jí)交互體驗(yàn) ① AI情感對(duì)話(huà):不止問(wèn)答,更能陪你聊心事、講笑話(huà),像朋友一樣懂你! ② 10+音色百變:溫柔御姐、萌趣童聲、磁性男神… 每天換一種聲音陪伴
    發(fā)表于 04-24 16:11

    首創(chuàng)開(kāi)源架構(gòu),天璣AI開(kāi)發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    正式提出“智能體化用戶(hù)體驗(yàn)”方向,并啟動(dòng)“天璣智能體化體驗(yàn)領(lǐng)航計(jì)劃”。更值得注意的是,其三大AI工具鏈的發(fā)布——天璣開(kāi)發(fā)工具集、AI開(kāi)發(fā)套件2.0,以及升級(jí)的天璣星速引擎與旗艦芯片天璣9400+,標(biāo)志著聯(lián)發(fā)
    發(fā)表于 04-13 19:52

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開(kāi)發(fā)

    ,包括 PCIe Gen3(2 Lanes)、USB 3.2、雙 USB 2.0 及 2x GbE,支持 MIPI CSI 攝像頭輸入和 MIPI DSI/LVDS 視頻輸出,為 AI 視覺(jué)應(yīng)用和工業(yè)物
    發(fā)表于 03-19 17:54