亞馬遜網(wǎng)絡(luò)服務(wù)公司(Amazon Web Services Inc.)正在接管Google LLC的人聲復(fù)制功能,今天為亞馬遜波利(Amazon Polly)添加了兩項(xiàng)新功能,這是一項(xiàng)基于云的服務(wù),可將文本轉(zhuǎn)換為逼真的語(yǔ)音,并用于創(chuàng)建可以通話的應(yīng)用程序。
新功能的第一個(gè)功能稱為“神經(jīng)文本語(yǔ)音轉(zhuǎn)換”,亞馬遜表示,通過(guò)增強(qiáng)合成語(yǔ)音的“自然度”和“表達(dá)力”,可以在語(yǔ)音質(zhì)量上“顯著改善”。
關(guān)于神經(jīng)文本語(yǔ)音轉(zhuǎn)換的一大優(yōu)點(diǎn)是,由于亞馬遜去年在研究論文中提到的一種新的人工智能模型,它只需訓(xùn)練幾個(gè)小時(shí)就可以學(xué)習(xí)新的口語(yǔ)風(fēng)格。該模型通過(guò)將大量標(biāo)準(zhǔn)的中性語(yǔ)音與僅幾個(gè)小時(shí)的目標(biāo)語(yǔ)音風(fēng)格的其他語(yǔ)音數(shù)據(jù)相結(jié)合而起作用??梢愿鶕?jù)需要添加新的補(bǔ)充數(shù)據(jù),以創(chuàng)建各種其他語(yǔ)音樣式。
AWS傳福音者朱利安·西蒙(Julien Simon)在博客中寫道,使用Neural-Text-To-Speech的基本算法,亞馬遜創(chuàng)建了第二個(gè)新功能,這是新聞播音員式的聲音,使敘事聲音在閱讀新聞和類似內(nèi)容時(shí)“更加逼真”。發(fā)布。
西蒙說(shuō):“語(yǔ)音質(zhì)量當(dāng)然很重要,但是要使合成語(yǔ)音更加逼真和引人入勝,還可以做更多的工作?!?“風(fēng)格呢?可以肯定的是,人耳可以分辨出新聞廣播,體育廣播,大學(xué)課程等之間的區(qū)別;實(shí)際上,大多數(shù)人在正確的環(huán)境中采用正確的言語(yǔ)風(fēng)格,這無(wú)疑有助于傳達(dá)他們的信息。”
西蒙說(shuō),包括《環(huán)球郵報(bào)》,《大不列顛百科全書(shū)》和TIM Media在內(nèi)的組織已經(jīng)在使用Polly的新聞廣播員風(fēng)格。該功能也已引入到支持Amazon Alexa的設(shè)備中,該設(shè)備用于敘述每日新聞簡(jiǎn)報(bào)和類似內(nèi)容。
-
人工智能
+關(guān)注
關(guān)注
1817文章
50105瀏覽量
265556 -
模型
+關(guān)注
關(guān)注
1文章
3756瀏覽量
52127 -
亞馬遜
+關(guān)注
關(guān)注
8文章
2731瀏覽量
85758
發(fā)布評(píng)論請(qǐng)先 登錄
RDMA設(shè)計(jì)21:連接管理模塊設(shè)計(jì)
RDMA設(shè)計(jì)14:連接管理模塊設(shè)計(jì)
LLC工作原理詳細(xì)介紹
?UCC25661 LLC控制器技術(shù)文檔總結(jié)
谷歌查找我的設(shè)備配件(Google Find My Device Accessory)詳解和應(yīng)用
應(yīng)用中的“復(fù)制功能”如何實(shí)現(xiàn)##HarmonyOS應(yīng)用開(kāi)發(fā)##
Google Fast Pair服務(wù)簡(jiǎn)介
自動(dòng)駕駛汽車接管邏輯如何設(shè)置更為合理?
基于CM6901的LLC半橋諧振開(kāi)關(guān)電源設(shè)計(jì)
做電源,不懂LLC就虧大了!
亞馬遜功能最強(qiáng)模型Amazon Nova Premier現(xiàn)已正式可用
自動(dòng)駕駛?cè)绾卧O(shè)置合理的接管機(jī)制?
LLC動(dòng)態(tài)性能分析
亞馬遜正在接管Google LLC的人聲復(fù)制功能
評(píng)論