91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟在文本到語音合成方面達到了一個新的里程碑

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-09-26 09:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

微軟在Ignite會議上推出新的神經(jīng)文本-語音合成(TTS)利器!這項新服務(wù)生成的語音在節(jié)奏、語調(diào)和頓挫感上都幾乎和真人一樣,具備人類語音一樣的自然韻律和詞匯清晰度。目前該服務(wù)已經(jīng)發(fā)布預(yù)覽版,開發(fā)者可申請嘗鮮!

微軟在文本到語音合成方面達到了一個新的里程碑,利用深度神經(jīng)網(wǎng)絡(luò),使計算機合成的聲音幾乎與真人的錄音無法區(qū)分。合成的聲音具備和人類語音一樣的自然韻律和明確的詞匯清晰度,用戶在與AI系統(tǒng)進行交互時,可以顯著降低聽覺疲勞。

微軟技術(shù)院士、語音和語言團隊負(fù)責(zé)人黃學(xué)東(Xuedong Huang)表示:

語音是推動環(huán)境計算開發(fā)的新界面,因為語音識別已經(jīng)改變了我們的日常生活,從數(shù)字化助理、電子郵件和文檔內(nèi)容的聽寫、再到記錄演講和會議內(nèi)容。由于微軟多年來在語音識別方面的研究,以及一直處于最前沿的神經(jīng)網(wǎng)絡(luò)技術(shù)的跨越式進步,這些方案在今天仍然可行。

隨著微軟Azure GPU加速的虛擬機規(guī)模的不斷擴展,如ND v2使用的8路互聯(lián)NVIDIA Tesla V100 GPU以及基于Skylake的處理器,我們有可能快速提高大規(guī)模語音識別模型的訓(xùn)練速度,為Cortana,Skype翻譯,Windows和Office提供支持。期待這些服務(wù)的發(fā)布!“

黃學(xué)東

新文本-語音合成服務(wù)已經(jīng)可預(yù)覽,開發(fā)者可嘗鮮

黃學(xué)東表示,微軟的團隊本周在佛羅里達州奧蘭多舉行的Microsoft Ignite會議上展示了這個神經(jīng)網(wǎng)絡(luò)驅(qū)動的文本到語音合成功能。該功能目前可通過Azure Cognitive Services語音服務(wù)進行預(yù)覽。

該功能可以讓聊天機器人和虛擬助理的交互更自然、更具吸引力,比如將電子書等數(shù)字化文本轉(zhuǎn)換為有聲讀物,讓車載導(dǎo)航系統(tǒng)的功能更加強大等。

這項文本-語音轉(zhuǎn)換功能是微軟在過去兩年中取得的一系列突破之一,其他技術(shù)突破還包括在會話語音識別和機器翻譯中達到與人類大體相當(dāng)?shù)乃健?/p>

神經(jīng)文本到語音合成(TTS):聲音和真人一樣

微軟此次發(fā)布的文本到語音合成技術(shù),利用深度神經(jīng)網(wǎng)絡(luò)來克服傳統(tǒng)的文本到語音轉(zhuǎn)換系統(tǒng)的局限性,匹配口語中的語音頓挫和語調(diào)模式和韻律,并將語音單元合成為計算機語音。

傳統(tǒng)的文本到語音系統(tǒng)將韻律分解為單獨的語言分析和聲學(xué)預(yù)測,這些步驟分別由獨立模型控制。這可能導(dǎo)致合成后的語音結(jié)果過于低沉和嘈雜。微軟的系統(tǒng)能夠同時進行韻律預(yù)測和語音合成,合成的聲音更加流暢自然。

利用微軟Azure的計算能力,該服務(wù)可以提供實時流,這對于與聊天機器人或虛擬助手進行交互等場景是非常有用的。

微軟將在Azure Kubernetes服務(wù)中提供該功能。這可以確保了這一功能具備較高的高可擴展性和可用性,讓客戶能夠從單個端點使用基于神經(jīng)網(wǎng)絡(luò)的文本到語音轉(zhuǎn)換和傳統(tǒng)的文本到語音轉(zhuǎn)換服務(wù)。

目前預(yù)覽版的服務(wù)提供兩種預(yù)先構(gòu)建的英語文本-語音轉(zhuǎn)換服務(wù),有男女兩種聲音(Jessa和Guy)。未來即將推出更多語言,以及49種語言的定制服務(wù),為希望構(gòu)建針對其特定需求而優(yōu)化語音的客戶提供定制化服務(wù)。

文本-語音轉(zhuǎn)換服務(wù)的典型應(yīng)用場景

提高可訪問性:文本-語音轉(zhuǎn)換技術(shù)使得內(nèi)容所有者和發(fā)布者能夠響應(yīng)人們與其內(nèi)容交互的不同方式。憑借該技術(shù),視力有障礙或閱讀困難的人也能夠通過聽覺來消費內(nèi)容。語音輸出還能使人們在上下班或鍛煉時更容易通過移動設(shè)備上獲取文本內(nèi)容,比如報紙或博客。

多任務(wù)場景下的反應(yīng):文本-語音轉(zhuǎn)換技術(shù)讓人們能夠在駕駛時、或不便閱讀的環(huán)境中快速舒適地吸收重要信息。該領(lǐng)域的常見應(yīng)用是導(dǎo)航服務(wù)。

增強多模式學(xué)習(xí):不同的人有不同的最佳學(xué)習(xí)方式。在線學(xué)習(xí)專家發(fā)現(xiàn),同時提供語音和文本有助于讓信息更加易于學(xué)習(xí)。

開發(fā)認(rèn)知機器人和助理:對話能力可能是智能聊天機器人或虛擬助手的重要組成部分。越來越多的公司正在開發(fā)聊天機器人,為客戶提供引人入勝的服務(wù)體驗。該技術(shù)為聊天機器人和數(shù)字化助理的響應(yīng)方式增加了一個新的維度。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6741

    瀏覽量

    107887
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107834

原文標(biāo)題:微軟文本-語音合成轉(zhuǎn)換技術(shù)新里程碑!完美再現(xiàn)真人聲調(diào)

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    中軟國際金融科技出海征程再添關(guān)鍵里程碑

    近日,中軟國際金融業(yè)務(wù)集團成功斬獲馬來西亞某知名數(shù)字銀行移動應(yīng)用開發(fā)項目。該項目是金融業(yè)務(wù)集團東南亞區(qū)域突破的又家核心數(shù)字銀行客戶,為公司金融科技出海征程再添關(guān)鍵里程碑
    的頭像 發(fā)表于 02-06 18:06 ?2409次閱讀

    億緯鋰能綠色制造體系建設(shè)取得里程碑式突破

    ,將于2025-2030年,以園中園形式進行建設(shè)。這標(biāo)志著億緯鋰能"CREATE碳中和行動"初見成效,綠色制造體系建設(shè)取得里程碑式突破。
    的頭像 發(fā)表于 01-05 17:55 ?1027次閱讀

    立訊精密高速互連領(lǐng)域取得里程碑式突破

    近日,立訊精密自主研發(fā)的HDMI 2.2連接器及配套測試治具,正式通過HDMI Forum首批官方認(rèn)證。公司成為全球首家同時獲得產(chǎn)品端與測試端雙認(rèn)證的供應(yīng)商,標(biāo)志著高速互連領(lǐng)域取得里程碑式突破。
    的頭像 發(fā)表于 12-24 15:55 ?485次閱讀
    立訊精密<b class='flag-5'>在</b>高速互連領(lǐng)域取得<b class='flag-5'>里程碑</b>式突破

    回顧那些具有里程碑意義的Arm架構(gòu)產(chǎn)品(1)

    Arm 成立 35 周年之際,我們將分三期內(nèi)容,與你同回顧 35 款具有里程碑意義的 Arm 架構(gòu)產(chǎn)品 —— 它們憑借智能、性能與能效的深度融合,重塑了現(xiàn)代計算格局,更推動了全球科技變革的浪潮。本周我們就將從 Arm 成立
    的頭像 發(fā)表于 12-15 14:59 ?730次閱讀

    奧托立夫祝賀汽大眾達成3000萬輛里程碑

    2025年10月30日,我們重要的合作伙伴汽-大眾迎來第3000萬輛整車下線的歷史性時刻,標(biāo)志著其成為國內(nèi)首家達成這一里程碑的乘用車企業(yè)!奧托立夫受邀出席下線儀式,共同見證這中國汽車工業(yè)發(fā)展的重大
    的頭像 發(fā)表于 11-03 09:56 ?536次閱讀

    意法半導(dǎo)體衛(wèi)星數(shù)字廣播芯片組榮獲IEEE里程碑

    1799年,Alessandro Volta向世界展示了電能儲存技術(shù);世紀(jì)后,Guglielmo Marconi向世界證明無線電波可以跨洋傳輸。IEEE里程碑獎?wù)菫榧o(jì)念這些改變世界的技術(shù)突破而設(shè)立,提醒我們,當(dāng)銳意創(chuàng)新、產(chǎn)
    的頭像 發(fā)表于 09-11 09:59 ?747次閱讀

    北京奔馳迎來成立20周年的重要里程碑

    今日,北京奔馳汽車有限公司(以下簡稱“北京奔馳”)迎來成立20周年的重要里程碑。作為梅賽德斯-奔馳在華唯乘用車生產(chǎn)基地,北京奔馳始終踐行高質(zhì)量發(fā)展理念,以持續(xù)積淀的硬核制造實力、前瞻的智能布局和穩(wěn)健的人才戰(zhàn)略,成為中國高端制造的
    的頭像 發(fā)表于 08-16 09:09 ?1292次閱讀

    新思科技與TeraSignal光網(wǎng)絡(luò)領(lǐng)域達成兩大里程碑

    新思科技與TeraSignal光網(wǎng)絡(luò)領(lǐng)域達成兩大里程碑,展示了基于線性光學(xué)技術(shù)的PCIe 6.x和112 Gbps以太網(wǎng)的無縫互操作性。
    的頭像 發(fā)表于 08-15 15:42 ?1042次閱讀
    新思科技與TeraSignal<b class='flag-5'>在</b>光網(wǎng)絡(luò)領(lǐng)域達成兩大<b class='flag-5'>里程碑</b>

    愛立信攜手Telstra創(chuàng)下全新行業(yè)里程碑

    愛立信近日攜手Telstra創(chuàng)下全新行業(yè)里程碑,悉尼北部50多個商用5G-A站點成功部署自動載波聚合技術(shù),使Telstra成為首個商用網(wǎng)絡(luò)環(huán)境中應(yīng)用該功能的運營商。
    的頭像 發(fā)表于 08-06 16:45 ?1.7w次閱讀

    里程碑!屹立芯創(chuàng)除泡系統(tǒng)落地馬來檳城,深耕 IoT 與先進封裝

    年中之際,屹立芯創(chuàng)迎來里程碑時刻 —— 公司自主研發(fā)生產(chǎn)的真空壓力除泡系統(tǒng),已正式交付頭部通信模組企業(yè),馬來西亞檳城研發(fā)中心。這成果不僅是對其在先進制造領(lǐng)域技術(shù)實力的硬核驗證,更標(biāo)志著企業(yè) IoT 領(lǐng)域?qū)崿F(xiàn)了更深層次的突破,
    的頭像 發(fā)表于 07-15 10:07 ?672次閱讀
    <b class='flag-5'>里程碑</b>!屹立芯創(chuàng)除泡系統(tǒng)落地馬來檳城,深耕 IoT 與先進封裝

    里程碑!亞馬遜第 100 萬機器人上崗!人類員工岌岌可危?

    電子發(fā)燒友網(wǎng)報道(文 / 吳子鵬)亞馬遜宣布全球部署 100 萬臺機器人,這一里程碑標(biāo)志著全球物流行業(yè)邁入智能化與自動化的新階段。第 100 萬機器人被送往日本東京的運營中心,加入覆蓋全球
    的頭像 發(fā)表于 07-08 09:22 ?6109次閱讀

    Agentic AI再豎里程碑,這次引爆革命的還是亞馬遜云科技

    科技云報到原創(chuàng)。 誰都知道AI發(fā)展的速度日新月異,但當(dāng)里程碑即將出現(xiàn)時,所有人依然心潮澎湃。 亞馬遜云科技中國峰會上,Agentic AI就是這顆耀眼的科技新星。亞馬遜全球副總裁、亞馬遜云科技大
    的頭像 發(fā)表于 06-25 10:28 ?590次閱讀
    Agentic AI再豎<b class='flag-5'>里程碑</b>,這次引爆革命的還是亞馬遜云科技

    四創(chuàng)電子水利監(jiān)測設(shè)備取得里程碑式進展

    近日,四創(chuàng)電子自主研發(fā)的相控陣型水利測雨雷達,完成全部技術(shù)驗證并工程化落地。該型雷達不僅攻克了相控陣體制下水利測雨全要素技術(shù)指標(biāo)的工程實現(xiàn)難題,更在核心算法、軟計架構(gòu)等關(guān)鍵技術(shù)實現(xiàn)完全自主可控,標(biāo)志著公司水利監(jiān)測設(shè)備取得里程碑式進展。
    的頭像 發(fā)表于 05-06 16:06 ?1087次閱讀

    【CW32模塊使用】語音合成播報模塊

    SYN6288E 中文語音合成芯片是北京宇音天下科技有限公司 2010 年初推出的款性/價比更高的 SYN6288 芯片的基礎(chǔ)上更改封裝方式的,效果更自然的
    的頭像 發(fā)表于 03-29 17:25 ?1222次閱讀
    【CW32模塊使用】<b class='flag-5'>語音</b><b class='flag-5'>合成</b>播報模塊

    無線路燈控制器:路燈控制器走向智能化的里程碑

    無線路燈控制器:路燈控制器走向智能化的里程碑
    的頭像 發(fā)表于 03-17 09:19 ?937次閱讀
    無線路燈控制器:路燈控制器走向智能化的<b class='flag-5'>里程碑</b>