91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能語音前沿技術(shù)——發(fā)音檢錯(cuò)糾錯(cuò)和語音轉(zhuǎn)換

h1654155972.5709 ? 來源:未知 ? 作者:鄧佳佳 ? 2018-03-22 15:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近年來,人工智能在國內(nèi)外掀起了新一輪技術(shù)創(chuàng)新的浪潮,人工智能正在成為產(chǎn)業(yè)革命的新風(fēng)口。據(jù)BBC預(yù)測,到2020年,全球人工智能市場規(guī)??蛇_(dá)到1190億元。艾瑞咨詢預(yù)測,到2020年,中國人工智能市場規(guī)模約91億元。

目前,政策、經(jīng)濟(jì)、人才、技術(shù)各方面都為人工智能提供了很好的條件:

(1) 政策:人工智能進(jìn)入國家戰(zhàn)略層面。國務(wù)院在《關(guān)于積極推進(jìn)“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見》中將人工智能推上國家戰(zhàn)略層面。在國家“十三五”規(guī)劃的“科技創(chuàng)新-2030項(xiàng)目”中,智能制造和機(jī)器人被列為重大發(fā)展工程。2016年,為加快人工智能產(chǎn)業(yè)發(fā)展,國家發(fā)展改革委、科技部、工業(yè)和信息化部、中央網(wǎng)信辦制定了《“互聯(lián)網(wǎng)+”人工智能三年行動實(shí)施方案》。2016年科大訊飛、華為等行業(yè)知名企業(yè),在深圳共同發(fā)布中國《人工智能深圳宣言》,積極探索政、產(chǎn)、學(xué)、研、用合作機(jī)制,推動人工智能產(chǎn)業(yè)的協(xié)同發(fā)展。2017年十二屆全國人大會議中,國務(wù)院******提出,要推動內(nèi)地與港澳深化合作,研究制定“粵港澳大灣區(qū)”城市群發(fā)展規(guī)劃,提升在國家經(jīng)濟(jì)發(fā)展和對外開放中的地位與功能。

(2)經(jīng)濟(jì):互聯(lián)網(wǎng)經(jīng)濟(jì)高速發(fā)展,據(jù)艾瑞咨詢估計(jì),2015年中國網(wǎng)絡(luò)經(jīng)濟(jì)增長約33%,市場規(guī)模超過千億,并有持續(xù)增長趨勢。2014年開始,投資機(jī)構(gòu)在人工智能領(lǐng)域投資金額,數(shù)量均大幅度增加。據(jù)咨詢公司Venture Scanner統(tǒng)計(jì),2016年全球人工智能公司已突破1000家,融資高達(dá)48億美元。

(3) 人才:在中國科研投入占全球的20%,僅次于美國,信息技術(shù)互聯(lián)網(wǎng)領(lǐng)域是國家的重點(diǎn)投入對象,近五年,科研人員保持20%的持續(xù)增長,為人工智能的發(fā)展提供了充足的人才支撐。

(4)技術(shù):目前我國已在計(jì)算機(jī)視覺,智能語音等領(lǐng)域?qū)崿F(xiàn)了技術(shù)突破,處于國際領(lǐng)先水平。國內(nèi)具有代表性的公司或機(jī)構(gòu)包括:百度,阿里巴巴,騰訊,科大訊飛,曠視科技,商湯科技等。

在人工智能技術(shù)中,智能語音技術(shù)是一個(gè)重要的分支,是人機(jī)交互過程中不可或缺的部分。語音技術(shù)包含:語音識別、語音合成、聲紋識別、語音評測、語音轉(zhuǎn)換等,其中發(fā)音檢錯(cuò)糾錯(cuò)和語音轉(zhuǎn)換技術(shù)近期有了新的突破。

發(fā)音檢錯(cuò)糾錯(cuò)

英語是當(dāng)今世界上最為通用的語言,其重要性已為所有人深刻領(lǐng)會。由于英語的強(qiáng)勢地位,目前被超過100個(gè)國家作為外語教學(xué)的第一外語。據(jù)EF英孚教育發(fā)布的《2015年英語熟練度指標(biāo)報(bào)告》顯示,中國人每年花費(fèi)千億元用于英語培訓(xùn),但實(shí)際效果依然不佳,在全球70個(gè)國家和地區(qū)中,中國大陸排名47位。雖然英語水平仍處于低熟練程度,但近年來呈現(xiàn)明顯增長趨勢。據(jù)中國社會調(diào)查所公布的中國居民消費(fèi)調(diào)查報(bào)告統(tǒng)計(jì),中國已成為全球英語培訓(xùn)領(lǐng)域增長速度最快的市場,年增長率高達(dá)12%。在如此廣闊的英語培訓(xùn)市場下,線下英語培訓(xùn)面臨著師資數(shù)量短缺,教師口語水平參差不齊、“添鴨式”與“應(yīng)試式”教學(xué)以及無法有效改善口語聽力水平等存在諸多矛盾。

另外,中文拼音與英語音標(biāo)發(fā)音方法和位置有所區(qū)別,但許多中國學(xué)生在剛接觸英語時(shí)習(xí)慣用熟悉的中文拼音來標(biāo)注、記憶英語單詞的發(fā)音。久而久之,養(yǎng)成了不良的發(fā)音習(xí)慣,同時(shí)還由于中國學(xué)生普遍靦腆,上課口語訓(xùn)練時(shí)間不足,課后口語練習(xí)得不到反饋,以及大部分英語老師的發(fā)音不標(biāo)準(zhǔn)等因素造成了中國學(xué)生的發(fā)音不標(biāo)準(zhǔn)。由于發(fā)音一直是中國學(xué)生學(xué)習(xí)英語時(shí)一個(gè)難關(guān),有許多人愿意為了糾正發(fā)音,支付高昂的學(xué)費(fèi),請外教糾正自己的發(fā)音。隨著移動在線語言學(xué)習(xí)的興起,催生了AI語音評測,促進(jìn)了AI糾音技術(shù)的發(fā)展。

雖然目前市場上有許多在線的英語學(xué)習(xí)軟件,但大多數(shù)都只是簡單地播放音視頻學(xué)習(xí)資料,學(xué)生跟讀,系統(tǒng)播放錄音。只有為數(shù)不多的軟件,具備打分評測的功能,而評測的準(zhǔn)確性,一直為學(xué)生所詬病。因此,市場迫切需要能提供高可靠的打分評測技術(shù)。

圖1 目前市面相關(guān)產(chǎn)品

另外,除了提供高可靠的打分評測技術(shù),學(xué)生也迫切需要具體的發(fā)音診斷的反饋建議。因?yàn)閱渭兊拇蚍衷u測技術(shù),只能夠指出學(xué)生的發(fā)音不夠好,但學(xué)生并不理解自己的發(fā)音錯(cuò)誤在哪里,及應(yīng)該如何改進(jìn)發(fā)音。比如把讀錯(cuò)的單詞標(biāo)紅出來,需反復(fù)對比原聲才能分析出錯(cuò)誤的細(xì)節(jié),這在明顯讀錯(cuò)的情況下還好實(shí)現(xiàn),如:steak/steik/,讀錯(cuò)為/sti:k/。

但以下情況就非常困難了,特別是學(xué)習(xí)者不熟悉英語的拼讀發(fā)音規(guī)則,語法的條件下。

(1)如records/'rek??dz/,讀錯(cuò)為/'rek??ds/。

(2)如the apple /ei/,讀錯(cuò)為/e?/(the在輔音前發(fā)/e?/,元音前發(fā)/ei/)。

(3)長短音如book/b?k/,讀錯(cuò)為/bu?k/;Lily/'l?li:/,讀錯(cuò)為/'li:li:/。

如果學(xué)習(xí)者在反復(fù)練習(xí)過程中不能及時(shí)發(fā)現(xiàn)具體的錯(cuò)誤細(xì)節(jié),會降低學(xué)習(xí)效率和興趣,甚至反復(fù)錯(cuò)誤發(fā)音,產(chǎn)生錯(cuò)誤的肌肉記憶。這個(gè)問題,在學(xué)術(shù)研究上被稱為“錯(cuò)誤發(fā)音檢測及診斷”。為了解決這個(gè)問題,在過去的十多年中,世界上的許多頂級科研機(jī)構(gòu)都投入了大量的人力物力,其中最具影響力的包括香港中文大學(xué),清華大學(xué),臺灣大學(xué),美國麻省理工大學(xué),新加坡資訊通信研究院,微軟亞洲研究院,IBM等等。

圖2多任務(wù)學(xué)習(xí)的聲學(xué)音素模型

“錯(cuò)誤發(fā)音檢測及診斷”的難點(diǎn)在于它們不同于一般的語音識別技術(shù),對于訓(xùn)練模型和訓(xùn)練數(shù)據(jù)有著更嚴(yán)格的要求,并且不同母語的人群在學(xué)習(xí)英語的過程中易出現(xiàn)的錯(cuò)誤也不同。因此要收集大量以中文為母語的人群的英文錄音,并邀請專業(yè)人士對數(shù)據(jù)進(jìn)行了人工標(biāo)注。隨著深度學(xué)習(xí)的發(fā)展,和多年的技術(shù)積累,聲??萍祭罾げ┦康热藢?shí)現(xiàn)了此領(lǐng)域的重大突破,利用深度神經(jīng)網(wǎng)絡(luò)對聲學(xué)特征和標(biāo)準(zhǔn)發(fā)音進(jìn)行預(yù)測,輸出后驗(yàn)概率(如圖2所示)。不僅實(shí)現(xiàn)了對錯(cuò)誤發(fā)音的檢錯(cuò)和診斷,還能對重音,語調(diào),流利度等實(shí)現(xiàn)評測(如圖3所示)。

圖3 發(fā)音,重音,音調(diào)檢錯(cuò)糾錯(cuò)技術(shù)展示

語音評測技術(shù)的突破讓AI系統(tǒng)成為私人發(fā)音老師成為可能。當(dāng)系統(tǒng)知道學(xué)生具體的錯(cuò)誤后,就能自動匹配相應(yīng)的教學(xué)內(nèi)容和練習(xí)題目,實(shí)現(xiàn)更精準(zhǔn)的自適應(yīng)推薦。如果新技術(shù)能得到普及,那將大大改善中國學(xué)生的發(fā)音現(xiàn)狀,特別是解決農(nóng)村鄉(xiāng)鎮(zhèn)地區(qū)的教育資源和語言環(huán)境問題。

另外,隨著中國在國際上地位的提升,特別是一帶一路的推動,愈來愈多外國人開始學(xué)習(xí)漢語,資料顯示全球?qū)W習(xí)漢語的外國人已經(jīng)超過1億。而中文發(fā)音是中文學(xué)習(xí)中的重大難題,發(fā)音評測的新技術(shù)能針對外國中文學(xué)習(xí)者的發(fā)音錯(cuò)誤的特點(diǎn),利用可靠的發(fā)音自動評測方法及時(shí)、準(zhǔn)確地糾正發(fā)音錯(cuò)誤,可以大大提高中文輔助語音教學(xué)系統(tǒng)的教學(xué)效果。

語音轉(zhuǎn)換

隨著語音信號處理技術(shù)(包括語音識別和語音合成)的發(fā)展,在人機(jī)交互中語音已成為最自然最方便交互方式之一。語音不僅可以傳遞信息,也可以傳遞情感、態(tài)度和說話人的個(gè)人特征。其中,說話人的個(gè)人特征在我們?nèi)粘=涣髦邪缪葜匾巧试S我們在電話、廣播節(jié)目、電影等媒體中區(qū)分說話人。除此之外,智能語音助手變得越來越流行,比如 Apple Siri、Microsoft Cortana、Amazon Alexa。大多數(shù)人對語音助手的音色有很強(qiáng)的偏好,因此生成具有特別音色的語音在人機(jī)交互領(lǐng)域非常重要。

圖4 語音轉(zhuǎn)換示意圖

上述場景可歸結(jié)為語音轉(zhuǎn)換(VoiceConversion)問題,目標(biāo)在于修改非目標(biāo)說話人Non-target(NT)Speaker的語音音色,使其聽起來像是目標(biāo)說話人Target(T)Speaker的語音,但同時(shí)保持說話的內(nèi)容T- Content不變(如圖4所示)。

深度學(xué)習(xí)是人工智能領(lǐng)域劃時(shí)代的革命技術(shù),隨著深度學(xué)習(xí)的應(yīng)用,合成語音和轉(zhuǎn)換語音的自然度和流暢度都有很大的提升。在語音合成領(lǐng)域,Google Deepmind 在2016年提出的Wavenet模型將自然度提高了50%。2017年Yoshua Bengio等提出端對端合成模型,使得模型可以從文本直接生成語音而不需要前端預(yù)處理。在國內(nèi),康世胤等在2013年將深度信念網(wǎng)絡(luò)(Deep Belief Networks)用于語音合成,為學(xué)界業(yè)界最早之一。2017年,百度研究院提出Deep Voice模型改進(jìn)了語音合成速度,實(shí)驗(yàn)證明該模型可以用于實(shí)時(shí)語音合成。

語音轉(zhuǎn)換技術(shù)的最早嘗試在1988年由Abe等學(xué)者完成。在1988年到2013年期間,大部分算法基于Codebook Mapping、Frequency Warping、Unit Selection、Gaussian Mixture Models。2013年開始,深度學(xué)習(xí)被應(yīng)用到語音轉(zhuǎn)換中,Nakashika等將深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks)用于在高維空間中,將非目標(biāo)說話人語音映射到目標(biāo)說話人語音。雖然語音轉(zhuǎn)換技術(shù)較以前有很大提升,但是語音自然度和音色相似度方面仍有很大的改善空間,另外在實(shí)用適用性方面不夠完善比如只能支持特定人到特定目標(biāo)人的轉(zhuǎn)換(一轉(zhuǎn)一),以及需要嚴(yán)苛的數(shù)據(jù)條件,需要目標(biāo)人上千句的語音數(shù)據(jù)。

圖5 深度循環(huán)神經(jīng)網(wǎng)絡(luò)(DBLSTM-RNNs)示意圖

在2015年,聲希科技聯(lián)合創(chuàng)始人孫立發(fā)博士團(tuán)隊(duì)等利用深度循環(huán)神經(jīng)網(wǎng)絡(luò)(DBLSTM-RNNs)來改進(jìn)轉(zhuǎn)換語音的自然度和流暢度(如圖5所示),傳統(tǒng)的深度神經(jīng)網(wǎng)絡(luò)DNN只能映射單一幀到單一幀之間的關(guān)系忽略了語音連續(xù)信號幀之間的相關(guān)性,DBLSTM-RNNs很好的解決了這個(gè)問題從而可以提升自然度和流程度。

圖6 非平行語句多對一語音轉(zhuǎn)換框架圖

在2016年,孫立發(fā)博士等利用從語音識別模型提取到的后驗(yàn)概率來映射非目標(biāo)說話人和目標(biāo)說話人(如圖6所示),可以實(shí)現(xiàn)多對一的轉(zhuǎn)換并且降低了對訓(xùn)練數(shù)據(jù)的要求,大大提高了語音轉(zhuǎn)換技術(shù)的實(shí)用性。語音轉(zhuǎn)換具有廣泛的應(yīng)用:

(1)個(gè)性化語音合成。將語音轉(zhuǎn)換技術(shù)與現(xiàn)有的語音合成系統(tǒng)結(jié)合,生成用戶想要的音色。

(2)計(jì)算機(jī)輔助語言學(xué)習(xí)中的個(gè)性化語音反饋。目前語言學(xué)習(xí)者在學(xué)習(xí)的過程中參照的標(biāo)準(zhǔn)發(fā)音是統(tǒng)一的錄音,語音轉(zhuǎn)換系統(tǒng)可以合成出具有用戶自己音色的標(biāo)準(zhǔn)發(fā)音,幫助用戶進(jìn)行跟讀對比。

(3)機(jī)器翻譯。機(jī)器翻譯技術(shù)可以將一句語音從一種語言翻譯到另外一種語言,而語音轉(zhuǎn)換技術(shù)可以輔助機(jī)器翻譯,讓翻譯后的語音仍然保持說話人的音色。

(4)語言障礙患者的個(gè)性化輔助。語言障礙為中風(fēng)、帕金森等疾病的常見后遺癥。語言障礙會影響患者的日常交流和個(gè)性化和情感表達(dá)。語音轉(zhuǎn)換技術(shù)加上語音合成技術(shù)可以輔助患者進(jìn)行正常的語音溝通,并且找回自己聲音的音色。

(5)娛樂領(lǐng)域。潛在應(yīng)用包括電影電視配音,游戲配音,導(dǎo)航配音等。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50098

    瀏覽量

    265402
  • 智能語音
    +關(guān)注

    關(guān)注

    11

    文章

    826

    瀏覽量

    50271

原文標(biāo)題:智能語音前沿技術(shù)——發(fā)音檢錯(cuò)糾錯(cuò)和語音轉(zhuǎn)換

文章出處:【微信號:SRA2009,微信公眾號:深圳市機(jī)器人協(xié)會】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    ATH8809 智能語音處理芯片

    智能語音
    深圳市聲訊電子有限公司
    發(fā)布于 :2025年12月24日 16:58:05

    語音識別系統(tǒng)的技術(shù)核心:從聲音到文字的智能轉(zhuǎn)換

    ? ? ? 語音識別技術(shù),也稱為自動語音識別(ASR),其核心目標(biāo)是將人類語音信號轉(zhuǎn)換為對應(yīng)的文本或指令。隨著人工
    的頭像 發(fā)表于 09-05 14:04 ?846次閱讀

    Google Cloud展示一系列前沿技術(shù)更新

    在 2025 Google 谷歌開發(fā)者大會上,Google Cloud 展示了一系列前沿技術(shù)更新——不僅是模型升級,更是智能體、創(chuàng)意、行業(yè)應(yīng)用的全面進(jìn)化。這些前沿技術(shù),正為出海開發(fā)者提供強(qiáng)大的
    的頭像 發(fā)表于 08-29 09:38 ?1142次閱讀

    一顆TTS語音芯給產(chǎn)品增加智能語音播報(bào)能力

    一顆TTS語音芯片給產(chǎn)品增加智能語音播報(bào)能力 傳統(tǒng)語音播報(bào)芯片可以設(shè)置一些固定的語音片段或者內(nèi)容,但是對于現(xiàn)在各種創(chuàng)新產(chǎn)品層出不窮的時(shí)代,傳
    的頭像 發(fā)表于 08-14 16:33 ?734次閱讀

    一種抗輻射加固檢錯(cuò)糾錯(cuò)電路的設(shè)計(jì)

    電子發(fā)燒友網(wǎng)站提供《一種抗輻射加固檢錯(cuò)糾錯(cuò)電路的設(shè)計(jì).pdf》資料免費(fèi)下載
    發(fā)表于 08-11 15:38 ?0次下載

    智芯科超低功耗離線語音喚醒芯片的應(yīng)用場景

    想讓設(shè)備無需聯(lián)網(wǎng)也能秒速響應(yīng)語音指令?我們的超低功耗離線語音喚醒芯片正是答案!采用前沿技術(shù),待機(jī)能耗近乎“休眠”,續(xù)航焦慮一掃而空,智能穿戴、智能
    的頭像 發(fā)表于 07-08 10:24 ?1358次閱讀

    語音識別芯片選型有哪些技術(shù)參數(shù)要注意

    能參數(shù) 1. 識別準(zhǔn)確率 定義:芯片對語音指令的正確識別比例,通常以百分比表示(如 95% 以上)。 影響因素:環(huán)境噪聲、發(fā)音清晰度、方言適配性等。 應(yīng)用場景:智能家居、車載系統(tǒng)需≥95%,工業(yè)控制等高精度場景需≥98%。 2.
    的頭像 發(fā)表于 06-23 17:31 ?876次閱讀
    <b class='flag-5'>語音</b>識別芯片選型有哪些<b class='flag-5'>技術(shù)</b>參數(shù)要注意

    藍(lán)牙語音遙控器:智能家居的智慧控制核心

    和低功耗特性,成為理想選擇。 藍(lán)牙語音遙控器不僅是智能家居控制的樞紐,更是技術(shù)進(jìn)步的縮影。其便捷的操作、智能語音交互和低功耗設(shè)計(jì),為用戶
    發(fā)表于 06-01 20:24

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量

    在人工智能快速發(fā)展的今天,語音機(jī)器人逐漸成為人們生活和工作中的得力助手。明遠(yuǎn)智睿SSD2351開發(fā)板憑借強(qiáng)大性能與豐富功能,為語音機(jī)器人的發(fā)展注入新動力,成為該領(lǐng)域的變革力量。 SSD2351開發(fā)板
    發(fā)表于 05-28 11:36

    藍(lán)牙語音遙控器 低功耗芯片選型HS6621CxC/OM6621

    系列憑借高集成度和低功耗特性,成為理想選擇 藍(lán)牙語音遙控器不僅是智能家居控制的樞紐,更是技術(shù)進(jìn)步的縮影。其便捷的操作、智能語音交互和低
    發(fā)表于 05-22 15:23

    芯資訊|廣州唯創(chuàng)電子WTV系列語音芯片:以技術(shù)創(chuàng)新賦能智能語音交互

    在萬物互聯(lián)的智能化時(shí)代,語音交互技術(shù)已成為人機(jī)交互的重要橋梁。廣州唯創(chuàng)電子深耕語音芯片領(lǐng)域多年,憑借自主研發(fā)的WTV系列語音芯片,持續(xù)為
    的頭像 發(fā)表于 05-21 08:45 ?704次閱讀
    芯資訊|廣州唯創(chuàng)電子WTV系列<b class='flag-5'>語音</b>芯片:以<b class='flag-5'>技術(shù)</b>創(chuàng)新賦能<b class='flag-5'>智能</b><b class='flag-5'>語音</b>交互

    大模型時(shí)代的新燃料:大規(guī)模擬真多風(fēng)格語音合成數(shù)據(jù)集

    以大模型技術(shù)為核心驅(qū)動力的人工智能變革浪潮中,語音交互領(lǐng)域正迎來廣闊的成長空間,應(yīng)用場景持續(xù)拓寬與延伸。 其中,數(shù)據(jù)作為驅(qū)動語音大模型進(jìn)化的關(guān)鍵要素,重要性愈發(fā)凸顯。豐富多樣的高質(zhì)量數(shù)
    的頭像 發(fā)表于 04-30 16:17 ?678次閱讀

    智能收銀語音交互新標(biāo)桿—WT3000T8語音合成芯片TTS技術(shù)應(yīng)用解析

    一、行業(yè)應(yīng)用背景在零售業(yè)態(tài)智能化轉(zhuǎn)型的浪潮中,收銀設(shè)備正經(jīng)歷從功能型向服務(wù)型轉(zhuǎn)變的關(guān)鍵階段。WT3000T8語音合成芯片應(yīng)運(yùn)而生,專為滿足新零售場景下智能收銀終端的語音交互需求而設(shè)計(jì)。
    的頭像 發(fā)表于 04-24 08:45 ?1010次閱讀
    <b class='flag-5'>智能</b>收銀<b class='flag-5'>語音</b>交互新標(biāo)桿—WT3000T8<b class='flag-5'>語音</b>合成芯片TTS<b class='flag-5'>技術(shù)</b>應(yīng)用解析

    智能語音交互方案在客服領(lǐng)域的應(yīng)用

    著客服行業(yè)的面貌,為企業(yè)和用戶帶來了全新的體驗(yàn)。 語音識別模型優(yōu)化私部署 方案:精準(zhǔn)高效,定制專屬服務(wù) 語音識別技術(shù)作為智能語音交互的基礎(chǔ),
    的頭像 發(fā)表于 04-11 14:35 ?800次閱讀

    MediaTek在MWC 2025展示前沿技術(shù)

    MediaTek 在 MWC 2025 上展示了超多領(lǐng)域的前沿技術(shù),讓我們一起來回顧一下吧!
    的頭像 發(fā)表于 04-08 14:43 ?1054次閱讀