91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

劍橋語音博士俞凱解讀智能語音技術(shù)

思必馳 ? 來源:djl ? 作者:思必馳 ? 2019-08-05 16:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1 智能語音技術(shù)發(fā)展與siri

智能語音技術(shù)發(fā)展過程可以理解為兩個階段,第一是輸入和輸出階段,即識別與合成,第二是理解和思考階段,即語義理解、對話系統(tǒng)、人工智能反饋。并且每一個細(xì)分領(lǐng)域均為單獨研究,例如語音識別、自然語言處理、聲紋處理,語義解析等等。

siri 目前最大的優(yōu)勢在于語義單項理解的算法,在一個限定的領(lǐng)域下,siri表現(xiàn)確實很好,但在整個語音領(lǐng)域內(nèi),尤其不限定領(lǐng)域和語音識別不穩(wěn)定的情況下,顯得有些后勁不足,這也與目前技術(shù)有關(guān)。而思必馳與siri不同的地方在與交互的理論,目前思必馳以任務(wù)型對話為目標(biāo),并專注于此。

2 一體化綜合解決技術(shù)增強用戶體驗

目前的智能語音基本是單獨模塊定義單獨的功能,例如語義理解、語音識別模塊,彼此之間沒有控制與調(diào)度,這也是造成目前語音延遲現(xiàn)象的部分原因,而造成延遲另外的原因是語音的處理、理解、交互系統(tǒng)設(shè)計方式。

用戶最希望的是智能語音界面能像人與人的交流一樣,語音能夠迅速反饋。但目前,雖然單獨語音識別很多單位都能做的很快,但組裝成交互系統(tǒng)之后就大都無法做到這一點了。目前思必馳推出的一體化解決方案,針對利于用戶體驗方面進(jìn)行優(yōu)化,達(dá)到端到端的用戶體驗,優(yōu)化整個控制流程,在識別的基礎(chǔ)上同時進(jìn)行輸出,達(dá)到一個快速智能反饋的效果。我們是面向終端用戶體驗去做語音交互優(yōu)化,而不僅僅提供一個模塊而已。

3 人性化交互的智能語音方向

未來的智能語音交互發(fā)展方向一定是混合發(fā)展模式,將以用戶為中心,綜合應(yīng)用全面的語音技術(shù),而不僅僅是單純的語音識別。第一,智能語音技術(shù)會與環(huán)境、語境自適應(yīng)的結(jié)合;第二,語音的發(fā)展在自然場景下應(yīng)用會越來越多,例如在高噪聲環(huán)境中的處理是未來的一個方向;第三,結(jié)合上下文的語義理解以及端到端的語音交互解決。目前單獨的識別以不能解決所有問題與滿足用戶需求,將識別、理解、對話的交互控制等融合,提供整套的解決方案才是最終的方向。

人工智能層面的語音技術(shù)中,單純的識別率是以科研指標(biāo)為中心,而人工智能角度與工程科研指標(biāo)在某些方面截然不同。而我們一直以用戶為中心,面向指標(biāo)是令人工智能語音真正人性化,在多類環(huán)境下準(zhǔn)確識別并反饋,以個性化色彩進(jìn)行交流。語音交互的未來應(yīng)當(dāng)是面向用戶,人性化的智能交互,而非過去模塊化的交互。

俞凱博士背景:擁有劍橋大學(xué)語音識別專業(yè)的學(xué)術(shù)背景,也是國內(nèi)學(xué)術(shù)界“青年***”里唯一一位來自智能語音技術(shù)行業(yè)領(lǐng)域的語音專家,曾多次獲得美國國家標(biāo)準(zhǔn)局和美國國防部語音識別評測冠軍,是國際最早的認(rèn)知型人機口語對話系統(tǒng)原型的主要實現(xiàn)者,在上海交通大學(xué)創(chuàng)建了智能語音實驗室。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50105

    瀏覽量

    265556
  • 智能語音
    +關(guān)注

    關(guān)注

    11

    文章

    826

    瀏覽量

    50279
  • 思必馳
    +關(guān)注

    關(guān)注

    4

    文章

    397

    瀏覽量

    15992
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    語音識別IC分類,語音識別芯片的工作原理

    語音識別芯片,也叫語音識別集成電路,是一種集聲音存儲、播放、錄音及語音識別功能于一體的專用芯片。語音識別IC的核心功能在于實現(xiàn)語音識別,即讓
    的頭像 發(fā)表于 01-14 15:22 ?252次閱讀
    <b class='flag-5'>語音</b>識別IC分類,<b class='flag-5'>語音</b>識別芯片的工作原理

    ATH8809 智能語音處理芯片

    智能語音
    深圳市聲訊電子有限公司
    發(fā)布于 :2025年12月24日 16:58:05

    語音識別芯片有哪些(語音識別芯片AT680系列)

    在人工智能技術(shù)飛速發(fā)展的今天,語音識別芯片作為人機交互的重要橋梁,正逐漸成為各類智能設(shè)備不可或缺的核心部件。與傳統(tǒng)的語音芯片不同,語音識別芯
    的頭像 發(fā)表于 11-14 17:11 ?1390次閱讀

    廣州唯創(chuàng)電子常用語音芯片全解析:賦能智能語音交互的多場景應(yīng)用

    語音芯片作為智能設(shè)備實現(xiàn)語音交互的核心部件,已廣泛應(yīng)用于家居、車載、醫(yī)療、工業(yè)等領(lǐng)域。廣州唯創(chuàng)電子憑借多年的技術(shù)積累,推出多系列功能各異的語音
    的頭像 發(fā)表于 08-28 08:41 ?849次閱讀
    廣州唯創(chuàng)電子常用<b class='flag-5'>語音</b>芯片全解析:賦能<b class='flag-5'>智能</b><b class='flag-5'>語音</b>交互的多場景應(yīng)用

    思必馳榮獲國際語音通訊協(xié)會會士

    2025年8月18日,由ISCA(國際語音通訊聯(lián)盟)主辦的國際語音領(lǐng)域頂級會議InterSpeech 2025大會在荷蘭鹿特丹舉行。ISCA是國際上最大的智能語音
    的頭像 發(fā)表于 08-26 09:47 ?1030次閱讀

    智能語音交互升級,九芯語音識別芯片來助力

    在科技飛速發(fā)展的當(dāng)下,智能語音交互已經(jīng)深度融入我們的生活,從智能家居的便捷操控,到車載電子的安全駕駛輔助,再到智能玩具的趣味互動,語音識別
    的頭像 發(fā)表于 08-11 14:08 ?974次閱讀
    <b class='flag-5'>智能</b><b class='flag-5'>語音</b>交互升級,九芯<b class='flag-5'>語音</b>識別芯片來助力

    普強智能語音技術(shù)重新定義車載交互邊界

    普強憑借自主研發(fā)的智能語音技術(shù),為某國內(nèi)頭部車企提供的語音前處理、喚醒詞、ASR、TTS等技術(shù)模塊,構(gòu)建覆蓋泰語、俄語、韓語、日語等多語種的
    的頭像 發(fā)表于 07-11 14:00 ?1180次閱讀

    智能語音交互別再瞎選語音芯片了!NRK3502 才是你的最優(yōu)解!

    在科技飛速發(fā)展的當(dāng)下,智能產(chǎn)品如潮水般涌入我們的生活,從智能家居到智能醫(yī)療,從智能玩具到工業(yè)控制,語音交互
    的頭像 發(fā)表于 07-10 07:03 ?660次閱讀
    <b class='flag-5'>智能</b><b class='flag-5'>語音</b>交互別再瞎選<b class='flag-5'>語音</b>芯片了!NRK3502 才是你的最優(yōu)解!

    藍(lán)牙語音遙控器:智能家居的智慧控制核心

    和低功耗特性,成為理想選擇。 藍(lán)牙語音遙控器不僅是智能家居控制的樞紐,更是技術(shù)進(jìn)步的縮影。其便捷的操作、智能語音交互和低功耗設(shè)計,為用戶
    發(fā)表于 06-01 20:24

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機器人領(lǐng)域的變革力量

    在人工智能快速發(fā)展的今天,語音機器人逐漸成為人們生活和工作中的得力助手。明遠(yuǎn)智睿SSD2351開發(fā)板憑借強大性能與豐富功能,為語音機器人的發(fā)展注入新動力,成為該領(lǐng)域的變革力量。 SSD2351開發(fā)板
    發(fā)表于 05-28 11:36

    芯資訊|廣州唯創(chuàng)電子WTV系列語音芯片:以技術(shù)創(chuàng)新賦能智能語音交互

    在萬物互聯(lián)的智能化時代,語音交互技術(shù)已成為人機交互的重要橋梁。廣州唯創(chuàng)電子深耕語音芯片領(lǐng)域多年,憑借自主研發(fā)的WTV系列語音芯片,持續(xù)為
    的頭像 發(fā)表于 05-21 08:45 ?716次閱讀
    芯資訊|廣州唯創(chuàng)電子WTV系列<b class='flag-5'>語音</b>芯片:以<b class='flag-5'>技術(shù)</b>創(chuàng)新賦能<b class='flag-5'>智能</b><b class='flag-5'>語音</b>交互

    藍(lán)牙語音遙控國產(chǎn)適用芯片HS6621

    智能家居的時代,科技正在改變我們的生活方式。藍(lán)牙語音遙控器,作為智能家居的關(guān)鍵組成部分,正在重新定義用戶與設(shè)備之間的互動方式。用戶對著藍(lán)牙語音遙控器,只要輕說一句話就可以搞定很多復(fù)雜
    發(fā)表于 04-30 16:21

    智能收銀語音交互新標(biāo)桿—WT3000T8語音合成芯片TTS技術(shù)應(yīng)用解析

    一、行業(yè)應(yīng)用背景在零售業(yè)態(tài)智能化轉(zhuǎn)型的浪潮中,收銀設(shè)備正經(jīng)歷從功能型向服務(wù)型轉(zhuǎn)變的關(guān)鍵階段。WT3000T8語音合成芯片應(yīng)運而生,專為滿足新零售場景下智能收銀終端的語音交互需求而設(shè)計。
    的頭像 發(fā)表于 04-24 08:45 ?1027次閱讀
    <b class='flag-5'>智能</b>收銀<b class='flag-5'>語音</b>交互新標(biāo)桿—WT3000T8<b class='flag-5'>語音</b>合成芯片TTS<b class='flag-5'>技術(shù)</b>應(yīng)用解析

    智能語音交互方案在客服領(lǐng)域的應(yīng)用

    著客服行業(yè)的面貌,為企業(yè)和用戶帶來了全新的體驗。 語音識別模型優(yōu)化私部署 方案:精準(zhǔn)高效,定制專屬服務(wù) 語音識別技術(shù)作為智能語音交互的基礎(chǔ),
    的頭像 發(fā)表于 04-11 14:35 ?814次閱讀