91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

研究自然語音交互系統(tǒng)帶來人機對話新體驗

bNZh_Ali ? 來源:AliOS ? 作者:AliOS ? 2021-05-19 14:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

不難發(fā)現(xiàn),現(xiàn)在「車載語音交互」的體驗越來越完善。它不僅能完成更多的指令,而且能和我們進行情感交互,甚至還懂得一些基本的倫理綱常。AI語音交互,同樣正在占據(jù)我們生活應用中的每一個入口,現(xiàn)在,被視作“第三空間”的汽車場景,通過自然連續(xù)對話完成人車之間的主動交互,正在成為現(xiàn)實。

回顧發(fā)展之初,車載語音雖然能完整跑通 ASR、TTS 這些流程,能實現(xiàn)一些簡單的 NLU/NLP 能力,但體驗有很多漏洞,比如有可能識別失敗,指令完成緩慢,交互邏輯不合常理等等。如今來看,這些基礎能力正變得更強,基本可以稱得上是一個「有價值的工具」。

另一方面,語音交互作為智能網(wǎng)聯(lián)汽車的“靈魂”,一直是車聯(lián)網(wǎng)公司和主機廠發(fā)力的重點領域。目前市面上常見的車載系統(tǒng)每次交互都得說出喚醒詞,無法做到自然連續(xù)對話。相比市場同類車載系統(tǒng),基于AliOS底層技術開發(fā)的斑馬智行VENUS系統(tǒng),在AI語音功能智能化程度上有了更高突破,不僅具備人類親和力的特質和邏輯思維能力,同時,整個對話體驗更加自然流暢,能帶給用戶更具情景化、更有溫度的用車體驗。

實際上,新斑馬語音產品在快、準、自然的交互體驗基礎上,開創(chuàng)了全雙工、全場景、全閉環(huán)的交互特色,并第一次在車內實現(xiàn)了個性化聲音克隆的技術。

語音基礎能力方面,新斑馬語音背靠阿里巴巴達摩院,提供ECNR、VW、ASR、TTS等全鏈路語音基礎能力,并且在汽車語義上投入重兵與達摩院合作共建,保障在核心能力上的領先性和特色。

語音交互特性方面,重點演進了全雙工交互能力,并且開發(fā)了可見即可說、全時喚醒、靈動喚醒詞、多TTS引擎、雙模態(tài)交互、個性化聲音克隆等交互特色。其中聲音克隆技術可以將用戶的聲音復制到車內,提供更加個性化的趣味體驗。

同時,在與車場景結合方面,斑馬語音擁有全場景、全閉環(huán)的交互體驗。在地圖導航、多媒體、通訊、車控車設四大場景上進行了深度挖掘,與語音進行深度結合,實現(xiàn)動口不動手的語音交互體驗。同時為支付寶車載小程序開放平臺提供語音開放能力,讓接入汽車的支付寶車載小程序都可以使用語音進行交互。

自然語音交互系統(tǒng)- 全雙工交互技術

一次喚醒多次輸入

更高效更接近人類交互習慣

基于場景的上下文預測

邊說邊聽,邊聽邊想

全雙工交互具有一次喚醒多次輸入、邊說邊聽邊聽邊想、基于場景進行上下文預測等能力。相比傳統(tǒng)語音交互方式,全雙工更接近人類習慣,是語音交互到自然交互的必備階段。

實現(xiàn)全雙工語音交互,面臨著多項技術挑戰(zhàn):如何在機器說話的同時清楚地接收用戶說話的信號?如何保證持續(xù)不斷地接收用戶完整的信息表達?如何在保證準確理解的前提下控制誤觸發(fā)?這些問題在汽車環(huán)境中會被不斷放大,阻礙技術的落地應用。

斑馬依托達摩院降噪、回聲消除、流式ASR、流式NLU、專項NLU拒識模型等前沿技術,在大規(guī)模實車數(shù)據(jù)的訓練下,實現(xiàn)了真正的全雙工交互技術在車內的大規(guī)模使用。

自然語音交互系統(tǒng)- 聲音克隆技術

基于深度神經網(wǎng)絡

快速生成TTS聲音模擬

個性化自然交互體驗

讓最熟悉的聲音一路相伴

聲音克隆技術只需要提取用戶5-10分鐘的聲音片段,就可以提取出他的聲音特征,進而訓練出和他的聲音相似的TTS聲音。傳統(tǒng)的TTS技術需要獲得幾十小時的數(shù)據(jù)才能夠進行TTS的發(fā)音人訓練。而基于深度神經網(wǎng)絡,斑馬聲音克隆系統(tǒng)在5-10分鐘的聲音片段中,就可以通過聲音特征提取訓練、聲音合成器訓練和聲碼器訓練完成TTS聲音的模擬。

聲音克隆技術在車內可以為你帶來更加個性化的自然交互體驗,你可以把車內的聲音設置成自己的愛人、子女、父母等親人的聲音,為自己的行車生活增添更多的溫暖。

有了聲音及語意上的天然優(yōu)勢,再加之AI大數(shù)據(jù)的后端支持,斑馬智行VENUS實現(xiàn)了“智商情商雙進步,聊啥都懂”的突出能力。具體來看,斑馬智行VENUS AI語音技能將覆蓋500多個常用知識領域,無論是查天氣、查股票,還是幽默段子,都能“隨問隨答”。

隨著5G、物聯(lián)網(wǎng)自動駕駛等技術的成熟,車載語音助手必然會替代我們現(xiàn)有的人車交互方式,一款好的車機語音對汽車而言,顯得尤為重要。在近日對外透露的斑馬5計劃中,「對話式導航」將成為下一項語音交互黑科技。不久的將來,影視劇中如霹靂游俠那般的人車對話也終將會實現(xiàn)。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 物聯(lián)網(wǎng)

    關注

    2945

    文章

    47826

    瀏覽量

    415261
  • ASR
    ASR
    +關注

    關注

    2

    文章

    44

    瀏覽量

    19428
  • 5G
    5G
    +關注

    關注

    1367

    文章

    49160

    瀏覽量

    617830
  • 自動駕駛
    +關注

    關注

    793

    文章

    14887

    瀏覽量

    179992

原文標題:自然語音交互系統(tǒng) 帶來人機對話新體驗

文章出處:【微信號:AliOS,微信公眾號:AliOS】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    潤芯微科技賦能新款嵐圖夢想家鯤鵬版駕乘新體驗

    新款嵐圖夢想家鯤鵬版上市以來,由潤芯微科技聯(lián)合打造的玲瓏智慧屏,為用戶帶來“更溫暖、更有趣、更智能”的駕乘新體驗
    的頭像 發(fā)表于 02-25 15:00 ?382次閱讀

    聲控感應 + 光控燈管,郎特科技帶來怎樣的照明新體驗?

    聲控感應+光控燈管,郎特科技帶來怎樣的照明新體驗?在照明領域不斷追求創(chuàng)新與智能化的今天,郎特科技推出的聲控感應+光控燈管,將兩種實用的感應技術融合,為用戶帶來了別具一格的照明新體驗。這
    的頭像 發(fā)表于 02-12 14:34 ?146次閱讀
    聲控感應 + 光控燈管,郎特科技<b class='flag-5'>帶來</b>怎樣的照明<b class='flag-5'>新體驗</b>?

    AI機器人方案_ai人機對話機器人PCBA硬件定制開發(fā)

    隨著人工智能技術的不斷進步,人機交互的方式正變得更加自然與高效。一款基于聯(lián)發(fā)科MTK八核處理器的AI對話機器人方案脫穎而出,憑借其強大的性能、多樣化顯示方案和卓越的語音
    的頭像 發(fā)表于 12-24 20:19 ?1438次閱讀
    AI機器人方案_ai<b class='flag-5'>人機對話</b>機器人PCBA硬件定制開發(fā)

    【啟揚方案】基于啟揚RK3588的移動AI數(shù)字人,助力智能交互新體驗

    在數(shù)字化浪潮席卷的今天,人機交互的邊界不斷被打破。移動AI數(shù)字人通過深度融合的人工智能、高擬真圖像渲染以及人機交互能力,重塑人機交互新形態(tài)。圖片來源于網(wǎng)絡移動AI數(shù)字人的主控需求1.集成高性能
    的頭像 發(fā)表于 10-16 17:29 ?1264次閱讀
    【啟揚方案】基于啟揚RK3588的移動AI數(shù)字人,助力智能<b class='flag-5'>交互</b><b class='flag-5'>新體驗</b>

    思必馳攜手海爾統(tǒng)帥小音浪F7打造智慧生活新體驗

    近日,海爾集團面向年輕群體的時尚家電品牌統(tǒng)帥(Leader),推出了新一代智能唱聊熱水器一統(tǒng)帥小音浪F7,憑借卓越的控溫性能與前沿的智能交互技術,贏得了眾多用戶的關注。思必馳為其提供智能語音交互技術支持,共同打造充滿科技感與便捷
    的頭像 發(fā)表于 09-18 14:08 ?936次閱讀

    “芯”聲代,智未來—VS680本地語音交互系統(tǒng) #語音交互 #芯片

    語音交互
    深蕾半導體
    發(fā)布于 :2025年09月17日 10:59:30

    語音機器人交互系統(tǒng):核心技術與應用挑戰(zhàn)

    ? ? ? 語音機器人交互系統(tǒng)是融合多學科技術的復雜工程,其核心目標是實現(xiàn)人與機器間的自然、流暢語音對話
    的頭像 發(fā)表于 09-02 11:08 ?838次閱讀

    人機交互:連接人類與數(shù)字世界的橋梁

    人機交互(Human-Computer Interaction, HCI)是研究人與計算機系統(tǒng)之間信息交流方式的學科,旨在優(yōu)化用戶體驗,提高交互效率。隨著人工智能、虛擬現(xiàn)實(VR)和物
    的頭像 發(fā)表于 08-11 15:21 ?2084次閱讀

    廣州唯創(chuàng)電子WTN6/WTV系列語音芯片:賦能凈水機智能升級新體驗

    新體驗。一、智能語音交互:重塑凈水機人機交互體驗唯創(chuàng)電子語音芯片通過深度集成,為凈水機帶來三大核
    的頭像 發(fā)表于 07-24 08:35 ?678次閱讀
    廣州唯創(chuàng)電子WTN6/WTV系列<b class='flag-5'>語音</b>芯片:賦能凈水機智能升級<b class='flag-5'>新體驗</b>

    藍牙語音遙控器:智能家居的智慧控制核心

    和低功耗特性,成為理想選擇。 藍牙語音遙控器不僅是智能家居控制的樞紐,更是技術進步的縮影。其便捷的操作、智能的語音交互和低功耗設計,為用戶帶來了智慧生活的全
    發(fā)表于 06-01 20:24

    明遠智睿SSD2351開發(fā)板:語音機器人領域的變革力量

    通過網(wǎng)絡連接云端服務器進行快速檢索和分析,然后利用語音合成技術將答案以自然流暢的語音反饋給用戶。同時,借助開發(fā)板的網(wǎng)絡連接功能,語音機器人還可以與后臺管理
    發(fā)表于 05-28 11:36

    藍牙語音遙控器 低功耗芯片選型HS6621CxC/OM6621

    系列憑借高集成度和低功耗特性,成為理想選擇 藍牙語音遙控器不僅是智能家居控制的樞紐,更是技術進步的縮影。其便捷的操作、智能的語音交互和低功耗設計,為用戶帶來了智慧生活的全
    發(fā)表于 05-22 15:23

    具身智能工業(yè)機器人人機交互設計:重新定義人機協(xié)作新體驗

    在工業(yè) 4.0 時代,機器人不再是冰冷的機械臂,而是成為與人類協(xié)同創(chuàng)造價值的 “智能伙伴”。富唯智能憑借具身智能工業(yè)機器人人機交互設計,突破傳統(tǒng)操作界面的局限,通過自然語言、手勢識別、力控反饋等多模態(tài)交互技術,構建了安全、高效、
    的頭像 發(fā)表于 04-07 15:02 ?1233次閱讀

    零知開源——ESP32語音交互系統(tǒng)(AI小智)開發(fā)教程

    小智AI聊天機器人是一個基于嵌入式硬件與人工智能技術深度融合的智能交互系統(tǒng)。該項目以ESP32開發(fā)板為核心,結合語音喚醒、自然語言處理、音頻解碼播放及圖形化
    的頭像 發(fā)表于 03-29 15:33 ?1.2w次閱讀
    零知開源——ESP32<b class='flag-5'>語音</b><b class='flag-5'>交互</b><b class='flag-5'>系統(tǒng)</b>(AI小智)開發(fā)教程

    酒店智能門鎖解決方案:打造安全高效的智慧住宿新體驗

    酒店智能門鎖解決方案:打造安全高效的智慧住宿新體驗
    的頭像 發(fā)表于 03-13 14:23 ?1642次閱讀
    酒店智能門鎖解決方案:打造安全高效的智慧住宿<b class='flag-5'>新體驗</b>