91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

揭秘語音交互:個性化AI打造“數字化的你”

章鷹觀察 ? 來源:高通 ? 作者:侯紀磊博士 ? 2018-07-18 15:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從更精美的照片、更高的安全性到更自然的用戶界面(UI),人工智能AI)正以無縫的方式更多地豐富我們的生活。高能效和個性化是Qualcomm AI Research的核心研究領域,因為它們對于下一代無處不在的智能用戶體驗而言不可或缺。終端側AI正在支持虛擬助理的發(fā)展,而個性化正成為今天的虛擬助理和未來真正個人助理之間的主要差異。

AI驅動語音交互革命

語音是我們一直期盼的變革性交互方式,它可以提供用戶與終端間的自然交互,而無需任何手部操作。先進的語音交互具有始終開啟、對話式、個性化和私密的特征,可支持我們進行高效且自然的對話。從智能手機智能音箱到擴展現實(XR)設備和汽車,語音交互正在眾多產品種類中日益發(fā)展和普及。

要實現端到端的語音交互體驗,其中需要多個組件的支持(見圖1)。語音交互的流程是這樣的:首先麥克風采集語音信號,然后是語音預處理、語音激活、語音識別和自然語言理解,最終是終端通過語音合成的方式響應用戶。由此可見,端到端的語音交互是個多步驟的復雜流程。

圖1:語音交互的功能組件。

為什么今天語音交互變得如此普及?一個重要因素是,機器學習已經點燃了語音交互的革命。機器語音識別的準確率正不斷逼近95%,達到與人類準確率相當的水平。當機器準確率不能達到人類的水平,整個語音交互過程就沒法做到對話式的自然高效交流,因此用戶體驗會有顯著下降。機器學習技術可應用于幾乎所有的語音交互組件之上,從而提升各方面及整體的交互體驗。

終端側的語音交互至關重要

因計算、內存和功率的限制,主要語音交互組件(如自動語音識別和自然語言處理)傳統(tǒng)上都由云端AI所支持。但是,終端側處理具有眾多獨特的優(yōu)勢,包括更快的響應速度、更高的可靠性和更好的隱私保護。尤其是在私密性方面,今天的消費者渴望把數據掌握在自己手中,并且有權選擇是否將數據發(fā)到云端進行處理或存儲。因此,更多在終端上進行處理并為云端功能提供補充,這是目前行業(yè)的重要趨勢之一。而其中的主要挑戰(zhàn)在于,需要在移動終端的功耗和散熱限制下運行并實現復雜的語音交互功能。

圖2:語音交互的主要組件正向終端側遷移。

Qualcomm正積極應對這項挑戰(zhàn),并把低功耗的終端側AI應用于語音交互組件之上。以下是幾個例子:

1、語音降噪將帶噪語音處理成清晰語音并輸出,這在嘈雜環(huán)境中尤其重要。Qualcomm AI Research正在開發(fā)一個降噪深度學習模型,該模型與傳統(tǒng)方法相比有顯著的性能提升,并具有較高效率可在助聽器這樣非常受限的處理能力、功耗和散熱條件下運行。

2、 自動語音識別將語音轉錄為文本。測試表明,深度學習技術可在移動終端上實現頂級的語音識別準確率。Qualcomm AI Research已經完成了一個深度學習聲學模型的訓練并使其適應每個用戶的口音和環(huán)境,從而提高個性化程度。

今天,終端側的語音交互已經成為現實。Qualcomm AI Research已經可以在終端側實現整體的端到端語音交互處理,并在2018年的CES大會上演示了智能家居中的端到端語音交互體驗。在適應口音和環(huán)境后,這項演示對特定領域的指令集已經可以實現超過95%的意圖理解準確率。

個性化成就真正的虛擬助理

真正的虛擬助理是在終端里面有一個“數字化的我”。因此,它需要分析個人信息并不斷學習用戶偏好,從而成為真正了解用戶的數字助理。情境式智能是實現個性化的必備條件,而實現情景式智能需要融合多種終端側傳感器的數據(如麥克風、攝像頭和陀螺儀)及其他終端側和終端外數據(見圖3)。

圖3:情境式智能融合多種傳感器和個人信息。

增強個性化的一大好處在于,它能夠推動個人助理進一步發(fā)展并兼具響應性和主動性。真正的個人助理不僅能夠在用戶提問時提供個性化的答案,還能基于情境分析進行自主決策和無提示對話。

為進一步提升虛擬助理的個性化程度,Qualcomm AI Research正對終端側的“AI agent”展開研究,它有望從所有傳感器數據中不斷學習個人信息,最終實現直觀行動。AI agent的關鍵功能包括情境式融合及學習,這最終將支持個性化響應并豐富我們的生活。初步研究結果已展現出終端側個性化的遠大前景。個性化不僅將提升虛擬個人助理的用戶體驗,而且將豐富我們生活的方方面面。這項技術將變革眾多行業(yè),不斷推動行業(yè)創(chuàng)新。

(本文內容來自Qualcomm高級總監(jiān)兼AI研究項目負責人侯紀磊博士的署名博客)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 傳感器
    +關注

    關注

    2576

    文章

    55014

    瀏覽量

    791191
  • AI
    AI
    +關注

    關注

    91

    文章

    39707

    瀏覽量

    301314
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136919
  • 語音交互
    +關注

    關注

    3

    文章

    350

    瀏覽量

    29168
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    數字化的基礎是什么

    數字化的基礎是多個關鍵要素的有機結合,這些要素共同構成了數字化技術、應用和生態(tài)的底層支撐。其核心基礎可歸納為以下五個層面: 1. 數據:數字化的核心資產 數據采集與生成 :通過傳感器、物聯網設備
    的頭像 發(fā)表于 02-04 17:53 ?1104次閱讀

    構筑企業(yè)數字化中心,助力企業(yè)數字化轉型

    ?企業(yè)數字化轉型已是大勢所趨 ?在數聚股份看來,現在應該沒有人再懷疑企業(yè)數字化轉型的必要性,企業(yè)數字化轉型已經成為關系到企業(yè)生死存亡的課題。不轉型,
    的頭像 發(fā)表于 01-29 20:49 ?839次閱讀
    構筑企業(yè)<b class='flag-5'>數字化</b>中心,助力企業(yè)<b class='flag-5'>數字化</b>轉型

    【內測活動同步開啟】這么???這么強?新一代大模型MCP開發(fā)板來啦!

    噪,無懼嘈雜環(huán)境 云端接入小聆AI,輕松實現個性化定制 搭載領先大模型全鏈路技術:小聆AI 智能語音交互方案 集成情緒感知與表達 :支持情感
    發(fā)表于 09-25 11:47

    利用小紅書電商 API 接口,實現小紅書店鋪商品推薦個性化

    據、商品信息和交互行為。通過合理利用這些接口,店鋪可以實現高度個性化的商品推薦系統(tǒng),從而精準匹配用戶需求。本文將逐步介紹如何基于小紅書電商 API 實現這一目標,涵蓋技術原理、實現步驟和實際應用,確保內容真實可靠。 1. 理解小紅書電商 API 接口
    的頭像 發(fā)表于 08-27 15:31 ?1048次閱讀
    利用小紅書電商 API 接口,實現小紅書店鋪商品推薦<b class='flag-5'>個性化</b>

    唯創(chuàng)四大語音芯片方案,賦能電動車儀表智能語音播報、個性化音效定制、藍牙音頻連接等多模態(tài)交互,滿足

    電動車準備上班,剛剛啟動時儀表只是冷冰冰地顯示著電量和時速數字。沒有任何聲音提醒,沒有任何個性化體驗,只會機械地工作著。當電量不足時,可能因為沒注意到而半路拋錨
    的頭像 發(fā)表于 08-22 11:54 ?816次閱讀
    唯創(chuàng)四大<b class='flag-5'>語音</b>芯片方案,賦能電動車儀表智能<b class='flag-5'>語音</b>播報、<b class='flag-5'>個性化</b>音效定制、藍牙音頻連接等多模態(tài)<b class='flag-5'>交互</b>,滿足

    企業(yè)如何用SD-WAN節(jié)省50%網絡成本?揭秘數字化轉型的網絡新基建

    #企業(yè)如何用SD-WAN節(jié)省50%網絡成本?揭秘數字化轉型的網絡新基建>一條軟件定義的網絡高速公路,正在為成千上萬企業(yè)開辟數字化轉型的快車道,同時將網絡運營成本攔腰斬斷。在數字化轉型浪
    的頭像 發(fā)表于 08-13 10:32 ?1684次閱讀
    企業(yè)如何用SD-WAN節(jié)省50%網絡成本?<b class='flag-5'>揭秘</b><b class='flag-5'>數字化</b>轉型的網絡新基建

    復雜裝備研發(fā)設計中利用數據實現大規(guī)模個性化定制

    在復雜裝備研發(fā)設計中,利用數據實現大規(guī)模個性化定制已成為提升企業(yè)競爭力、滿足多樣市場需求的關鍵路徑。其核心在于通過數據驅動的個性化需求識別、模塊設計、柔性生產、智能決策及閉環(huán)反饋,
    的頭像 發(fā)表于 08-06 17:17 ?706次閱讀

    利用API提升電商用戶體驗:個性化推薦系統(tǒng)

    ? 在當今競爭激烈的電商環(huán)境中,個性化推薦系統(tǒng)已成為提升用戶粘性和轉化率的核心工具。通過API(Application Programming Interface)集成,電商平臺能夠高效接入先進
    的頭像 發(fā)表于 07-14 14:45 ?580次閱讀
    利用API提升電商用戶體驗:<b class='flag-5'>個性化</b>推薦系統(tǒng)

    2025年電商API發(fā)展趨勢:智能個性化

    ? 引言 隨著數字經濟的深化,電商API(應用程序接口)已成為連接平臺、商家與用戶的核心樞紐。2025年,在人工智能與大數據驅動下,電商API將加速向 智能決策 與 個性化服務 演進,重構用戶
    的頭像 發(fā)表于 07-11 14:26 ?607次閱讀
    2025年電商API發(fā)展趨勢:智能<b class='flag-5'>化</b>與<b class='flag-5'>個性化</b>

    聲紋解鎖個性化!啟明云端硅思物語AI平臺讓設備“認準的聲音”

    啟明云端依托旗下硅思物語AI平臺,通過聲紋采集技術,在ESP32-S3潮玩手辦伴侶上構建的個性化智能助手的真實落地應用場景。聲紋采集:的聲音就是“生物密碼”什么是聲紋?聲紋如同指
    的頭像 發(fā)表于 06-17 18:02 ?1493次閱讀
    聲紋解鎖<b class='flag-5'>個性化</b>!啟明云端硅思物語<b class='flag-5'>AI</b>平臺讓設備“認準<b class='flag-5'>你</b>的聲音”

    EM儲能網關 ZWS智慧儲能云應用(13) — 企業(yè)個性化配置

    儲能公有云平臺,企業(yè)用戶如何自主個性化配置?ZWS智慧儲能云通過靈活的多級配置功能,實現個性化系統(tǒng)配置,幫助強化儲能企業(yè)獨特性。簡介儲能企業(yè)在使用智慧儲能云平臺時,常面臨企業(yè)個性化和品牌展示
    的頭像 發(fā)表于 05-23 11:39 ?781次閱讀
    EM儲能網關 ZWS智慧儲能云應用(13) — 企業(yè)<b class='flag-5'>個性化</b>配置

    個性化醫(yī)療的挑戰(zhàn),微流液體監(jiān)測

    現代醫(yī)學已能夠極大改善全球人口的生活質量。脊髓灰質炎、梅毒、肺結核或鼠疫等疾病幾乎已經根除,并且可以成功治療或治愈。下一個里程碑則是個性化醫(yī)療。這門新穎的學科針對的并非廣泛人群,而是專注于個體患者
    的頭像 發(fā)表于 05-19 13:25 ?557次閱讀
    <b class='flag-5'>個性化</b>醫(yī)療的挑戰(zhàn),微流液體監(jiān)測

    90元打造小智AI腕表,語音交互超有趣!

    ,分辨率 240*280,支持觸摸。 語音交互:內置麥克風,支持語音喚醒和語音指令。 音頻播放:1609 8Ω/1W 喇叭。 外殼設計:智能手表。 鋰電池:302535 320mAh,
    發(fā)表于 04-16 14:26

    AI賦能,健康無界:WT2605C語音芯片智能血壓計的個性化設計方案

    :數據如何解讀?異常如何干預?風險如何預防?WT2605C芯片方案的誕生,通過“AI對話+云端互聯+個性化服務”三重技術突破,重新定義了血壓計的價值邊界——它不僅是一
    的頭像 發(fā)表于 04-16 08:57 ?776次閱讀
    <b class='flag-5'>AI</b>賦能,健康無界:WT2605C<b class='flag-5'>語音</b>芯片智能血壓計的<b class='flag-5'>個性化</b>設計方案

    華為云 Flexus 數字人創(chuàng)新技術,賦能中小企業(yè)打造個性化營銷體驗

    等等,不僅提高了服務效率,還為用戶提供了更加個性化的體驗。但中小企業(yè)受數字人制作成本和技術門檻的限制,在數字化的競爭中并不占優(yōu)勢。 直到華為云 Flexus 數字人的出現,才為中小企業(yè)
    的頭像 發(fā)表于 03-10 10:38 ?3672次閱讀
    華為云 Flexus <b class='flag-5'>數字</b>人創(chuàng)新技術,賦能中小企業(yè)<b class='flag-5'>打造</b><b class='flag-5'>個性化</b>營銷體驗