91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

淺析語音接口技術(shù)

電子設(shè)計 ? 來源:德州儀器 ? 作者:德州儀器 ? 2021-12-10 10:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語音接口已經(jīng)成為一個改變?nèi)藱C交互方式的全新切入點。這些系統(tǒng)如何工作?打造這樣一款設(shè)備在硬件方面有什么要求?隨著語音控制接口變得越來越普及,德州儀器TI)的一位工程師對此技術(shù)進行了深入的了解,并分享了其對這項技術(shù)的認識和看法。

語音接口是什么?

語音識別技術(shù)自20世紀50年代起開始出現(xiàn)在我們身邊。那時貝爾實驗室的工程師創(chuàng)建了一款可以識別單個數(shù)字的系統(tǒng)。然而,語音識別只是完整語音接口技術(shù)的一部分。語音接口包含傳統(tǒng)用戶接口的所有方面:它能呈現(xiàn)信息并為用戶提供一種操控方式。在語音接口中,操控或者甚至一些信息的呈現(xiàn)都將通過語音實現(xiàn)。在一些如按鈕或顯示屏等傳統(tǒng)的用戶接口上,也可能配置語音接口這一選項。

大部分人遇到的第一款語音接口設(shè)備很有可能是移動電話,或者是個人電腦上非常基礎(chǔ)的將語言轉(zhuǎn)換成文字的程序。然而,這些設(shè)備的運行都非常緩慢、識別不精確且可識別的詞匯有限。

那是什么將語音識別從一種附屬性功能變成了計算機世界炙手可熱的技術(shù)呢?首先,如今的計算能力和算法性能都有顯著的提高(如果你對隱馬爾科夫模型有所了解,對此你會有更直觀的認識)。其次,云技術(shù)和大數(shù)據(jù)分析的應(yīng)用也改進了語音識別效果,并且提高了識別的速度和準確性。

為你的設(shè)備添加語音識別功能

一些人常常會對如何為項目添加某種語音接口存在疑問。實際上,TI供應(yīng)幾種不同的語音接口產(chǎn)品,包括ARM?處理器的Sitara?系列產(chǎn)品和C5000? DSP系列產(chǎn)品,這些產(chǎn)品都具備語音處理的能力。兩種系列的產(chǎn)品各有千秋,分別適用于不同的應(yīng)用。

在選擇DSP和ARM這兩種解決方案時,考慮的關(guān)鍵因素在于這款設(shè)備能否或?qū)⑷绾卫迷普Z音平臺。當中有三種應(yīng)用場景:第一種是離線,所有的處理過程都在本地設(shè)備上發(fā)生。第二種是在線,通過基于云端的語音處理設(shè)備,如亞馬遜的Alexa,谷歌助手或IBM Watson;第三種是兩者混合。

離線:車載語音控制

從目前的發(fā)展趨勢來看,人們似乎希望所有事物都能夠連接至互聯(lián)網(wǎng)。然而,無論是出于成本考慮或是缺乏可靠的網(wǎng)絡(luò)連接,在某些應(yīng)用中,連接網(wǎng)絡(luò)的意義其實不大。在現(xiàn)代的汽車應(yīng)用中,許多娛樂信息系統(tǒng)就采用了離線語音接口系統(tǒng)。這些語音接口系統(tǒng)通常只能使用有限的命令集,如“撥打電話”、“播放音樂”和“提高或降低音量”。雖然傳統(tǒng)處理器的語音識別算法取得了重大進展,但仍有不盡如人意之處。遇到這樣的情況,例如C55xx等DSP可能夠為系統(tǒng)提供最佳的性能。

在線:智能家庭中樞

關(guān)于語音接口的很多熱議主要圍繞于例如Google Home和亞馬遜 Alexa等互聯(lián)設(shè)備。由于亞馬遜允許第三方進入其已配備Alex語音服務(wù)的語音處理生態(tài)系統(tǒng),他們在這方面的發(fā)展備受矚目。另外,如Microsoft Azur等其它的云服務(wù)也可以提供語音識別服務(wù)和類似功能。值得注意的是,這些設(shè)備的聲音處理過程全部發(fā)生在云端。

是否值得為了這種便捷的集成而向語音服務(wù)供應(yīng)商提供上行數(shù)據(jù)完全取決于用戶。但是,云服務(wù)供應(yīng)商承擔了主要的工作,設(shè)備商需要做的很簡單,實際上,由于接口的語音合成部分也發(fā)生在云端,Alexa只要完成最簡單的功能,即播放并記錄錄音文件。既然不需要特別的信號處理功能,ARM處理器足以處理接口工作。這意味著,如果你的設(shè)備已配備ARM處理器,你就可能集成云計算語音接口。

事實上,關(guān)注Alexa等不能提供的服務(wù)也是非常重要的。Alexa不直接執(zhí)行任何一種設(shè)備控制或云集成。驅(qū)動Alexa的許多“智能設(shè)備”都具備云計算功能,該功能由開發(fā)商提供,可以利用Alexa的語音處理能力將驅(qū)動輸入至現(xiàn)有的云應(yīng)用。例如,如果你告訴Alexa需要訂一個披薩,你最喜愛的披薩店則需要為Alexa編制一項“技能”。該項技能是一個可以在你訂披薩時定義工作內(nèi)容的代碼。當你每次訂披薩時,Alexa都會調(diào)用該技能。該技能嵌入了可以為你下單的在線訂購系統(tǒng)。同樣,智能家居設(shè)備制造商必須執(zhí)行Alexa如何與本地設(shè)備和在線服務(wù)相互作用的技能。亞馬遜自帶許多這樣的技能,加上第三方開發(fā)者提供的技能,即便你沒有開發(fā)任何技能,Alexa設(shè)備仍然可以非常有用。

混合:互聯(lián)自動調(diào)溫器

有時,即使沒有連接互聯(lián)網(wǎng),我們也有保證設(shè)備的某些基礎(chǔ)功能可以正常使用的需求。例如:在連不上網(wǎng)的時候,如果自動調(diào)溫器不會自主調(diào)節(jié)溫度,這就會是一個很麻煩的問題。為避免這種問題的發(fā)生 ,一個好的產(chǎn)品設(shè)計師會設(shè)計一些本地的聲音處理功能,在功能上實現(xiàn)無縫銜接。為了實現(xiàn)此功能,系統(tǒng)必須具有DSP,例如用于本地語音處理的C55XX和用于將已連網(wǎng)的接口連接至云端的ARM處理器。

語音觸發(fā)又是什么?

你也許已經(jīng)注意到了,直到現(xiàn)在我們還沒有提及新一代語音助手真正神奇的地方:那就是始終關(guān)注“觸發(fā)詞匯”。它們將如何追蹤你在房間內(nèi)任意位置所發(fā)出的聲音,或是當設(shè)備播放音頻時,又如何聽到你的聲音?實現(xiàn)這些其實并沒有什么特別神奇的地方,只需要一些智能化軟件。這類軟件獨立于云端的語音接口,也能在系統(tǒng)離線的狀態(tài)下運行。

這個系統(tǒng)最易理解的部分就是“喚醒詞匯”。喚醒詞匯是一個簡單的本地語音識別程序,通過持續(xù)性采樣,在接收的音頻信號中尋找單個詞匯。由于大多數(shù)語音服務(wù)均樂意接受不含喚醒詞匯的音頻,因此該詞匯不需要指定任何特殊的語音平臺。因為實現(xiàn)這種功能的要求相對較低,所以通過利用Sphinx或KITT.AI等開源數(shù)據(jù)庫在ARM處理器上即可完成操作。

為了聽到你在房間內(nèi)任意位置發(fā)出的聲音,語音識別設(shè)備采用一個叫波束成型的流程。最重要的是,通過對比不同聲音的到達時間和麥克風(fēng)間的距離來確定聲音的來源。一旦確認了目標聲音的位置,設(shè)備就會采用如空間濾波等音頻處理技術(shù)來進一步減少噪音并增強信號質(zhì)量。波束成型的實現(xiàn)取決于麥克風(fēng)的布局。真正實現(xiàn)360度識別則需要一個非線性麥克風(fēng)陣列(通常是圓形)。對于壁掛式設(shè)備而言,僅需兩個麥克風(fēng)就能啟用180度的空間辨別。

語音助手的最后一招是采用自動回波消除(AEC)。AEC在某種程度上類似于噪音消除耳機,但應(yīng)用恰好相反。該算法是利用已知的音樂等輸出音頻信號來實現(xiàn)的。在噪音消除耳機利用這點來消除外部雜音,AEC消除了輸出信號對輸入信號在麥克風(fēng)上的影響。該設(shè)備能忽略自身產(chǎn)生的音頻,且無論揚聲器播放何種內(nèi)容,其都仍然能接收。實現(xiàn)AEC需要大量的計算,其中在DSP中效果最佳。

為了實施喚醒識別、波束成型和AEC等以上提及的所有功能,則要求ARM處理器配合DSP共同工作:DSP增強了所有的信號處理功能,而ARM處理器控制設(shè)備邏輯和接口。DSP可在執(zhí)行輸入數(shù)據(jù)管路方面發(fā)揮重要的作用,由此最大限度地減少處理的延遲,從而提供更好的用戶體驗。ARM可以自由運行如Linux等高級操作系統(tǒng)以控制其它設(shè)備。這樣高級的功能全部發(fā)生在本地,若使用云服務(wù),將只接收包含最終處理結(jié)果的單個語音文件。

結(jié)論

語音接口似乎已收獲了超高的人氣,并且將在未來很長一段時間內(nèi)以不同形式出現(xiàn)在我們的生活中。盡管有多種不同的處理方式可以實現(xiàn)語音接口服務(wù),但無論你的應(yīng)用需要何種裝置,TI都可以為你提供理想的選擇。

使用針對語音應(yīng)用、采用66AK2G02的語音預(yù)處理系統(tǒng)參考設(shè)計來實現(xiàn)音頻設(shè)計。

下載全新白皮書“語音接口技術(shù)-語音處理技術(shù)新紀元”

編輯:金巧

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • dsp
    dsp
    +關(guān)注

    關(guān)注

    561

    文章

    8247

    瀏覽量

    366755
  • 語音接口
    +關(guān)注

    關(guān)注

    0

    文章

    10

    瀏覽量

    10045
  • 智能家庭
    +關(guān)注

    關(guān)注

    0

    文章

    74

    瀏覽量

    22062
  • 調(diào)溫
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    8137
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    淘寶平臺運費API接口技術(shù)指南

    ? 作為電商開發(fā)者,集成淘寶平臺的運費計算功能是常見需求。淘寶提供了一系列API接口,幫助開發(fā)者獲取商品的運費信息。本技術(shù)帖將詳細介紹如何使用淘寶的運費API接口,包括API概述、請求流程、示例代碼
    的頭像 發(fā)表于 03-03 15:48 ?115次閱讀
    淘寶平臺運費API<b class='flag-5'>接口技術(shù)</b>指南

    獲取Ozon商品詳情數(shù)據(jù)的API接口技術(shù)指南

    ? 在電商平臺開發(fā)中,通過API接口獲取商品數(shù)據(jù)是常見的需求。Ozon作為俄羅斯領(lǐng)先的電商平臺,提供了API接口供開發(fā)者訪問商品詳情數(shù)據(jù)。本技術(shù)帖將逐步介紹如何利用Ozon API獲取商品詳情,包括
    的頭像 發(fā)表于 02-28 16:28 ?543次閱讀
    獲取Ozon商品詳情數(shù)據(jù)的API<b class='flag-5'>接口技術(shù)</b>指南

    時識科技以全棧仿生智能推動腦機接口技術(shù)產(chǎn)業(yè)化落地

    當一位因漸凍癥而失語的患者,通過腦機接口技術(shù)清晰表達出“我要吃飯”的意念時,科幻正在成為現(xiàn)實。這類突破性臨床應(yīng)用背后,離不開一系列核心硬件的支撐。時識科技(SynSense)正聚焦于腦機接口產(chǎn)業(yè)鏈的上游,致力于將此類愿景轉(zhuǎn)化為穩(wěn)定、可規(guī)?;慕鉀Q方案。
    的頭像 發(fā)表于 02-06 10:12 ?310次閱讀

    是德科技打造腦機接口無線共存測試解決方案

    之前,我們曾寫過有關(guān)腦機接口的微信文章介紹過腦機接口技術(shù)。近一個月來腦機接口市場又熱鬧起來啦!
    的頭像 發(fā)表于 01-21 11:00 ?2319次閱讀
    是德科技打造腦機<b class='flag-5'>接口</b>無線共存測試解決方案

    淘寶商品詳情API接口技術(shù)解析與實戰(zhàn)應(yīng)用

    隨著電商行業(yè)的快速發(fā)展,數(shù)據(jù)驅(qū)動的決策模式已成為企業(yè)核心競爭力的重要組成部分。淘寶作為國內(nèi)領(lǐng)先的電商平臺,其開放平臺提供的商品詳情API接口為開發(fā)者提供了獲取商品全維度數(shù)據(jù)的通道。本文從技術(shù)實現(xiàn)角度
    的頭像 發(fā)表于 11-04 09:50 ?354次閱讀

    訂單實時狀態(tài)查詢接口技術(shù)實現(xiàn)

    、可靠的訂單實時狀態(tài)查詢接口,涵蓋接口設(shè)計、技術(shù)選型、代碼實現(xiàn)和性能優(yōu)化。我們將使用Python和Flask框架作為示例,確保內(nèi)容真實可靠,適合開發(fā)人員參考。 1. 接口設(shè)計原則 訂單
    的頭像 發(fā)表于 10-21 17:58 ?736次閱讀
    訂單實時狀態(tài)查詢<b class='flag-5'>接口技術(shù)</b>實現(xiàn)

    訂單評價內(nèi)容采集接口技術(shù)解析

    基于常見技術(shù)場景,確保真實性和實用性。 1. 接口概述與核心功能 訂單評價內(nèi)容采集接口主要負責(zé)從數(shù)據(jù)庫中提取指定訂單的評價信息,包括文本評論、評分和用戶元數(shù)據(jù)。其核心功能包括: 數(shù)據(jù)查詢 :通過訂單ID或其他標識符精準定位
    的頭像 發(fā)表于 10-17 15:14 ?419次閱讀
    訂單評價內(nèi)容采集<b class='flag-5'>接口技術(shù)</b>解析

    發(fā)票信息管理接口技術(shù)指南

    ? ?在現(xiàn)代企業(yè)應(yīng)用中,發(fā)票信息管理接口是財務(wù)系統(tǒng)的核心組件,用于高效處理發(fā)票的創(chuàng)建、查詢、更新和刪除操作。本文將從接口設(shè)計、功能實現(xiàn)到代碼示例,逐步講解如何構(gòu)建一個可靠、可擴展的發(fā)票管理API
    的頭像 發(fā)表于 10-16 14:38 ?398次閱讀
    發(fā)票信息管理<b class='flag-5'>接口技術(shù)</b>指南

    商品價格動態(tài)調(diào)整接口技術(shù)詳解

    接口”。文章基于真實場景,確保技術(shù)可靠性和實用性。 1. 接口設(shè)計概述 商品價格動態(tài)調(diào)整接口是一個API服務(wù),接收外部輸入(如商品ID、庫存數(shù)據(jù)、市場指標),并輸出調(diào)整后的價格。核心組
    的頭像 發(fā)表于 10-13 15:49 ?413次閱讀
    商品價格動態(tài)調(diào)整<b class='flag-5'>接口技術(shù)</b>詳解

    商品視頻關(guān)聯(lián)接口技術(shù)詳解

    這一技術(shù),幫助開發(fā)者快速上手。 1. 接口概述與背景 商品視頻關(guān)聯(lián)接口的核心功能是管理商品($product$)和視頻($video$)之間的多對多關(guān)系。常見場景包括: 用戶上傳商品介紹視頻時,自動關(guān)聯(lián)到對應(yīng)商品。 前臺頁面展示
    的頭像 發(fā)表于 10-13 15:44 ?382次閱讀
    商品視頻關(guān)聯(lián)<b class='flag-5'>接口技術(shù)</b>詳解

    實時庫存同步接口技術(shù)詳解

    ? 在現(xiàn)代電商、零售和供應(yīng)鏈系統(tǒng)中,庫存管理是核心環(huán)節(jié)。實時庫存同步接口確保庫存數(shù)據(jù)在多個系統(tǒng)(如前臺銷售、后臺倉庫、供應(yīng)商平臺)之間即時更新,避免超賣或缺貨問題。本文將逐步介紹其設(shè)計原理、實現(xiàn)方法
    的頭像 發(fā)表于 10-10 14:33 ?522次閱讀
    實時庫存同步<b class='flag-5'>接口技術(shù)</b>詳解

    RJ45網(wǎng)絡(luò)接口技術(shù)介紹

    在當今數(shù)字化時代,網(wǎng)絡(luò)接口作為連接設(shè)備與網(wǎng)絡(luò)的關(guān)鍵組件,其重要性不言而喻。無論是個人電腦、服務(wù)器還是各種網(wǎng)絡(luò)設(shè)備,網(wǎng)絡(luò)接口都扮演著不可或缺的角色。本文將深入探討網(wǎng)絡(luò)接口技術(shù)原理、常見
    的頭像 發(fā)表于 07-22 18:22 ?1025次閱讀

    國內(nèi)首例閉環(huán)脊髓神經(jīng)接口系統(tǒng)臨床植入成功,佳量醫(yī)療引領(lǐng)神經(jīng)接口技術(shù)新突破

    2025 年7 月 1 日,中國杭州 ——2025年3月,國內(nèi)領(lǐng)先的神經(jīng)外科和腦科學(xué)技術(shù)平臺佳量醫(yī)療自主研發(fā)的閉環(huán)脊髓神經(jīng)接口系統(tǒng)成功完成國內(nèi)首例臨床植入,標志著其通用神經(jīng)接口技術(shù)平臺在應(yīng)用場景中
    發(fā)表于 07-01 16:13 ?1461次閱讀

    倍加福面向流程工業(yè)應(yīng)用的接口技術(shù)

    倍加福擁有70 余年的專業(yè)積淀,作為本安安全柵的發(fā)明者,現(xiàn)已發(fā)展成為享譽全球流程工業(yè)領(lǐng)域的接口技術(shù)制造商,且其接口設(shè)備在工業(yè)危險區(qū)域中得到廣泛應(yīng)用。如今,倍加福憑借深厚的專業(yè)技術(shù)、豐富的應(yīng)用經(jīng)驗和超卓的市場洞察力,確保
    的頭像 發(fā)表于 06-04 17:00 ?1010次閱讀

    AD、DA轉(zhuǎn)換器接口技術(shù)與實用線路

    本書共分七章,主要內(nèi)容包括:緒論、模擬開關(guān)與采樣/保持器、D/A轉(zhuǎn)換基本原理與接口技術(shù)、A/D轉(zhuǎn)換基本原理與接口技術(shù)、V/F和F/V轉(zhuǎn)換及其接口、A/D和D/A轉(zhuǎn)換實用線路、抗干擾措施與印制電路
    發(fā)表于 04-10 15:10