手机在线黄色电影Av,中日韩av在线免费播放,人人干人人爽人人射

當(dāng)今語音技術(shù)領(lǐng)域的許多最大玩家也是手機(jī)操作系統(tǒng) （OS）市場的重量級人物。微軟是第一個(gè)組建語音團(tuán)隊(duì)的軟件/移動操作系統(tǒng)巨頭。在 1990 年代初期，比爾·蓋茨宣揚(yáng)了語音用戶界面（VUI）的好處，并預(yù)測它們將在計(jì)算機(jī)上的人機(jī)交互中發(fā)揮作用。谷歌在 21 世紀(jì)初建立了一支由語音技術(shù)專家組成的精英團(tuán)隊(duì)，并通過其 Android 版本刺激了移動行業(yè)向語音界面和語音控制方向發(fā)展。蘋果一直是用戶體驗(yàn)的王者，直到最近，由于準(zhǔn)確性方面的挑戰(zhàn)，蘋果一直避免推動語音技術(shù)。然而，隨著收購 Siri（語音禮賓服務(wù)）并將該公司的技術(shù)整合到 iPhone 4S 中，

由于多種原因，語音技術(shù)對移動行業(yè)變得至關(guān)重要，主要是因?yàn)檎f話比打字更容易，而且手機(jī)的外形設(shè)計(jì)是圍繞說話而不是打字而構(gòu)建的。此外，由于移動搜索的巨大收入潛力，移動操作系統(tǒng)提供商看到了將語音識別添加到他們的技術(shù)組合中的價(jià)值。

為什么是嵌入式？

VUI 的大部分繁重工作都是在云中執(zhí)行的。這就是大型操作系統(tǒng)廠商的大部分投資都花在了那里。云提供了一個(gè)具有幾乎無限 MIPS 和內(nèi)存的環(huán)境——這是高級語音搜索處理的兩個(gè)基本要素。隨著基于云的語音技術(shù)使用的增長，嵌入式領(lǐng)域似乎也出現(xiàn)了類似的趨勢。

嵌入式語音是唯一能夠在無法訪問云時(shí)啟用語音控制和輸入的解決方案——這是增加用戶體驗(yàn)的必要功能。嵌入式語音還能夠消耗更少的 MIPS 和內(nèi)存，從而提高設(shè)備電池電量的效率。

客戶端/云語音使用的最佳方案需要在客戶端上進(jìn)行語音激活，并在云上解密文本和含義的繁重工作。這可以實(shí)現(xiàn)設(shè)備始終開啟并始終收聽的場景，因此無需按下客戶端上的按鈕即可發(fā)出和執(zhí)行語音命令。這種“不需要手或眼睛”的范例在汽車中為了安全目的而在家里為了方便起見特別有用。

例如，在最近推出的 Galaxy SII Android 手機(jī)中，三星的 Voice Talk 使用 Sensory 的 TrulyHandsfree 語音控制，一種嵌入式語音技術(shù)，通過“Hey Galaxy”來激活手機(jī)。這句話調(diào)用了基于云的 Vlingo 識別服務(wù)，該服務(wù)允許用戶在不接觸手機(jī)的情況下發(fā)出命令和輸入文本。

語音識別可以在低至 10 MIPS 和數(shù)萬字節(jié)內(nèi)存的設(shè)備上實(shí)現(xiàn)。Sensory 的語音芯片系列包括基于 8 位微控制器的 RISC 單芯片和利用小型嵌入式 DSP 的自然語言處理器。一般來說，在語音識別中投入的 MIPS 和內(nèi)存越多，產(chǎn)品的功能（響應(yīng)時(shí)間越快、詞匯量越大、語法越復(fù)雜）就越多。

無論什么平臺實(shí)現(xiàn)任務(wù)，語音識別的一般方法都是相似的。多年來，隱馬爾可夫建模和神經(jīng)網(wǎng)絡(luò)等統(tǒng)計(jì)方法一直是語音識別的主要方法。從客戶端遷移到云端允許部署統(tǒng)計(jì)語言建模和更復(fù)雜的技術(shù)。

VUI 階段

要?jiǎng)?chuàng)建真正免提、免眼的用戶體驗(yàn)，必須解決幾個(gè)技術(shù)階段。

第 1 階段：語音激活

這實(shí)質(zhì)上是在替換按鈕按下。識別器需要始終處于開啟狀態(tài)，準(zhǔn)備好調(diào)用第 2 階段投入運(yùn)行，并且能夠在非常嘈雜的情況下激活。第一階段的另一個(gè)關(guān)鍵標(biāo)準(zhǔn)是非常快的響應(yīng)時(shí)間。鑒于超過幾百毫秒的延遲可能會導(dǎo)致用戶在識別器收聽之前對階段 2 說話而導(dǎo)致準(zhǔn)確性問題，因此語音激活的響應(yīng)時(shí)間必須與按鈕的響應(yīng)時(shí)間相同，這幾乎是瞬時(shí)的。簡單的命令和控制功能可以通過 Stage 1 識別系統(tǒng)或更復(fù)雜的 Stage 2 系統(tǒng)嵌入客戶端，該系統(tǒng)可以是嵌入式的或基于云的。

第 2 階段：語音識別和轉(zhuǎn)錄

更耗電且功能更強(qiáng)大的 Stage 2 識別器將所說的內(nèi)容翻譯成文本。如果目的是短信或語音撥號，則該過程可以在這里停止。如果用戶想要回答問題或訪問數(shù)據(jù)，系統(tǒng)將進(jìn)入第 3 階段。由于第 1 階段識別器可以在高噪聲下做出響應(yīng)，它可以降低汽車收音機(jī)或家庭 AV 的音量以協(xié)助第 2 階段識別。

第三階段：意圖和意義

這可能是這個(gè)過程中最大的挑戰(zhàn)。文本翻譯準(zhǔn)確，但它是什么意思？例如，互聯(lián)網(wǎng)搜索所需的查詢是什么？今天的“智能”可能會嘗試修改搜索以更好地適應(yīng)它認(rèn)為用戶想要的內(nèi)容。然而，計(jì)算機(jī)在識別意圖方面非常糟糕。Apple 的 Siri 智能助手是在國防部資助的 CALO 項(xiàng)目下開發(fā)的，涉及 300 多名研究人員，它可能是當(dāng)今智能解釋的最佳示例。

第四階段：數(shù)據(jù)搜索和查詢

根據(jù)查詢的不同，搜索數(shù)據(jù)并找到正確的結(jié)果可能很簡單，也可能很復(fù)雜。地圖數(shù)據(jù)和方向可能是可靠的，因?yàn)檎Z法很好理解，地圖搜索的目標(biāo)很明確。隨著谷歌和其他搜索提供商在數(shù)據(jù)搜索功能上投入大量資金和時(shí)間，這一階段將繼續(xù)改善。

第 5 階段：語音響應(yīng)

對查詢的語音響應(yīng)是顯示響應(yīng)的一個(gè)很好的替代方案，這可能會導(dǎo)致駕駛員將視線從道路上移開或在家中造成不便。當(dāng)今最先進(jìn)的文本到語音系統(tǒng)具有高度可理解性，并且比以前的自動語音系統(tǒng)聽起來更自然。

為什么嵌入式識別器在第 1 階段替換按鈕需要這么長時(shí)間？

語音識別傳統(tǒng)上需要按鈕激活而不是語音激活。造成這種情況的主要原因是按鈕雖然讓人分心，但即使在嘈雜的環(huán)境中也是可靠且反應(yīng)靈敏的。這些類型的環(huán)境，例如汽車或繁忙的家，對于語音識別器來說可能具有挑戰(zhàn)性。一個(gè)聲控詞必須在汽車（車窗關(guān)閉、收音機(jī)打開和道路噪音）或家中（嬰兒哭泣、音樂或電視打開、電器運(yùn)行）中產(chǎn)生響應(yīng)，而無需用戶為它工作。因此，直到最近，語音技術(shù)只有在用戶處于安靜環(huán)境中且麥克風(fēng)靠近嘴巴時(shí)才可靠。

對快速響應(yīng)時(shí)間的要求使這一挑戰(zhàn)進(jìn)一步復(fù)雜化。語音識別器通常需要數(shù)百毫秒才能確定用戶是否在開始處理語音之前完成了談話。識別系統(tǒng)可以接受這個(gè)時(shí)間延遲以產(chǎn)生答案或回復(fù)給消費(fèi)者。然而，在第 1 階段，激活的響應(yīng)在第 2 階段調(diào)用另一個(gè)更復(fù)雜的識別器，消費(fèi)者不會接受持續(xù)時(shí)間比按下按鈕時(shí)間長得多的延遲。延遲越長，在第 2 階段發(fā)生識別失敗的可能性就越大，因?yàn)橛脩艨赡茉诘?2 階段識別器準(zhǔn)備好收聽之前開始說話。

嵌入式語音技術(shù)的最新進(jìn)展，例如 Sensory 的 TrulyHandsfree 語音界面，無需觸摸設(shè)備即可提供真正的 VUI。這些技術(shù)消除了嘈雜環(huán)境中固有的問題以及較長的響應(yīng)時(shí)間，使語音激活變得可行、準(zhǔn)確和方便。

消費(fèi)電子產(chǎn)品中語音的未來

許多年前，電視觀眾不得不起身走到他們的單位更換頻道。遙控器的到來讓這一切都結(jié)束了，今天沒有人會買沒有遙控器的電視。盡管如此，我們?nèi)匀黄鹕碜叩轿覀兊拇蠖鄶?shù)計(jì)算設(shè)備前使用它們。隨著語音識別的改進(jìn)，這將不再是必要的。

帶有語音觸發(fā)功能的免提設(shè)備的迅速興起將發(fā)展成為智能設(shè)備，這些設(shè)備可以聆聽我們所說的話并決定何時(shí)適合從客戶端轉(zhuǎn)到云端。他們還將決定何時(shí)以及如何做出回應(yīng)，有可能演變成坐在后臺傾聽一切并決定何時(shí)提供幫助的助手。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

dsp

dsp

+關(guān)注

關(guān)注
561

文章
8250

瀏覽量
366911
嵌入式

嵌入式

+關(guān)注

關(guān)注
5200

文章
20481

瀏覽量
334567
Android

Android

+關(guān)注

關(guān)注
12

文章
4029

瀏覽量
134080

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

基于云的語音識別增長推動嵌入式語音技術(shù)

評論