91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

語音控制不是魔術,而是設計

efwedfd ? 來源:efwedfd ? 作者:efwedfd ? 2022-07-14 16:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

由于硬件和軟件的進化突破,語音用戶界面或各種尺寸和價格點的支持 VUI 的產品現(xiàn)在都可以推向市場。與直到今天定義語音控制體驗的“對著麥克風說話并等待”模型不同,新系統(tǒng)現(xiàn)在可以以最終用戶謹慎甚至不可見的方式嵌入到產品中,并具有即時響應時間,而不是“ t 體驗云延遲。

在評估智能揚聲器和云的語音控制替代方案時,產品開發(fā)人員面臨著新的機遇和挑戰(zhàn)。開發(fā)人員必須考慮尺寸和位置,因為高度微型化的設備被嵌入到家具和電器中。將語音應用程序與邊緣機器學習相結合對于讓產品隨著時間的推移變得更加智能是必要的。同時,設備也越來越依賴電池供電,需要開發(fā)人員進行工程設計以實現(xiàn)最佳能源管理。最后,開發(fā)人員必須考慮用戶對功能的期望。對于消費者來說,精心設計的語音控制感覺無處不在,能夠聽到角落和穿墻的聲音。所有這些以及更多內容匯集了在構建支持 VUI 的產品時必須考慮的幾個設計元素。

語音控制 2.0 更自由的方面之一是可以自由地說出語音命令,而無需附近的智能揚聲器。集成在智能家居設備中的語音可以使整個家庭成為一個可聽區(qū)域,在識別喚醒詞或其他可定義的聲音時隨時可用。專門的硬件和軟件用于產生準確的遠場音頻捕獲。

設計技巧

為了在遠場環(huán)境中有效地捕捉聲音,一些設計技術開始發(fā)揮作用,包括:端口方向:聲學端口是可以在沒有物理障礙的情況下接受音頻信號的地方。端口的位置(頂部或底部)由單個設備的外形尺寸決定。為了簡化設計,聲學端口通常位于麥克風附近,如下所示。但是,端口孔應與揚聲器和其他聲學噪聲源(例如電機放大器)足夠遠,以最大限度地減少麥克風輸入處的不需要的信號。

pYYBAGLOlHGAf4-SAADGbhu2oQE285.png

pYYBAGLOlHGAf4-SAADGbhu2oQE285.png

圖 1. 頂部和底部加載聲學端口配置的橫截面(來源:Knowles)

麥克風陣列和波束成形:使用多個麥克風稱為“陣列”。在任何給定時刻,麥克風陣列都會同時聽到來自各個方向的聲音。除了口頭命令外,他們還會聽到家中的其他聲音和動作。通過一種稱為波束成形的技術,可以對麥克風陣列進行編程,以選擇性地捕獲來自一個方向的聲音,同時拒絕來自其他方向的聲音。波束成形算法的最終結果是選擇性地調諧出來自所需方向的信號以外的信號。波束成形是數(shù)字信號處理鏈中的第一步。

數(shù)字信號處理 (DSP) 算法:DSP 是任何語音控制系統(tǒng)的基石。這就是想要的音頻信息的意義——捕捉它、聚焦它、凈化它、放大它——這樣音素就可以發(fā)出文字、命令和噪音,而不會破壞這個過程。DSP 幾乎用于語音交互的所有階段,從音頻捕獲和語音增強到語音處理。

poYBAGLOlHeABH1RAAD6ke5lWrg712.png

poYBAGLOlHeABH1RAAD6ke5lWrg712.png

圖 2. 遠場語音拾?。▉碓矗篔erry Lu)

以便利為設計理念

除了針對功能進行設計之外,支持 VUI 的設備還需要針對便利性和可用性進行設計。喚醒詞的兩個主要設計考慮圍繞能源管理和處理能力。由于 VUI 必須始終處于“偵聽”模式以等待喚醒詞,因此電池供電的 VUI 和 VCD 必須設計用于極低的能量消耗以及立即喚醒。此外,設備在過濾掉不需要的聲音的同時區(qū)分想要的語音命令的能力需要不可忽視的處理能力,這需要準確性和即時性。包含強大音頻邊緣處理器的產品現(xiàn)在可以提供計算能力和低功耗、低延遲操作,從而實現(xiàn)即時用戶體驗。

即使在今天的早期階段,語音控制的爆炸式增長也充分證明了智能家居中語音控制的市場機會。智能家居的支柱任務,包括安全、能源管理、娛樂和高級安全,都通過語音控制變得更簡單、更容易訪問。語音最終可以作為整個智能家居的統(tǒng)一控制器,從房子的任何房間發(fā)出命令……如果它們的設計考慮到用戶并利用語音控制技術的重大進步。

審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 設計方法
    +關注

    關注

    0

    文章

    12

    瀏覽量

    9228
  • 語音控制
    +關注

    關注

    5

    文章

    512

    瀏覽量

    29669
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    三防漆和 PCB 板 “疏離、起皮、脫層”,90% 不是漆本身差,而是界面張力 / 表面能不匹配。

    三防漆和 PCB 板 “疏離、起皮、脫層”,90% 不是漆本身差,而是界面張力 / 表面能不匹配。該如何自測如何解決?
    的頭像 發(fā)表于 03-02 11:59 ?53次閱讀
    三防漆和 PCB 板 “疏離、起皮、脫層”,90% <b class='flag-5'>不是</b>漆本身差,<b class='flag-5'>而是</b>界面張力 / 表面能不匹配。

    語音識別IC分類,語音識別芯片的工作原理

    語音識別芯片,也叫語音識別集成電路,是一種集聲音存儲、播放、錄音及語音識別功能于一體的專用芯片。語音識別IC的核心功能在于實現(xiàn)語音識別,即讓
    的頭像 發(fā)表于 01-14 15:22 ?243次閱讀
    <b class='flag-5'>語音</b>識別IC分類,<b class='flag-5'>語音</b>識別芯片的工作原理

    在工業(yè)現(xiàn)場,接口多不是缺點,而是一種生存能力

    一陣子,你就會知道: 不是工程師喜歡復雜,而是工業(yè)現(xiàn)場必須復雜。 而這些看似雜亂的接口,背后都有非?,F(xiàn)實、非常剛性的理由。 1、為什么接口多?因為工業(yè)現(xiàn)場比你想象得“野”得多 在消費電子領域,我們可以用一個 USB-C 解決大多數(shù)連接問
    的頭像 發(fā)表于 01-05 16:07 ?206次閱讀
    在工業(yè)現(xiàn)場,接口多<b class='flag-5'>不是</b>缺點,<b class='flag-5'>而是</b>一種生存能力

    智能語音識別控制器是什么?圖形中文編程,多路設備控制

    智能語音識別控制器是一種融合語音識別技術、物聯(lián)網通信技術與設備控制模塊的智能終端設備,核心功能是將人類自然語言指令轉化為設備可執(zhí)行的電信號,實現(xiàn)對各類終端設備的
    的頭像 發(fā)表于 12-03 16:35 ?686次閱讀

    樓宇自控系統(tǒng)語音控制集成,操作更便捷智能

    在智慧建筑升級浪潮中,樓宇自控系統(tǒng)的交互方式不斷革新,語音控制集成作為新型操作模式,打破了傳統(tǒng)按鍵、觸屏的操作局限,讓樓宇管理更高效、更人性化。這種 “動口不動手” 的控制方式,不僅簡化了操作流程
    的頭像 發(fā)表于 11-27 10:30 ?342次閱讀

    開源不是削弱競爭力,而是新護城河的開始

    。 越來越多的企業(yè)在開源的浪潮中找到了機會,也有人提出疑問: 既然代碼都開源了,護城河還從哪里來?開源軟件還有壁壘可言嗎? 事實上,開源并不是沒有護城河,它只是 把護城河從“技術代碼”轉移到了“綜合能力” 。 一、開源不是免費的午餐,
    的頭像 發(fā)表于 11-06 14:26 ?381次閱讀

    廣州唯創(chuàng)電子WT2003HX語音芯片:內置IIC控制器與紅外解碼器,打造全能語音解決方案 | 語音IC廠家

    智能設備制造商提供了全方位的語音解決方案,推動電子產品向更智能、更便捷的方向發(fā)展。一、核心技術突破1.1高效IIC控制器WT2003HX語音芯片內置的IIC控制器采
    的頭像 發(fā)表于 10-31 08:55 ?749次閱讀
    廣州唯創(chuàng)電子WT2003HX<b class='flag-5'>語音</b>芯片:內置IIC<b class='flag-5'>控制</b>器與紅外解碼器,打造全能<b class='flag-5'>語音</b>解決方案 | <b class='flag-5'>語音</b>IC廠家

    如何使用語音指令控制串口輸出

    在上兩篇文章中, 我們實現(xiàn)了GPIO輸出, 和PWM輸出(組件介紹在前文中已經介紹過 ),在本章節(jié)我們將繼續(xù)進行使用語音指令控制串口輸出。
    的頭像 發(fā)表于 09-25 15:47 ?2103次閱讀
    如何使用<b class='flag-5'>語音</b>指令<b class='flag-5'>控制</b>串口輸出

    增加語音控制功能關注這幾顆芯片輕松搞定

    增加語音控制功能關注這幾顆芯片輕松搞定 目前感覺幾乎所有的頭部或者非頭部的產品都在爭先恐后的上語音控制功能,產品單價高的上離在線AI對話功能,產品單價低的上離線
    的頭像 發(fā)表于 08-19 16:46 ?922次閱讀

    網絡語音控制器 智能自控語音播報

    網絡語音控制器(NetworkVoiceController)是一種通過有線/無線網絡接收指令,實現(xiàn)遠程語音播報、對講或聲光告警的智能設備。其應用場景極為廣泛,幾乎覆蓋所有需要“遠程聲音交互”或
    的頭像 發(fā)表于 08-13 15:21 ?878次閱讀

    茶吧機語音控制方案設計2025新版

    一、方案概述 在智能家居技術飛速發(fā)展的當下,茶吧機的智能化升級成為必然趨勢。語音控制作為一種便捷、自然的交互方式,正逐漸成為茶吧機智能化的關鍵方向。本方案聚焦于利用 WT2606B 芯片,精心構建
    的頭像 發(fā)表于 07-22 17:02 ?985次閱讀
    茶吧機<b class='flag-5'>語音</b><b class='flag-5'>控制</b>方案設計2025新版

    AI語音控制模塊能做些什么

    在智能化浪潮中,AI 語音控制模塊成為眾多設備實現(xiàn)便捷交互的關鍵組件。WT3000A 作為一款功能卓越的 AI 語音控制模塊,在智能家居、工業(yè)物聯(lián)網等領域展現(xiàn)出強大的應用能力。 豐富語
    的頭像 發(fā)表于 06-18 11:48 ?1012次閱讀
    AI<b class='flag-5'>語音</b><b class='flag-5'>控制</b>模塊能做些什么

    語音控制模塊工作原理

    語音控制芯片或者說模塊的應用前景越來越廣泛,無論是設計方案還是廠家生產的產品在越來越多越來越頻繁的使用語音控制芯片。當然行業(yè)內更多的是稱呼為語音
    的頭像 發(fā)表于 06-17 11:49 ?1376次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>控制</b>模塊工作原理

    藍牙語音遙控器:智能家居的智慧控制核心

    隨著智能家居的蓬勃發(fā)展,藍牙語音遙控器憑借其便捷的操作和智能交互體驗,正迅速取代傳統(tǒng)紅外遙控器,成為智能電視、機頂盒等設備的首選控制工具。 相較于需對準設備的紅外遙控器,藍牙語音遙控器通過藍牙低功耗
    發(fā)表于 06-01 20:24

    你失去工作不是因為AI,而是因為使用AI的人

    當算法能精準預測消費者需求時,當AI生成的文案比人類更懂傳播心理學時,當自動化系統(tǒng)開始取代基礎決策崗位時,真正的危機已悄然降臨—— 不是AI在搶奪你的工作,而是那些比你更早掌握AI、更懂得如何駕馭
    的頭像 發(fā)表于 05-13 12:05 ?811次閱讀
    你失去工作<b class='flag-5'>不是</b>因為AI,<b class='flag-5'>而是</b>因為使用AI的人