91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在本地與云端部署語音識別

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Todd Mozer ? 2022-07-09 07:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

、熟悉 Siri、Google Now、Cortana、S-Voice 和/或 Echo 的每個(gè)人都熟悉過去十年語音識別的進(jìn)步和改進(jìn)。這種改進(jìn)大部分來自基于云的識別器在大數(shù)據(jù)上部署“深度學(xué)習(xí)”。

盡管它經(jīng)常不在聚光燈下,但嵌入式系統(tǒng)的語音識別已經(jīng)取得了很大進(jìn)展。事實(shí)上,大多數(shù)主要的語音引擎都部署了嵌入式和基于云的識別的組合。這在“Hey Siri”、“OK Google”、“Hey Cortana”、“Hi Galaxy”和“Alexa”等命令中最為明顯。所有這些基于云的識別系統(tǒng)都使用嵌入的“觸發(fā)”短語來打開云連接,為語音識別做好準(zhǔn)備。

嵌入式觸發(fā)短語允許一些基于云的方法的改進(jìn)和實(shí)用性。一方面,擁有一個(gè)“永遠(yuǎn)在線”的嵌入式識別器比讓你的對話上傳到云端讓谷歌和其他人以他們想要的任何方式分析要少得多。由于它在設(shè)備上,因此在說出觸發(fā)短語之前不會(huì)進(jìn)行語音錄制或傳輸,并且觸發(fā)偵聽是實(shí)時(shí)完成的,而不會(huì)發(fā)送您的語音。

嵌入式喚醒觸發(fā)器也有實(shí)際原因,其中一個(gè)主要原因是功耗。僅在云中運(yùn)行需要大量數(shù)據(jù)傳輸和分析,使得電池供電或“綠色”產(chǎn)品不切實(shí)際。許多主要的 DSP 公司都為“始終開啟”的 DSP 提供解決方案,這些 DSP 以 2 mA 或更低的電流運(yùn)行 Sensory 的 TrulyHandsfree 喚醒觸發(fā)選項(xiàng)。使用健全的活動(dòng)檢測方案,平均電池消耗可以低于 1 mA,將其置于電池泄漏領(lǐng)域。

嵌入式語音識別的其他流行用途是在需要對有限命令進(jìn)行快速準(zhǔn)確響應(yīng)的設(shè)備中。我最喜歡的例子之一是三星 Galaxy 智能手機(jī),在相機(jī)模式下,用戶可以啟用語音命令來拍照。這適用于我在 20 英尺遠(yuǎn)的安靜環(huán)境或 5 英尺遠(yuǎn)的嘈雜位置。這是隨身攜帶自拍桿的絕佳替代品,每當(dāng)我向人們展示此功能時(shí),他們都會(huì)很快獲得并喜歡它。

嵌入式揚(yáng)聲器驗(yàn)證也被更頻繁地部署,并且通常被合并到喚醒觸發(fā)器中,以降低其他人喚醒您的設(shè)備的可能性。對于語音識別和說話人驗(yàn)證,總是需要在錯(cuò)誤接受(接受錯(cuò)誤的用戶)和錯(cuò)誤拒絕(拒絕正確的用戶)之間進(jìn)行權(quán)衡。首選的喚醒觸發(fā)設(shè)置通常是以偶爾讓正確的人進(jìn)入為代價(jià)來保持極低的錯(cuò)誤拒絕。在需要更復(fù)雜的揚(yáng)聲器驗(yàn)證以確保安全的系統(tǒng)中,可以部署不需要最低要求的更復(fù)雜的算法功耗,以增加電流消耗為代價(jià)獲得更好的精度。

隨著消費(fèi)產(chǎn)品和手機(jī)使用更復(fù)雜的處理器,我預(yù)計(jì)更高比例的語音識別使用將轉(zhuǎn)移到嵌入式設(shè)備,并且會(huì)出現(xiàn)“分層”語音識別方法,從而在設(shè)備上進(jìn)行快速初始分析并做出響應(yīng)如果設(shè)備對成功有很高的信心(自我認(rèn)知),但如果它不太確定自己的響應(yīng)或需要基于云的搜索,則將其傳遞給云端。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20256

    瀏覽量

    252451
  • 嵌入式
    +關(guān)注

    關(guān)注

    5199

    文章

    20454

    瀏覽量

    334269
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5599

    瀏覽量

    124406
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    爆火的OpenClaw! 告別云端,米爾RK3576本地部署

    PART01概述基于最近爆火的OpenClaw項(xiàng)目,本文將在MYD-LR3576開發(fā)板上部署OpenClaw,并接入飛書機(jī)器人,實(shí)現(xiàn)本地自托管AI助手。1.1.硬件資源部署端:MYD-LR3576
    的頭像 發(fā)表于 03-06 08:04 ?216次閱讀
    爆火的OpenClaw! 告別<b class='flag-5'>云端</b>,米爾RK3576<b class='flag-5'>本地</b><b class='flag-5'>部署</b>

    語音識別IC分類,語音識別芯片的工作原理

    語音識別芯片,也叫語音識別集成電路,是一種集聲音存儲(chǔ)、播放、錄音及語音識別功能于一體的專用芯片。
    的頭像 發(fā)表于 01-14 15:22 ?250次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>識別</b>IC分類,<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片的工作原理

    語音識別芯片有哪些(語音識別芯片AT680系列)

    人工智能技術(shù)飛速發(fā)展的今天,語音識別芯片作為人機(jī)交互的重要橋梁,正逐漸成為各類智能設(shè)備不可或缺的核心部件。與傳統(tǒng)的語音芯片不同,語音
    的頭像 發(fā)表于 11-14 17:11 ?1383次閱讀

    工業(yè)物聯(lián)網(wǎng)平臺(tái)適合私有本地部署還是云端部署

    工業(yè)物聯(lián)網(wǎng)平臺(tái)的部署方式需根據(jù)企業(yè)核心需求選擇, 私有本地部署適合數(shù)據(jù)安全要求極高、需深度定制且具備技術(shù)實(shí)力的企業(yè);云端部署則更適合追求成本
    的頭像 發(fā)表于 11-12 11:42 ?428次閱讀
    工業(yè)物聯(lián)網(wǎng)平臺(tái)適合私有<b class='flag-5'>本地</b><b class='flag-5'>部署</b>還是<b class='flag-5'>云端</b><b class='flag-5'>部署</b>?

    什么是離線語音識別芯片(離線語音識別芯片有哪些優(yōu)點(diǎn))

    離線語音識別芯片,是一種集成了語音信號采集、前端處理和本地識別功能的專用集成電路,無須聯(lián)網(wǎng)也可以進(jìn)行語音
    的頭像 發(fā)表于 10-31 15:27 ?520次閱讀

    語音識別---大家怎么看呢?

    語音識別是一門交叉學(xué)科。近二十年來,語音識別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場。人們預(yù)計(jì),未來10年內(nèi),語音
    發(fā)表于 08-09 10:54

    EASY EAl Orin Nano(RK3576) whisper語音識別訓(xùn)練部署教程

    1Whisper簡介Whisper是OpenAI開源的,識別語音識別能力已達(dá)到人類水準(zhǔn)自動(dòng)語音識別系統(tǒng)。Whisper作為一個(gè)通用的
    的頭像 發(fā)表于 07-25 15:21 ?861次閱讀
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>語音</b><b class='flag-5'>識別</b>訓(xùn)練<b class='flag-5'>部署</b>教程

    能源監(jiān)測管理平臺(tái)是本地部署好還是云端部署好?

    能源監(jiān)測管理平臺(tái)本地部署云端部署各有優(yōu)劣,企業(yè)需根據(jù)自身需求和實(shí)際情況來選擇。如果企業(yè)對數(shù)據(jù)安全要求極高、網(wǎng)絡(luò)環(huán)境特殊且預(yù)算充足,本地
    的頭像 發(fā)表于 07-22 15:16 ?525次閱讀
    能源監(jiān)測管理平臺(tái)是<b class='flag-5'>本地</b>化<b class='flag-5'>部署</b>好還是<b class='flag-5'>云端</b><b class='flag-5'>部署</b>好?

    EASY EAl Orin Nano(RK3576) whisper語音識別訓(xùn)練部署教程

    Whisper是OpenAI開源的,識別語音識別能力已達(dá)到人類水準(zhǔn)自動(dòng)語音識別系統(tǒng)。Whisper作為一個(gè)通用的
    的頭像 發(fā)表于 07-17 14:55 ?1781次閱讀
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>語音</b><b class='flag-5'>識別</b>訓(xùn)練<b class='flag-5'>部署</b>教程

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量

    接口則讓語音機(jī)器人可以連接到互聯(lián)網(wǎng),實(shí)時(shí)獲取最新的信息,增強(qiáng)其智能性和交互能力。 實(shí)際應(yīng)用場景中,以智能客服語音機(jī)器人為例。SSD2351開發(fā)板可以驅(qū)動(dòng)語音
    發(fā)表于 05-28 11:36

    芯資訊|廣州唯創(chuàng)電子WTK6900P語音識別芯片:離線語音交互的革新者

    智能設(shè)備全面普及的浪潮中,語音交互技術(shù)正逐步從“云端依賴”向“本地化高效處理”演進(jìn)。廣州唯創(chuàng)電子推出的WTK6900P語音
    的頭像 發(fā)表于 05-22 09:22 ?816次閱讀
    芯資訊|廣州唯創(chuàng)電子WTK6900P<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片:離線<b class='flag-5'>語音</b>交互的革新者

    DeepSeek R1模型本地部署與產(chǎn)品接入實(shí)操

    針對VS680/SL1680系列大算力芯片,我們的研發(fā)團(tuán)隊(duì)正在研究將蒸餾后的輕量級DeepSeek模型(DeepSeek-R1-Distill-Qwen-1.5B)部署到SOC本地,以便應(yīng)用于相關(guān)
    的頭像 發(fā)表于 04-19 16:32 ?772次閱讀
    DeepSeek R1模型<b class='flag-5'>本地</b><b class='flag-5'>部署</b>與產(chǎn)品接入實(shí)操

    智能語音交互方案客服領(lǐng)域的應(yīng)用

    著客服行業(yè)的面貌,為企業(yè)和用戶帶來了全新的體驗(yàn)。 語音識別模型優(yōu)化私部署 方案:精準(zhǔn)高效,定制專屬服務(wù) 語音識別技術(shù)作為智能
    的頭像 發(fā)表于 04-11 14:35 ?811次閱讀

    依托raksmart服務(wù)器多種系統(tǒng)上本地部署deepseek注意事項(xiàng)

    RAKsmart服務(wù)器上本地部署DeepSeek時(shí),需根據(jù)不同的操作系統(tǒng)和環(huán)境做好全面適配。以下是關(guān)鍵注意事項(xiàng)及分步指南,主機(jī)推薦小編為您整理發(fā)布依托raksmart服務(wù)器多種系統(tǒng)
    的頭像 發(fā)表于 03-19 11:25 ?904次閱讀

    新品發(fā)布|啟英泰倫聯(lián)合啟明云端推出離在線語音大模型方案

    當(dāng)前,生成式大模型正以顛覆性姿態(tài)重塑人機(jī)交互的邊界,并逐漸向終端場景滲透。然而,云端大模型落地終端場景時(shí)面臨兩大挑戰(zhàn):1.真實(shí)噪聲場景下容易聽不清、誤識別,影響交互準(zhǔn)確性;2.
    的頭像 發(fā)表于 03-11 14:07 ?1296次閱讀
    新品發(fā)布|啟英泰倫聯(lián)合啟明<b class='flag-5'>云端</b>推出離在線<b class='flag-5'>語音</b>大模型方案