91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

三星無聲語音助手專利解密:可以完成精準(zhǔn)語音識(shí)別任務(wù)

ss ? 來源:愛集微APP ? 作者:愛集微APP ? 2021-02-12 15:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【嘉德點(diǎn)評(píng)】三星發(fā)明的可以完成精準(zhǔn)語音識(shí)別任務(wù)的語音識(shí)別助手,在交互時(shí)無需發(fā)出語音,僅通過用戶少量選擇操作就可以完成復(fù)雜的交互任務(wù),因此,可以簡(jiǎn)便且準(zhǔn)確地采用語音識(shí)別方式來實(shí)現(xiàn)交互任務(wù)。

集微網(wǎng)消息,在2019年,三星就曾預(yù)告過新的“人造人”NEON助手,并表示NEON可以像真正的人類一樣進(jìn)行對(duì)話,并有一定的感知能力。NEON的網(wǎng)站上宣傳其外觀和行為都像真實(shí)的人類,能夠表現(xiàn)出情感和智慧,而據(jù)相關(guān)消息,三星最終將隨三星Galaxy S21 Ultra獨(dú)家發(fā)售這款數(shù)字助手。

數(shù)字助手首先也是一款手機(jī)助手軟件,目前,智能手機(jī)能夠提供各種類型的應(yīng)用服務(wù),其中就包括手機(jī)助手軟件,用戶可以通過語音、文字等方式與智能手機(jī)之間進(jìn)行交互,智能手機(jī)通過該語音識(shí)別助手軟件識(shí)別語音后,提供對(duì)應(yīng)的應(yīng)用服務(wù)。

智能手機(jī)識(shí)別語音的功能可以有三種方式:交互任務(wù)型、知識(shí)問答型及閑聊型。其中,交互任務(wù)型語音識(shí)別方式使得用戶可以通過直接的語音輸入,由智能手機(jī)識(shí)別該語音,完成與智能手機(jī)的應(yīng)用服務(wù)之間的交互意圖,而無需進(jìn)行多次語音識(shí)別界面的操作。

但是,智能手機(jī)提供的交互任務(wù)型語音識(shí)別方式對(duì)用戶來說,使用率并不高,這是因?yàn)橛脩粼谕ㄟ^語音操控智能手機(jī)時(shí),存在以下缺點(diǎn):1)公眾場(chǎng)合不適合使用語音,有隱私問題;2) 智能手機(jī)處于嘈雜的遠(yuǎn)程環(huán)境下,語音識(shí)別的效果不佳;3)因?yàn)橛脩舭l(fā)音不準(zhǔn)確,形同意思的表述方式多樣等因素,語音識(shí)別和語音理解的準(zhǔn)確率還需要提高;4)有些用戶不習(xí)慣使用智能手機(jī)提供的語音識(shí)別界面。

那么,智能手機(jī)該如何在這些條件下簡(jiǎn)便且準(zhǔn)確地采用語音識(shí)別方式實(shí)現(xiàn)交互任務(wù)呢?為此,三星在2019年9月27日申請(qǐng)了一項(xiàng)名為“一種采用語音識(shí)別方式實(shí)現(xiàn)交互任務(wù)的方法及系統(tǒng)”的發(fā)明專利(申請(qǐng)?zhí)枺?01910921533.6),申請(qǐng)人為三星電子(中國(guó))研發(fā)中心和三星電子株式會(huì)社。

根據(jù)該專利目前公開的資料,讓我們一起來看看這項(xiàng)應(yīng)用于智能設(shè)備的語音識(shí)別方法及系統(tǒng)吧。

如上圖,為該專利中發(fā)明的采用語音識(shí)別方式實(shí)現(xiàn)交互任務(wù)的方法流程示意圖,首先,系統(tǒng)會(huì)基于當(dāng)前環(huán)境進(jìn)行語音識(shí)別來得到文本以及語義信息,基于得到的文本以及語義信息,來確定對(duì)應(yīng)的上下文信息,且劃分不同的場(chǎng)景,基于不同的場(chǎng)景來在系統(tǒng)中匹配不同的語音技能推薦表。

這種利用語音技能推薦表的方式,可以更加準(zhǔn)確的應(yīng)對(duì)不同的場(chǎng)景,通過事先準(zhǔn)備好豐富的語料庫,就可以非常人性化的與用戶進(jìn)行對(duì)話以及完成相應(yīng)的操作。而當(dāng)要實(shí)現(xiàn)交互任務(wù)時(shí),則會(huì)根據(jù)語音技能推薦表執(zhí)行智能手機(jī)的交互任務(wù)。同時(shí),由于是智能助手主動(dòng)分析用戶所處場(chǎng)景,并主動(dòng)提供相關(guān)的操作服務(wù),因此無需用戶主動(dòng)發(fā)起語音喚醒,而是由語音助手主動(dòng)為用戶提供相關(guān)服務(wù),只需用戶進(jìn)行選擇即可。

如上圖,為這種采用語音識(shí)別方式實(shí)現(xiàn)交互任務(wù)的方法子流程圖,當(dāng)用戶喚醒語音助手插件模塊時(shí),語音助手插件模塊被觸發(fā),該模塊通知語言輸入信息采集模塊啟動(dòng)信息采集,信息采集模塊通過上下文感知模塊獲取到當(dāng)前的環(huán)境信息,再向語音助手插件模塊發(fā)送請(qǐng)求,來獲取從用戶語音識(shí)別得到的文本,以及做自然語言理解后的語義信息。

之后,語言輸入信息采集模塊將采集到的文本、語義信息及當(dāng)前的環(huán)境信息傳輸給語言技能生成模塊,由此來生成語言技能庫,并通知語言技能推薦模塊。

語言技能推薦模塊在特定情況下可以啟動(dòng),將大量不同的上下文劃分到若干類場(chǎng)景中,對(duì)每個(gè)場(chǎng)景生成相應(yīng)的語言技能推薦表。

如上圖,為在手機(jī)上使用語言技能推薦表的展示圖,該款語音助手插件模塊為Bixby,當(dāng)每次都調(diào)用Bixby時(shí),都會(huì)顯示出語言技能推薦表,并且場(chǎng)景不同,該語言技能推薦表中的推薦技能偶讀不同。

例如,經(jīng)過學(xué)習(xí)后,如果用戶打開手機(jī)并且喚醒了Bixby,則就可以觸發(fā)語言技能推薦表的展示,當(dāng)用戶選擇某條推薦的語言技能時(shí),將該語言技能推薦表中的文本用作用戶語言輸入識(shí)別的結(jié)果,以完成后續(xù)用戶的指令。

以上就是三星發(fā)明的可以完成精準(zhǔn)語音識(shí)別任務(wù)的靜默式語音識(shí)別助手,其在實(shí)現(xiàn)交互任務(wù)時(shí),基于當(dāng)前環(huán)境下對(duì)語音識(shí)別得到文本以及語音信息,在交互時(shí)無需發(fā)出語音,僅通過用戶少量選擇操作就可以完成復(fù)雜的交互任務(wù),因此可以簡(jiǎn)便且準(zhǔn)確地采用語音識(shí)別方式來實(shí)現(xiàn)交互任務(wù)。

責(zé)任編輯:xj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 三星電子
    +關(guān)注

    關(guān)注

    34

    文章

    15894

    瀏覽量

    183111
  • 語音助手
    +關(guān)注

    關(guān)注

    7

    文章

    241

    瀏覽量

    27606
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    語音識(shí)別IC分類,語音識(shí)別芯片的工作原理

    語音識(shí)別芯片,也叫語音識(shí)別集成電路,是一種集聲音存儲(chǔ)、播放、錄音及語音識(shí)別功能于一體的專用芯片。
    的頭像 發(fā)表于 01-14 15:22 ?239次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>IC分類,<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>芯片的工作原理

    語音識(shí)別芯片有哪些(語音識(shí)別芯片AT680系列)

    在人工智能技術(shù)飛速發(fā)展的今天,語音識(shí)別芯片作為人機(jī)交互的重要橋梁,正逐漸成為各類智能設(shè)備不可或缺的核心部件。與傳統(tǒng)的語音芯片不同,語音識(shí)別
    的頭像 發(fā)表于 11-14 17:11 ?1368次閱讀

    什么是離線語音識(shí)別芯片(離線語音識(shí)別芯片有哪些優(yōu)點(diǎn))

    離線語音識(shí)別芯片,是一種集成了語音信號(hào)采集、前端處理和本地識(shí)別功能的專用集成電路,無須聯(lián)網(wǎng)也可以進(jìn)行語音
    的頭像 發(fā)表于 10-31 15:27 ?506次閱讀

    如何選擇合適的語音識(shí)別芯片型號(hào)

    語音識(shí)別芯片(又稱語音識(shí)別IC)是現(xiàn)代智能設(shè)備的核心組件,與傳統(tǒng)語音芯片相比,其最大特點(diǎn)是能夠主動(dòng)識(shí)別
    的頭像 發(fā)表于 10-30 16:32 ?611次閱讀

    基于開源鴻蒙的語音識(shí)別語音合成應(yīng)用開發(fā)樣例

    本期內(nèi)容由AI Model SIG提供,介紹了在開源鴻蒙中,利用sherpa_onnx開源方庫進(jìn)行ASR語音識(shí)別與TTS語音合成應(yīng)用開發(fā)的流程。
    的頭像 發(fā)表于 08-25 14:26 ?4115次閱讀
    基于開源鴻蒙的<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>及<b class='flag-5'>語音</b>合成應(yīng)用開發(fā)樣例

    瑞芯微RK3576語音識(shí)別算法

    1.語音識(shí)別簡(jiǎn)介語音識(shí)別技術(shù),也被稱為自動(dòng)語音識(shí)別(AutomaticSpeechRecogni
    的頭像 發(fā)表于 08-15 15:13 ?2184次閱讀
    瑞芯微RK3576<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>算法

    語音識(shí)別---大家怎么看呢?

    語音識(shí)別是一門交叉學(xué)科。近二十年來,語音識(shí)別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場(chǎng)。人們預(yù)計(jì),未來10年內(nèi),語音
    發(fā)表于 08-09 10:54

    EASY EAl Orin Nano(RK3576) whisper語音識(shí)別訓(xùn)練部署教程

    英語語音識(shí)別上達(dá)到接近人類水平的魯棒性和準(zhǔn)確性。Whisper還可以進(jìn)行多語言語音識(shí)別、語音翻譯
    的頭像 發(fā)表于 07-25 15:21 ?851次閱讀
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>訓(xùn)練部署教程

    EASY EAl Orin Nano(RK3576) whisper語音識(shí)別訓(xùn)練部署教程

    Whisper是OpenAI開源的,識(shí)別語音識(shí)別能力已達(dá)到人類水準(zhǔn)自動(dòng)語音識(shí)別系統(tǒng)。Whisper作為一個(gè)通用的
    的頭像 發(fā)表于 07-17 14:55 ?1758次閱讀
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>訓(xùn)練部署教程

    芯知識(shí)|語音芯片發(fā)碼無聲解析:上電無聲、連發(fā)指令才響的大根源及解決之道

    在嵌入式語音方案開發(fā)中,廣州唯創(chuàng)電子語音芯片(如WT系列)以其高性價(jià)比和易用性廣受青睞。但當(dāng)開發(fā)者遭遇“上電發(fā)碼無聲”或“必須連發(fā)兩次指令才有聲音”的問題時(shí),往往陷入調(diào)試?yán)Ь场1疚膶⑸钊肫饰鲞@些現(xiàn)象
    的頭像 發(fā)表于 06-19 09:14 ?918次閱讀
    芯知識(shí)|<b class='flag-5'>語音</b>芯片發(fā)碼<b class='flag-5'>無聲</b>解析:上電<b class='flag-5'>無聲</b>、連發(fā)指令才響的<b class='flag-5'>三</b>大根源及解決之道

    芯知識(shí)|語音芯片“無聲之謎”:當(dāng)DACL波形正常,功放開啟卻無聲音時(shí)……

    信號(hào)“通道沖突”這一關(guān)鍵陷阱。一、無聲故障的典型表現(xiàn)與診斷盲點(diǎn)“正?!钡谋硐螅汗こ處熡檬静ㄆ鳈z測(cè)語音芯片(如廣州唯創(chuàng)電子某型號(hào))的關(guān)鍵引腳:供電電壓穩(wěn)定,邏輯通信正常
    的頭像 發(fā)表于 06-13 08:53 ?1265次閱讀
    芯知識(shí)|<b class='flag-5'>語音</b>芯片“<b class='flag-5'>無聲</b>之謎”:當(dāng)DACL波形正常,功放開啟卻<b class='flag-5'>無聲</b>音時(shí)……

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量

    的四核1.4GHz處理器具備強(qiáng)勁的運(yùn)算性能,能夠高效處理語音機(jī)器人運(yùn)行過程中的復(fù)雜任務(wù)。語音識(shí)別和合成需要大量的計(jì)算資源,該處理器可以快速對(duì)
    發(fā)表于 05-28 11:36

    回收三星S21指紋排線 適用于三星系列指紋模組

    深圳帝歐電子回收三星S21指紋排線,收購(gòu)適用于三星S21指紋模組?;厥?b class='flag-5'>三星指紋排線,收購(gòu)三星指紋排線,全國(guó)高價(jià)回收三星指紋排線,專業(yè)求購(gòu)指紋
    發(fā)表于 05-19 10:05

    三星在4nm邏輯芯片上實(shí)現(xiàn)40%以上的測(cè)試良率

    方式來改進(jìn)電容器表現(xiàn),但穩(wěn)定性尚未達(dá)到預(yù)期水平,很可能會(huì)拖慢 1c nm 進(jìn)度。 半導(dǎo)體業(yè)內(nèi)人士表示,“從三星電子的角度來看,剩下的任務(wù)是穩(wěn)定搭載在HBM上的DRAM以及封裝技術(shù)。”
    發(fā)表于 04-18 10:52

    廠家芯資訊|WTK6900系列語音識(shí)別芯片:精準(zhǔn)交互,智創(chuàng)未來

    “芯片性能+算法優(yōu)化+場(chǎng)景適配”位一體的解決方案,將標(biāo)準(zhǔn)方案識(shí)別率提升至97%,為行業(yè)樹立技術(shù)標(biāo)桿。一、WTK6900系列:破解語音識(shí)別難題的核心利器1.高性能
    的頭像 發(fā)表于 03-19 09:12 ?1227次閱讀
    廠家芯資訊|WTK6900系列<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>芯片:<b class='flag-5'>精準(zhǔn)</b>交互,智創(chuàng)未來