91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

快商通李稀敏:近場聲紋識別將普及,本地化的AI能力是剛需

智能生物識別說 ? 2019-11-01 18:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

快商通公檢法事業(yè)線總經(jīng)理李稀敏博士就“人機(jī)語音交互是否必須要先喚醒和離線語音技術(shù)在本地端上的實(shí)現(xiàn)是否未來的趨勢”為題進(jìn)行分享:


01 人機(jī)交互必須要先喚醒嗎?


語音交互流程被劃分為五個(gè)環(huán)節(jié) – 喚醒、響應(yīng)、輸入、理解、反饋。其中喚醒是每一次用戶與語音產(chǎn)品交互的第一個(gè)接觸點(diǎn),喚醒環(huán)節(jié)的體驗(yàn)在整個(gè)語音交互流程中至關(guān)重要,它的體驗(yàn)好壞將直接影響用戶對產(chǎn)品的“第一印象”。就目前市面上常見的語音交互產(chǎn)品來說,一個(gè)眼神或者一個(gè)動(dòng)作還不能引起它的注意,因此需要定義一個(gè)將產(chǎn)品從待機(jī)狀態(tài)切換到工作狀態(tài)的詞語,即所謂的“喚醒詞”。比如“小度小度”“若琪”“叮咚叮咚”。那么,人機(jī)交互我們必須要先喚醒嗎?李稀敏認(rèn)為:隨著技術(shù)場景越來越成熟,當(dāng)機(jī)器具備足夠的智能化,機(jī)器是可以不需要喚醒詞,就像跟人對話一樣自然。但距離無喚醒交互的實(shí)現(xiàn),還有一段路要走。從聲紋識別的角度來看有兩種場景,第一種,用喚醒詞作為命令詞,設(shè)備在休眠或鎖屏狀態(tài)下也能檢測到用戶的聲音(設(shè)定的語音指令,即喚醒詞),讓處于休眠狀態(tài)下的設(shè)備直接進(jìn)入到等待指令狀態(tài),開啟語音交互第一步。第二種設(shè)置一個(gè)“喚醒詞”,這時(shí)候我們可以將設(shè)備喚醒比作水龍頭的開關(guān),如果水龍頭沒有開關(guān)的話,摁都摁不住是吧?就像智能音響交互的時(shí)候,設(shè)備亂七八糟的識別了一大堆語音,這個(gè)東西出來摁都摁不住,所以人機(jī)交互還是要有“喚醒”步驟。但是否需要喚醒詞,還需根據(jù)場景的需求來決定,沒有所謂的通用答案。


02 聲紋識別是否可以改進(jìn)人機(jī)交互方式?


最近一段時(shí)間很火的蘋果AirPods,華為榮耀FlyPods Pro都在主打身份識別。目前的喚醒大家都是在用這個(gè)特定的喚醒詞,如果改用聲紋識別,是否可以改變這種交互的方式?李稀敏認(rèn)為:在不同的場景中,最佳的喚醒的方式可以不同,但在耳機(jī)等可穿戴設(shè)備的場景中,聲紋識別因其高易用性、非接觸、不需要前置設(shè)備等優(yōu)點(diǎn),相對其他生物識別技術(shù),能夠更好的解決該場景的實(shí)際身份認(rèn)證的問題,進(jìn)而改進(jìn)人機(jī)交互體驗(yàn)。


03 實(shí)現(xiàn)本地端離線語音技術(shù)是未來趨勢?


“在貼身的耳機(jī),也就是本地端做聲紋識別,其實(shí)避免了一個(gè)技術(shù)問題:遠(yuǎn)場識別”,李稀敏解釋。遠(yuǎn)場的文本無關(guān)身份識別由于復(fù)雜的信號傳播環(huán)境等原因,是目前的技術(shù)難點(diǎn),還有很長的路要走。但相對來說,近場的身份識別,在本地端可以通過技術(shù)手段快速解決問題。所以,接下來本地端近場身份識別能夠大面積普及,在今后很多場景,我們隨身攜帶一個(gè)小設(shè)備都能夠直接識別身份。


關(guān)于本地化是不是未來的趨勢。從數(shù)據(jù)的角度來講,很多人是不希望自己的聲音信息,人臉信息,通過設(shè)備或各種隱私接口上傳到云端且變?yōu)椴豢煽?。李稀敏認(rèn)為,從這個(gè)角度來看,本地化的AI的能力是一個(gè)剛需。


04 大熱的語音合成技術(shù)TTS,跟聲紋識別PK,誰會(huì)更勝一籌?


對于使用錄音、合成語音等攻擊手段的識別,是聲紋識別必須要解決的問題??焐掏ㄔ跒殂y行、保險(xiǎn)等金融客戶設(shè)計(jì)聲紋身份識別系統(tǒng),這個(gè)是第一個(gè)需要解決的問題。


目前,對聲紋認(rèn)證的攻擊,大概分成幾類,第一類是模仿,第二類是語音合成或者語音轉(zhuǎn)換,第三類是錄音重放。根據(jù)實(shí)際欺詐的手段來講,目前主要是防錄音重放。其中,錄音重放是最難檢測的。解決了錄音重放問題,就相當(dāng)于解決了語音拼接和語音合成問題。


快商通在這一點(diǎn)上做得比較領(lǐng)先,我們的首席科學(xué)家李海洲院士,團(tuán)隊(duì)在ASVspoof2017自動(dòng)說話人驗(yàn)證欺騙和對策挑戰(zhàn)賽中獲得第一名。包括在許多銀行客戶的測試中,我們都是100%檢測到錄音重放。


另外分享個(gè)故事,除了算法和系統(tǒng)本身領(lǐng)先,解決方案還需要數(shù)據(jù)驅(qū)動(dòng),大量的錄音樣本、各種設(shè)備、各種采樣率、各種時(shí)長、各種環(huán)境的訓(xùn)練。1年前,我們在北京幾家銀行做測試的時(shí)候,白天我們在地鐵上,在最嘈雜的環(huán)境下,各種測試都攻不破。


但晚上,我住在清華大學(xué)里,在10:00、11:00左右夜深人靜、一點(diǎn)聲音都沒有的時(shí)候,掏出了我們的APP進(jìn)行測試,卻被攻破了。說明當(dāng)時(shí)我們的訓(xùn)練數(shù)據(jù)沒有覆蓋到無雜音、無噪音的情況,當(dāng)然,現(xiàn)在已經(jīng)覆蓋到了(笑)。


關(guān)于快商通:


快商通是一家從事人工智能技術(shù)與應(yīng)用研發(fā)的創(chuàng)新型科技企業(yè),在聲紋識別、自然語言處理、深度學(xué)習(xí)、大數(shù)據(jù)等方面擁有原創(chuàng)核心競爭力。


面向企業(yè)服務(wù)、金融、公檢法、醫(yī)療、物聯(lián)網(wǎng)等領(lǐng)域,為全球客戶提供包含人工智能算法、應(yīng)用軟件、平臺(tái)軟件及內(nèi)嵌人工智能功能的軟硬件一體化解決方案。致力于持續(xù)為客戶創(chuàng)造價(jià)值,讓人工智能走進(jìn)每個(gè)人的生活。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    使用NORDIC AI的好處

    運(yùn)動(dòng)/手勢識別、可穿戴健康監(jiān)測、預(yù)測性維護(hù)、樓宇與工業(yè)傳感網(wǎng)絡(luò)本地分析、聲音/關(guān)鍵詞/圖像識別等,都有官方明確提到的典型用例。[Unlock Edge AI 博客; Nordic E
    發(fā)表于 01-31 23:16

    小鵬汽車正式啟動(dòng)其馬來西亞本地化生產(chǎn)項(xiàng)目

    近日,小鵬汽車與馬來西亞EPMB集團(tuán)簽約,正式啟動(dòng)其馬來西亞本地化生產(chǎn)項(xiàng)目。這是繼印尼、奧地利之后,小鵬在全球布局的第三個(gè)本地化生產(chǎn)項(xiàng)目。
    的頭像 發(fā)表于 12-18 14:16 ?515次閱讀

    打造本地化智能的“最強(qiáng)大腦”, 米爾RK3576 AI邊緣計(jì)算盒

    在人工智能與邊緣計(jì)算深度融合的浪潮中,本地化智能需求正重塑產(chǎn)業(yè)格局。米爾電子推出的RK3576邊緣計(jì)算盒,具備高算力、低功耗與強(qiáng)擴(kuò)展性,憑借其卓越的硬件架構(gòu)與多場景適配能力,正成為推動(dòng)工業(yè)視覺
    的頭像 發(fā)表于 12-11 08:05 ?842次閱讀
    打造<b class='flag-5'>本地化</b>智能的“最強(qiáng)大腦”, 米爾RK3576 <b class='flag-5'>AI</b>邊緣計(jì)算盒

    涂鴉網(wǎng)關(guān)本地化進(jìn)階能力來襲!周期/區(qū)間/批量聯(lián)動(dòng)全掌控,解鎖高階場景應(yīng)用

    在物聯(lián)網(wǎng)自動(dòng)場景體系中,網(wǎng)關(guān)是連接云端與終端設(shè)備的關(guān)鍵中樞,其本地化處理能力直接決定場景聯(lián)動(dòng)的可靠性與精細(xì)化水平。然而,傳統(tǒng)自動(dòng)場景多依賴云端判定與指令下發(fā),在斷網(wǎng)自控、復(fù)雜邏輯運(yùn)
    的頭像 發(fā)表于 11-27 18:27 ?493次閱讀
    涂鴉網(wǎng)關(guān)<b class='flag-5'>本地化</b>進(jìn)階<b class='flag-5'>能力</b>來襲!周期/區(qū)間/批量聯(lián)動(dòng)全掌控,解鎖高階場景應(yīng)用

    發(fā)布元服務(wù)配置本地化基礎(chǔ)信息(應(yīng)用名稱、圖標(biāo))

    您可以添加元服務(wù)支持的語言,并配置對應(yīng)語言的本地化信息。 例如,當(dāng)您設(shè)置簡體中文為默認(rèn)語言,并且只配置中文的本地化信息,那么元服務(wù)在所有設(shè)置的發(fā)布國家或地區(qū)的信息都將顯示中文。如果您還設(shè)置了英文
    發(fā)表于 10-24 17:42

    破解非洲數(shù)字鴻溝:傳音控股以本地化創(chuàng)新與教育合作助力可持續(xù)發(fā)展

    科技出海企業(yè)代表傳音控股繼續(xù)秉持“全球視野,本地化創(chuàng)新”理念,通過技術(shù)研發(fā)與公益投入雙輪驅(qū)動(dòng),助力非洲跨越數(shù)字鴻溝。深耕本地化創(chuàng)新,傳音賦能非洲數(shù)字發(fā)展在非洲
    的頭像 發(fā)表于 09-25 16:46 ?1181次閱讀
    破解非洲數(shù)字鴻溝:傳音控股以<b class='flag-5'>本地化</b>創(chuàng)新與教育合作助力可持續(xù)發(fā)展

    小鵬汽車首個(gè)歐洲本地化生產(chǎn)項(xiàng)目啟動(dòng)

    小鵬汽車正式官宣歐洲本地化生產(chǎn)的重要規(guī)劃,與位于奧地利格拉茨的麥格納工廠展開深度合作,借助該工廠現(xiàn)有的成熟生產(chǎn)線,大力推動(dòng)電動(dòng)汽車在歐洲的本地化生產(chǎn)進(jìn)程。
    的頭像 發(fā)表于 09-15 15:02 ?1014次閱讀

    能源監(jiān)測管理平臺(tái)是本地化部署好還是云端部署好?

    能源監(jiān)測管理平臺(tái)本地化部署和云端部署各有優(yōu)劣,企業(yè)根據(jù)自身需求和實(shí)際情況來選擇。如果企業(yè)對數(shù)據(jù)安全要求極高、網(wǎng)絡(luò)環(huán)境特殊且預(yù)算充足,本地化部署可能更合適;若企業(yè)注重靈活性、成本效益和便捷訪問,云端
    的頭像 發(fā)表于 07-22 15:16 ?507次閱讀
    能源監(jiān)測管理平臺(tái)是<b class='flag-5'>本地化</b>部署好還是云端部署好?

    傳音控股本地化戰(zhàn)略的跨區(qū)域成功:驅(qū)動(dòng)?xùn)|南亞、南亞數(shù)字浪潮 ?

    全球新興市場智能終端競爭進(jìn)入新階段,傳音控股繼續(xù)憑借“本地化”戰(zhàn)略優(yōu)勢書寫著從非洲到全球的擴(kuò)張傳奇。與印尼電信巨頭IOH達(dá)成戰(zhàn)略合作、優(yōu)化游戲體驗(yàn)、研發(fā)全膚色影像技術(shù),傳音正在將成熟的本地化模式成功
    的頭像 發(fā)表于 07-18 16:09 ?1050次閱讀
    傳音控股<b class='flag-5'>本地化</b>戰(zhàn)略的跨區(qū)域成功:驅(qū)動(dòng)?xùn)|南亞、南亞數(shù)字<b class='flag-5'>化</b>浪潮 ?

    AI+能源數(shù)字破局者故事5:斯倫貝謝 x IBM 咨詢之 “全球經(jīng)營與本地化適配”

    斯倫貝謝與 IBM 的合作建立在技術(shù)專長、交付能力本地化支持的基礎(chǔ)上,IBM 的強(qiáng)大技術(shù)實(shí)力和本地經(jīng)驗(yàn),使其成為斯倫貝謝推動(dòng)數(shù)字轉(zhuǎn)型的重要合作伙伴
    的頭像 發(fā)表于 07-17 19:02 ?1396次閱讀

    施耐德電氣與奇安信共建技術(shù)本地化創(chuàng)新中心

    ?在施耐德電氣技術(shù)本地化創(chuàng)新日上 ; 施耐德電氣與奇安信集團(tuán)宣布成立 施耐德電氣(中國)技術(shù)本地化創(chuàng)新中心。 該中心將提供 針對國產(chǎn)基礎(chǔ)軟硬件的深度適配服務(wù),以信息技術(shù)共創(chuàng)和生態(tài)協(xié)同為核心 ,更好
    的頭像 發(fā)表于 07-10 19:01 ?1014次閱讀
    施耐德電氣與奇安信共建技術(shù)<b class='flag-5'>本地化</b>創(chuàng)新中心

    開源鴻蒙構(gòu)建全棧AI端側(cè)能力體系

    當(dāng)前,AI技術(shù)正加速向終端融合,帶來交互方式革新、智能體驗(yàn)升級與數(shù)據(jù)本地化保障等重大機(jī)遇,推動(dòng)AI手機(jī)、AI PC(人工智能個(gè)人計(jì)算機(jī))、機(jī)器人等新形態(tài)終端快速涌現(xiàn)。
    的頭像 發(fā)表于 06-12 14:39 ?1450次閱讀

    意法半導(dǎo)體攜手華虹打造STM32全流程本地化供應(yīng)鏈

    ????????在全球半導(dǎo)體產(chǎn)業(yè)加速變革的今天,供應(yīng)鏈的穩(wěn)定性與本地化能力成為企業(yè)競爭力的核心要素。在剛剛結(jié)束的STM32峰會(huì)上,意法半導(dǎo)體執(zhí)行副總裁、中國區(qū)總裁曹志平先生與合作伙伴華虹半導(dǎo)體及多位
    的頭像 發(fā)表于 05-26 09:51 ?1267次閱讀

    DigiKey 應(yīng)用與技術(shù)門戶平臺(tái)已針對亞太地區(qū)進(jìn)行了本地化

    品類齊全且可立即發(fā)貨的產(chǎn)品。DigiKey 在亞太地區(qū)提供專屬應(yīng)用與技術(shù)平臺(tái)。該平臺(tái)提供本地化的在線資源,旨在助力工程師和創(chuàng)新者,提供專業(yè)技術(shù)資源、精選產(chǎn)品信息和互動(dòng)學(xué)習(xí)內(nèi)容。 DigiKey 應(yīng)用與技術(shù)平臺(tái)提供自動(dòng)與控制、物聯(lián)網(wǎng)、邊緣
    發(fā)表于 05-23 16:37 ?1228次閱讀

    博實(shí)結(jié)完成DeepSeek大模型本地化部署

    近日,公司完成DeepSeek R1 671B大模型本地化部署。通過構(gòu)建自主可控的AI基礎(chǔ)設(shè)施,公司同步實(shí)現(xiàn)研發(fā)智能升級、研發(fā)成本重構(gòu)、數(shù)據(jù)安全閉環(huán)與應(yīng)用場景突破,為產(chǎn)業(yè)智能賦能。
    的頭像 發(fā)表于 03-19 16:31 ?1332次閱讀