91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于聲智穿透式遠(yuǎn)場語音技術(shù)介紹

聲智科技 ? 來源:djl ? 作者:聲智科技 ? 2019-08-13 09:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2018年11月1日,騰訊全球合作伙伴大會,以“開放·共生”為主題,在南京開幕。聲智科技聯(lián)合創(chuàng)始人兼首席知識官常樂受邀出席,并與來自全球的科技、文化與商業(yè)領(lǐng)域數(shù)百位國際大咖和萬名行業(yè)精英,以及騰訊微信、QQ、騰訊云、騰訊開放平臺、騰訊企鵝號、騰訊應(yīng)用寶、騰訊AI Lab、騰訊車聯(lián)、騰訊自動駕駛、騰訊微瓴互聯(lián)、騰訊動漫等業(yè)務(wù)條線的合作伙伴,共商未來人機(jī)互聯(lián)戰(zhàn)略布局與發(fā)展之道。

聲智科技聯(lián)合創(chuàng)始人兼首席知識官常樂表示:“未來,我們將置身于人工智能語音交互時代,繼續(xù)朝著‘語音即搜索,語言即服務(wù)’方向演進(jìn)。物理世界與數(shù)字世界的有機(jī)融合會進(jìn)一步加速,日益形成更加智能化的萬物互聯(lián)的人機(jī)世界。實現(xiàn)這一美好智能圖景的關(guān)鍵在于,實現(xiàn)智能語音交互在更多真實復(fù)雜場景中的應(yīng)用與落地。聲智科技,自2017年初成為騰訊人工智能生態(tài)合作伙伴以來,依托聲智科技自主研發(fā)的軟硬件一體的遠(yuǎn)場語音交互技術(shù)勢能,先后為騰訊打造了騰訊智能音箱、智能車機(jī)系統(tǒng)以及全球首款王者榮耀智能機(jī)器人等產(chǎn)品,助力騰訊深化在家居、車載和機(jī)器人三大領(lǐng)域的人工智能布局與落地?!?/p>

全球首創(chuàng)的穿透式遠(yuǎn)場語音交互解決方案

王者榮耀智能機(jī)器人,游戲人物戰(zhàn)神呂布為原型,是國內(nèi)首款人工智能與游戲結(jié)合的智能機(jī)器人。搭載聲智科技為騰訊獨家定制的全球首創(chuàng)的穿透式遠(yuǎn)場語音交互解決方案,采用全球首款人偶型音腔結(jié)構(gòu)設(shè)計,由獨立的人偶和底座兩部分構(gòu)成,底座裝有旋轉(zhuǎn)裝置,人偶可以追隨玩家用戶的聲源,并且旋轉(zhuǎn)定位;通過獨家的6麥環(huán)形倒置麥克風(fēng)陣列(Inverse Array)設(shè)計,內(nèi)置穿透式波達(dá)方向估計(Penetrated DOA),動態(tài)聲場的回聲消除(Vibrated AEC)等獨家定制的AI聲學(xué)算法,成就了具備“聽”、“說”感知能力的AI游戲達(dá)人——王者榮耀智能機(jī)器人!在騰訊全球合作伙伴大會上,王者榮耀智能機(jī)器人驚艷亮相展區(qū),為現(xiàn)場觀眾帶來了真實不凡的語音交互體驗。

(1)6麥環(huán)形倒置麥克風(fēng)陣列(InverseArray)

為了戰(zhàn)斗時,給游戲玩家身臨其境的聽覺享受,王者榮耀機(jī)器人將揚聲器設(shè)置于人偶的頭部。區(qū)別于常規(guī)智能語音設(shè)備(比如音箱、機(jī)頂盒)麥克風(fēng)陣列置于頂端、揚聲器位于底部的“上聽下說”且“聽說一體”的圓柱或立方體的中空音腔結(jié)構(gòu),王者榮耀智能機(jī)器人的麥克風(fēng)陣列設(shè)計位置只能置于底座,從而形成獨特的“下聽上說”且“聽說分離”的不規(guī)則非中空音腔結(jié)構(gòu)。這樣的結(jié)構(gòu)設(shè)計,也給麥克風(fēng)陣列的結(jié)構(gòu)設(shè)計與聲學(xué)AI算法適配帶來了巨大的難度。

同時,為了讓王者榮耀機(jī)器人可以隨時定位玩家位置,底盤設(shè)置了旋轉(zhuǎn)電機(jī)裝置,電機(jī)極為靠近麥克風(fēng)陣列,當(dāng)人偶被喚醒后進(jìn)行大角度旋轉(zhuǎn)時,會產(chǎn)生電機(jī)噪音,影響麥克風(fēng)陣列的準(zhǔn)確拾音。

為此,聲智科技為騰訊的王者榮耀機(jī)器人量身研制了“倒置麥克風(fēng)陣列(Inverse Array)”技術(shù)?;诼曋强萍级ㄖ蒲邪l(fā)的6麥環(huán)形的倒置麥克風(fēng)陣列,進(jìn)一步加強(qiáng)麥克風(fēng)陣列的聲音信號處理能力,對抗人偶機(jī)器人對于麥克風(fēng)陣列的遮擋,以及其產(chǎn)生的聲反射和聲衍射的干擾,有效抑制自噪聲和其他外部噪音。在真實的環(huán)境中,王者榮耀智能機(jī)器人可拾取3-5米遠(yuǎn)場距離聲音,并實現(xiàn)的360度全方位的語音喚醒與識別。

(2)穿透式波達(dá)方向估計(PenetratedDOA)

王者榮耀智能機(jī)器人獨特的設(shè)計,使人偶身體處在麥克風(fēng)陣列正上方,成為直接障礙物,形成了大量因不規(guī)則外形的人偶身體產(chǎn)生的聲反射和聲衍射,導(dǎo)致了多徑傳播情況的普遍發(fā)生,極大影響了王者榮耀智能機(jī)器人的準(zhǔn)確定位功能。

為了應(yīng)對這些結(jié)構(gòu)性挑戰(zhàn),進(jìn)一步加強(qiáng)麥克風(fēng)陣列的聲音信號處理,有效抑制自噪聲和其他外部噪音,提高聲源測向的準(zhǔn)確度,聲智科技最新研發(fā)了穿透式波達(dá)方向估計(Penetrated DOA)技術(shù)。即使在噪音干擾大,強(qiáng)混響,強(qiáng)反射面的條件下,王者榮耀智能機(jī)器人可實現(xiàn)360度全方位的測向,定位誤差在10度以內(nèi),隨時響應(yīng)“主公”的呼喚。

(3)動態(tài)聲場的回聲消除(VibratedAEC)

傳統(tǒng)智能音箱等產(chǎn)品的設(shè)計揚聲器在底部,而王者榮耀智能機(jī)器人的揚聲器位于頭部兩側(cè),一側(cè)指向性的揚聲器為全頻段發(fā)聲器件,承擔(dān)主動發(fā)聲功能,另一側(cè)為低頻共振被動膜片被動發(fā)聲,以達(dá)到較佳的低音效果。而這樣的特殊設(shè)計,導(dǎo)致位于揚聲器垂直下方的環(huán)形麥克風(fēng)陣列單元拾取到的揚聲器系統(tǒng)自噪聲直達(dá)聲信號不一致,這無疑增大了語音喚醒與識別的難度。

而且,主動揚聲器的聲音會干擾麥克風(fēng)陣列進(jìn)行聲源側(cè)向,進(jìn)一步影響人偶旋轉(zhuǎn)角度的準(zhǔn)確性。同時,旋轉(zhuǎn)裝置的電機(jī),極為靠近麥克風(fēng)陣列,當(dāng)人偶被喚醒后進(jìn)行大角度旋轉(zhuǎn)時,產(chǎn)生的電機(jī)噪音影響麥克風(fēng)陣列的拾音。

為此,聲智科技研發(fā)了最新的動態(tài)聲場回聲消除(Vibrated AEC)技術(shù),可有效提升音樂狀態(tài)或語音合成(TTS)狀態(tài)下的喚醒率,以及在5米內(nèi)的噪音環(huán)境下的遠(yuǎn)場語音喚醒和識別率。搭配聲智科技自主知識產(chǎn)權(quán)的混響消除、寬場景高靈敏語音喚醒等專屬聲學(xué)AI算法,可在保護(hù)主方向語音不失真的前提下,去除環(huán)境中的語音等非穩(wěn)態(tài)噪聲以及空調(diào)等其他平穩(wěn)噪聲的干擾,自適應(yīng)計算混響的能量,予以抑制,去除由于房間混響造成的語音拖尾,增強(qiáng)語音清晰度,同時解決弱參考信號或者無參考信號等復(fù)雜場景中的回聲抵消(自噪聲抑制)問題,在雙工語音交互(Double Talk)的情況下仍然魯棒。

所以,王者榮耀智能機(jī)器人在保證高喚醒率的同時,能有力降低誤喚醒率,實現(xiàn)輕松喚醒,隨時打斷、隨時喚醒,無懼環(huán)境,想說就說,聲隨心動,為用戶打造完美的遠(yuǎn)場語音交互的體驗。

語音交互技術(shù)的創(chuàng)新,只有依托真實的場景,才能真正釋放技術(shù)的潛能,發(fā)揮技術(shù)的應(yīng)用價值,推動人工智能朝著普惠化方向發(fā)展,讓更多人切實地感受到科技的智能、快捷與便利。聲智科技,將繼續(xù)堅持引領(lǐng)技術(shù)服務(wù)場景的創(chuàng)新路線,攜手生態(tài)合作伙伴,為不同的垂直行業(yè)打造適配多元場景的遠(yuǎn)場語音交互系統(tǒng)方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31079

    瀏覽量

    222267
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50098

    瀏覽量

    265395
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    351

    瀏覽量

    29172
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    一文讀懂RFID近場與遠(yuǎn)天線:從原理到應(yīng)用的核心差異

    在 RFID 技術(shù)的落地場景中,小到地鐵刷卡的 “滴” ,大到倉庫整托貨物的快速盤點,決定 “能讀多遠(yuǎn)、讀得多準(zhǔn)” 的核心,正是近場與遠(yuǎn)兩類天線??此贫际莻鬟f射頻信號的 “載體”,
    的頭像 發(fā)表于 01-16 17:00 ?732次閱讀

    軟通動力發(fā)布新一代“棱鏡”穿透監(jiān)管平臺

    近年來,國資委持續(xù)加強(qiáng)穿透監(jiān)管力度,明確提出“實質(zhì)重于形式,穿透至末梢、追溯至源頭”,強(qiáng)調(diào)“監(jiān)管無死角、問責(zé)無盲區(qū)”。
    的頭像 發(fā)表于 01-14 15:06 ?467次閱讀
    軟通動力發(fā)布新一代“棱鏡”<b class='flag-5'>穿透</b><b class='flag-5'>式</b>監(jiān)管平臺

    遠(yuǎn)距離無線芯動力,穿透干擾穩(wěn)連接——深入解讀LoRa擴(kuò)頻技術(shù)

    一、什么是LoRa擴(kuò)頻?LoRa擴(kuò)頻技術(shù)是一種基于直接序列擴(kuò)頻(DSSS)的先進(jìn)無線通信技術(shù),通過將信號頻譜擴(kuò)展至更寬的帶寬,在低功耗條件下實現(xiàn)遠(yuǎn)距離、高穿透、強(qiáng)抗干擾的數(shù)據(jù)傳輸。它不僅是物聯(lián)網(wǎng)遠(yuǎn)程
    發(fā)表于 12-19 11:06

    內(nèi)網(wǎng)穿透:從原理到實戰(zhàn)部署

    本文介紹了內(nèi)網(wǎng)穿透技術(shù)的原理及其應(yīng)用解決方案。由于NAT網(wǎng)絡(luò)和動態(tài)IP的限制,外部無法直接訪問內(nèi)網(wǎng)設(shè)備。內(nèi)網(wǎng)穿透通過公網(wǎng)中轉(zhuǎn)服務(wù)器建立連接通道,實現(xiàn)外部訪問內(nèi)網(wǎng)服務(wù)。文章詳細(xì)講解了Ze
    的頭像 發(fā)表于 11-04 16:57 ?1451次閱讀
    內(nèi)網(wǎng)<b class='flag-5'>穿透</b>:從原理到實戰(zhàn)部署

    廣州唯創(chuàng)電子WTK6900H-32N離線語音識別芯片:精準(zhǔn)遠(yuǎn)識別引領(lǐng)智能電風(fēng)扇創(chuàng)新 | 語音IC廠家

    隨著人工智能技術(shù)的快速發(fā)展,語音交互正在成為智能家居領(lǐng)域的重要入口。廣州唯創(chuàng)電子作為專業(yè)的語音IC廠家,推出的WTK6900H-32N離線語音識別芯片,以其創(chuàng)新的
    的頭像 發(fā)表于 10-31 09:03 ?671次閱讀
    廣州唯創(chuàng)電子WTK6900H-32N離線<b class='flag-5'>語音</b>識別芯片:精準(zhǔn)<b class='flag-5'>遠(yuǎn)</b><b class='flag-5'>場</b>識別引領(lǐng)智能電風(fēng)扇創(chuàng)新 | <b class='flag-5'>語音</b>IC廠家

    即插即用,聲控萬物!XMOS攜手矽遞科技賦能AI語音交互

    基于XMOS XVF3800的ReSpeaker遠(yuǎn)麥克風(fēng)陣列AI智能語音識別開發(fā)板已在全球市場全面上市。
    的頭像 發(fā)表于 09-22 10:17 ?435次閱讀
    即插即用,聲控萬物!XMOS攜手矽遞科技賦能AI<b class='flag-5'>語音</b>交互

    智科技與螞蟻集團(tuán)共探聲學(xué)AI前沿技術(shù)

    當(dāng)聲學(xué)AI遇上金融科技,會碰撞出怎樣的火花?當(dāng)聲學(xué)AI模型賦能AI硬件產(chǎn)品,又將如何重塑人機(jī)交互的邊界?近日,智科技受邀參加螞蟻集團(tuán)《AI圓桌派》內(nèi)部分享會,一關(guān)于聲學(xué)AI前沿技術(shù)
    的頭像 發(fā)表于 07-24 10:18 ?1030次閱讀

    WTK6900HC-24SS語音識別芯片:重塑眼部/頸部按摩儀的智能語音交互體驗

    在智能語音技術(shù)席卷消費電子領(lǐng)域的浪潮中,廣州唯創(chuàng)電子推出的WTK6900HC-24SS語音識別芯片正為眼部/頸部按摩儀注入革命性的交互變革。這款高性價比單芯片方案,集遠(yuǎn)
    的頭像 發(fā)表于 07-14 09:07 ?730次閱讀
    WTK6900HC-24SS<b class='flag-5'>語音</b>識別芯片:重塑眼部/頸部按摩儀的智能<b class='flag-5'>語音</b>交互體驗

    芯知識|語音芯片IC上斷電/切換DAC輸出時有“嗒”的解決方案解析

    一、功放“嗒”的根源與影響在語音芯片IC系統(tǒng)中,功放輸出端在上電、斷電或切換DAC輸出模式時產(chǎn)生的“嗒”(Click/Pop噪聲),本質(zhì)上是瞬態(tài)電壓突變引發(fā)的沖擊效應(yīng)。當(dāng)語音芯片的
    的頭像 發(fā)表于 06-16 08:55 ?988次閱讀
    芯知識|<b class='flag-5'>語音</b>芯片IC上斷電/切換DAC輸出時有“嗒<b class='flag-5'>聲</b>”的解決方案解析

    遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量

    在人工智能快速發(fā)展的今天,語音機(jī)器人逐漸成為人們生活和工作中的得力助手。明遠(yuǎn)智睿SSD2351開發(fā)板憑借強(qiáng)大性能與豐富功能,為語音機(jī)器人的發(fā)展注入新動力,成為該領(lǐng)域的變革力量。 SSD2351開發(fā)板
    發(fā)表于 05-28 11:36

    遠(yuǎn)智睿SSD2351核心板在語音對講與HMI領(lǐng)域的創(chuàng)新應(yīng)用

    在現(xiàn)代智能設(shè)備中,語音對講和HMI(人機(jī)界面)作為重要的交互方式,直接影響著用戶體驗。明遠(yuǎn)智睿SSD2351核心板憑借其獨特的硬件特性和豐富接口,在這兩個領(lǐng)域?qū)崿F(xiàn)了諸多創(chuàng)新應(yīng)用。 在語音對講方面
    發(fā)表于 04-16 10:46

    智能語音新風(fēng)尚:WTK6900語音識別芯片賦能未來家居,讓涼爽觸“”可及

    在人工智能技術(shù)飛速發(fā)展的今天,語音交互正以顛覆性的方式重塑我們的生活體驗。WTK6900系列語音識別芯片憑借其離線高性能、抗噪遠(yuǎn)識別、毫秒
    的頭像 發(fā)表于 04-08 08:43 ?1274次閱讀
    智能<b class='flag-5'>語音</b>新風(fēng)尚:WTK6900<b class='flag-5'>語音</b>識別芯片賦能未來家居,讓涼爽觸“<b class='flag-5'>聲</b>”可及

    芯知識|解決WT588F08A語音芯片DAC輸出POPO技術(shù)分析與優(yōu)化方案

    引言:POPO的成因與影響在語音芯片應(yīng)用中,WT588F08A作為一款支持DAC+功放輸出的高集成方案,常因電路設(shè)計或信號處理不當(dāng),在音頻播放結(jié)束后出現(xiàn)POPO(瞬態(tài)噪聲)。這種噪聲不僅影響用戶
    的頭像 發(fā)表于 04-07 09:00 ?1005次閱讀
    芯知識|解決WT588F08A<b class='flag-5'>語音</b>芯片DAC輸出POPO<b class='flag-5'>聲</b>的<b class='flag-5'>技術(shù)</b>分析與優(yōu)化方案

    芯知識|廣州唯創(chuàng)電子語音芯片電流問題解析與解決方案

    語音芯片在播放音頻時出現(xiàn)電流是嵌入音頻系統(tǒng)開發(fā)中的常見問題,直接影響用戶體驗。廣州唯創(chuàng)電子WT系列語音芯片在智能家居、工業(yè)控制等領(lǐng)域廣泛應(yīng)用,本文將從PWM直推輸出與DAC+功放輸
    的頭像 發(fā)表于 03-28 08:44 ?1925次閱讀
    芯知識|廣州唯創(chuàng)電子<b class='flag-5'>語音</b>芯片電流<b class='flag-5'>聲</b>問題解析與解決方案

    云AI語音鼠標(biāo)開啟智能辦公新時代

    在數(shù)字化飛速發(fā)展的當(dāng)下,人們對輸入設(shè)備的效率和便捷性有了更高的追求。傳統(tǒng)鼠標(biāo)只能實現(xiàn)基本的指針控制,在文字輸入場景下,鍵盤輸入速度受限且在特殊環(huán)境中使用不便。而云 AI 語音鼠標(biāo)方案的問世,正是為了滿足用戶對高效、便捷輸入的迫切需求。
    的頭像 發(fā)表于 03-19 09:43 ?1534次閱讀