首先我們簡(jiǎn)單聊聊什么是麥克風(fēng)陣列。
麥克風(fēng)陣列 ≠一堆麥克風(fēng)
風(fēng)吹麥浪,高山流水,蛙聲蟲(chóng)鳴......人類能聽(tīng)到的聲音大約有40多萬(wàn)種,頻率在20至20000赫茲之間。而在嘈雜的環(huán)境下,機(jī)器想要聽(tīng)懂聲音,它必須能夠聽(tīng)的更遠(yuǎn)更清晰,人類可以帶上助聽(tīng)器,機(jī)器需要什么呢?麥克風(fēng)陣列就充當(dāng)了助聽(tīng)器這樣的角色。
麥克風(fēng)陣列就是由一定數(shù)目的聲學(xué)傳感器(一般是麥克風(fēng))組成,用來(lái)對(duì)聲場(chǎng)的空間特性進(jìn)行采樣并處理的系統(tǒng)。早在20世紀(jì)70、80年代,麥克風(fēng)陣列已經(jīng)被應(yīng)用于語(yǔ)音信號(hào)處理的研究中,進(jìn)入90年代以來(lái),基于麥克風(fēng)陣列的語(yǔ)音信號(hào)處理算法逐漸成為一個(gè)新的研究熱點(diǎn)。而到了“聲控時(shí)代”,這項(xiàng)技術(shù)的重要性顯得尤為突出。
如果把語(yǔ)音識(shí)別看成一個(gè)接收信息、解析信息、做出反饋過(guò)程的話,麥克風(fēng)陣列解決的是聽(tīng)不聽(tīng)得到、多遠(yuǎn)距離屬于合理范圍、不受噪音影響的問(wèn)題。
單麥克 vs麥克風(fēng)陣列
單麥克風(fēng)系統(tǒng)可以在低噪聲、無(wú)混響、距離聲源很近的情況下獲得符合語(yǔ)音識(shí)別需求的聲音信號(hào)。但如果聲源距離麥克風(fēng)距離較遠(yuǎn),并且存在大量的噪聲、多徑反射和混響,導(dǎo)致拾取信號(hào)的質(zhì)量下降,這會(huì)嚴(yán)重影響語(yǔ)音識(shí)別率。而且,單麥克風(fēng)接收的信號(hào),是由多個(gè)聲源和環(huán)境噪聲疊加的,很難實(shí)現(xiàn)各個(gè)聲源的分離。這樣就無(wú)法實(shí)現(xiàn)聲源定位和分離,因?yàn)檫€有一類聲音的疊加并非噪聲,但是在語(yǔ)音識(shí)別中也要抑制,就是人聲的干擾,語(yǔ)音識(shí)別顯然不能同時(shí)識(shí)別兩個(gè)以上的聲音。
為了解決單麥克風(fēng)的這些局限性,利用麥克風(fēng)陣列進(jìn)行語(yǔ)音處理的方法應(yīng)時(shí)而生。麥克風(fēng)陣列由一組按一定幾何結(jié)構(gòu)(常用線形、環(huán)形)擺放的麥克風(fēng)組成,對(duì)采集的不同空間方向的聲音信號(hào)進(jìn)行空時(shí)處理,實(shí)現(xiàn)噪聲抑制、混響去除、人聲干擾抑制、聲源測(cè)向、聲源跟蹤、陣列增益等功能,進(jìn)而提高語(yǔ)音信號(hào)處理質(zhì)量,以提高真實(shí)環(huán)境下的語(yǔ)音識(shí)別率。
一個(gè)麥克風(fēng)不足以接收全部信息,但麥克風(fēng)陣列卻可以實(shí)現(xiàn)聲源定位、信號(hào)拾取、信號(hào)分離、去除噪音影響等。
麥克風(fēng)結(jié)構(gòu)和麥克風(fēng)數(shù)量
在麥克風(fēng)陣列里,麥克風(fēng)的數(shù)量,從2個(gè)到上千個(gè)不等。復(fù)雜的麥克風(fēng)陣列主要應(yīng)用于工業(yè)和國(guó)防領(lǐng)域,而消費(fèi)級(jí)領(lǐng)域的麥克風(fēng)數(shù)量通常較少,一般有2、4、5、6、8等幾種形式。通常,這組麥克風(fēng)會(huì)按照一定幾何結(jié)構(gòu)擺放,比如線形、環(huán)形、球形等,比如訊飛開(kāi)放平臺(tái)就研發(fā)出二麥線性陣列、四麥線性陣列和六四麥線性陣列。
適用場(chǎng)景解析
可別小看這些結(jié)構(gòu)和數(shù)量,不同的組合都對(duì)硬件產(chǎn)品來(lái)說(shuō)有著千差萬(wàn)別的效果。比如雙麥克風(fēng)陣列的結(jié)構(gòu)簡(jiǎn)單,成本低、容易實(shí)施、功耗低等特點(diǎn)讓它更容易在家電產(chǎn)品中實(shí)現(xiàn)落地。目前國(guó)內(nèi)主流家電廠商應(yīng)用語(yǔ)音交互技術(shù)的產(chǎn)品中,海信電視、美的空調(diào)等選擇的大都是雙麥克方案。
不過(guò)在機(jī)器人領(lǐng)域里,對(duì)聲源定位、降噪、識(shí)別率的要求比較高,一般都會(huì)使用環(huán)形多麥克方案。比如新松機(jī)器人使用的是訊飛四麥克風(fēng)陣列,穿山甲機(jī)器人則選用六麥克風(fēng)陣列。(ps:六麥?zhǔn)黔h(huán)形360拾音,需要水平放置,一般安置在機(jī)器人頭頂?shù)奈恢?,而四麥?zhǔn)?80度正面的拾音,豎直放置,一般安置在機(jī)器人的胸前)。那么車載、智能音箱等領(lǐng)域又如何選擇這些方案呢?自己的產(chǎn)品究竟更適合哪種呢?
5月25日,AI公開(kāi)課第四期我們就將為大家具體介紹。另外麥克風(fēng)陣列的關(guān)鍵技術(shù)(噪聲抑制、混響消除、聲源定位等)也會(huì)在本期公開(kāi)課展開(kāi)詳細(xì)解讀。
-
傳感器
+關(guān)注
關(guān)注
2576文章
55028瀏覽量
791243 -
機(jī)器人
+關(guān)注
關(guān)注
213文章
31073瀏覽量
222187 -
語(yǔ)音識(shí)別
+關(guān)注
關(guān)注
39文章
1812瀏覽量
116047
發(fā)布評(píng)論請(qǐng)先 登錄
探索LMV1091:高性能麥克風(fēng)陣列放大器的卓越之選
探索MAX9814:帶AGC和低噪聲麥克風(fēng)偏置的麥克風(fēng)放大器
為什么你的藍(lán)牙耳機(jī)通話清晰?MEMS麥克風(fēng)是關(guān)鍵
探究 InvenSense ICS - 40214 模擬 MEMS 麥克風(fēng):性能與應(yīng)用全解析
TDK InvenSense ICS - 40800麥克風(fēng):性能、設(shè)計(jì)與應(yīng)用全解析
探索英飛凌XENSIV? MEMS麥克風(fēng)柔性評(píng)估套件
探索英飛凌XENSIV? MEMS麥克風(fēng)柔性評(píng)估套件
測(cè)量麥克風(fēng)接口指南類型、區(qū)別與應(yīng)用解析你都知道嗎?
藍(lán)牙耳機(jī)降噪核心技術(shù)解析:MEMS硅麥克風(fēng)如何重塑聽(tīng)覺(jué)體驗(yàn)?
?基于STEVAL-STWINMA2麥克風(fēng)陣列擴(kuò)展板的工業(yè)音頻傳感技術(shù)解析
MEMS麥克風(fēng)設(shè)計(jì)注意事項(xiàng)和應(yīng)用指南
麥克風(fēng)CE認(rèn)證要求
數(shù)字麥克風(fēng)的0dBFS對(duì)應(yīng)的信號(hào)電平峰值是多少?
芯知識(shí)|語(yǔ)音識(shí)別芯片麥克風(fēng)配置指南:?jiǎn)嘻溑c雙麥方案的技術(shù)選擇
關(guān)于對(duì)麥克風(fēng)陣列的分析和介紹
評(píng)論