什么是語(yǔ)音芯片?
語(yǔ)音芯片定義:將語(yǔ)音信號(hào)通過(guò)采樣轉(zhuǎn)化為數(shù)字,存儲(chǔ)在IC的ROM中,再通過(guò)電路將ROM中的數(shù)字還原成語(yǔ)音信號(hào)。
根據(jù)語(yǔ)音芯片的輸出方式分為兩大類,一種是PWM輸出方式,一種是DAC輸出方式,PWM輸出音量不可連續(xù)可調(diào),不能接普通功放,目前市面上大多數(shù)語(yǔ)音芯片是PWM輸出方式。另外一種是DAC經(jīng)內(nèi)部EQ放大,該語(yǔ)音芯片聲音連續(xù)可調(diào),可數(shù)字控制調(diào)節(jié),可外接功放。
普通語(yǔ)音芯片放音功能實(shí)質(zhì)上是一個(gè)DAC過(guò)程,而ADC過(guò)程資料是由電腦完成,其中包括對(duì)語(yǔ)音信號(hào)的采樣、壓縮、EQ等處理。
錄音芯片包括ADC和DAC兩個(gè)過(guò)程,都是由芯片本身完成的,包括語(yǔ)音數(shù)據(jù)的采集、分析、壓縮、存儲(chǔ)、播放等步驟。
ADC=Analog Digital Change 模數(shù)轉(zhuǎn)換
DAC= Digital Analog Change 數(shù)模轉(zhuǎn)換
音質(zhì)的優(yōu)劣取決于ADC和DAC位數(shù)的多少。例如:20秒到 340秒,最低從10秒到340秒。語(yǔ)音芯片直觀的從名稱上來(lái)看,就是與語(yǔ)音有關(guān)的芯片,語(yǔ)音就是存儲(chǔ)的電子聲音,凡是能發(fā)出聲音的芯片,就是語(yǔ)音芯片,俗稱聲音芯片,英文準(zhǔn)確些來(lái)說(shuō)應(yīng)該是Voice IC. 在語(yǔ)音芯片的大家庭中,根據(jù)聲音的類型不同可分為(Speech IC)和(Music IC)兩種。這兒應(yīng)該算是語(yǔ)音芯片專業(yè)的區(qū)分方法。
2、語(yǔ)音信號(hào)的量化表述:(分類:語(yǔ)音芯片?和?音樂(lè)芯片)?
(a)?“語(yǔ)音芯片”介紹:??
(1)語(yǔ)音信號(hào)的量化
采樣率(f)、位數(shù)(n)、波特率(T)??采樣:將語(yǔ)音模擬信號(hào)轉(zhuǎn)化成數(shù)字信號(hào)。??采樣率:每秒采樣的個(gè)數(shù)(byte)。
波特率:每秒鐘采樣的位數(shù)(bit)。波特率直接決定音質(zhì)。Bps:bit?per?second
采樣位數(shù)指在二進(jìn)制條件下的位數(shù)。一般在沒(méi)有特別說(shuō)明的情況下,聲音的采樣位數(shù)指8位,由00H--FFH,靜音定為80H。?
(2)采樣率
奈奎斯特抽樣定理(Nyquist?Law):要從抽樣信號(hào)中無(wú)失真地恢復(fù)原信號(hào),抽樣頻率應(yīng)大于2倍信號(hào)最高頻率。抽樣頻率小于2倍頻譜最高頻率時(shí),信號(hào)的頻譜有混疊。抽樣頻率大于2倍頻譜最高頻率時(shí),信號(hào)的頻譜無(wú)混疊。
嗓音的頻帶寬度為20~20K?HZ左右,普通的聲音大概在3KHZ以下。所以,一般CD取的音質(zhì)為44.1K和16bit,如果碰到某些特別的聲音,如樂(lè)器,音質(zhì)也有用48K和24bit的情況,但不是主流。
一般在我們處理針對(duì)普通語(yǔ)音IC的時(shí)候,采樣率最高達(dá)到16K就夠了、說(shuō)話聲一般取8K(如電話音質(zhì))、6K左右。低于6K效果比較差。
在應(yīng)用單片機(jī)的過(guò)程中,采樣越高,定時(shí)器中斷速度越快,會(huì)影響到其他信號(hào)的監(jiān)控和檢測(cè),所以要綜合考慮。
語(yǔ)音芯片有什么作用
語(yǔ)音芯片主要就是是產(chǎn)品上增加語(yǔ)音播報(bào)的功能,實(shí)現(xiàn)的也就是把語(yǔ)音播放出來(lái)。
常見(jiàn)的如:小家電按鍵語(yǔ)音、安全警報(bào)提醒、貨車(chē)報(bào)“左轉(zhuǎn)彎,請(qǐng)注意”等等,應(yīng)用非常的廣泛
語(yǔ)音芯片的種類,不過(guò)主要的分類基本也就大致兩種:
1、第一種,稱之為OTP語(yǔ)音芯片,大多數(shù)是SOP8封裝的語(yǔ)音芯片,內(nèi)置幾段常用的語(yǔ)音,出廠之后就固化死了,不可修改,這個(gè)是通過(guò)專用的燒錄器燒錄進(jìn)去的,也有可能是在制作晶元的時(shí)候就已經(jīng)光照進(jìn)去了,這種就需要很大的量了,所以運(yùn)用不靈活,而且播放音質(zhì)一般。
2、第二種,就是MP3語(yǔ)音芯片芯片,它是支持MP3解碼,比OTP語(yǔ)音芯片在技術(shù)上是一個(gè)跨越,將MP3這種優(yōu)秀的技術(shù)應(yīng)用于語(yǔ)音芯片上,同時(shí)他強(qiáng)大的usb直接虛擬flash成為U盤(pán),這樣更新語(yǔ)音非常方便,直接像拷貝U盤(pán)一樣拷貝語(yǔ)音進(jìn)去就可以了。也可以通過(guò)外掛TF卡、SD卡或者U盤(pán)的方式進(jìn)行解碼播放,播放聲音細(xì)膩優(yōu)質(zhì)。
語(yǔ)音芯片發(fā)展趨勢(shì)
趨勢(shì)一、定制化、低功效、高效能、端智能
語(yǔ)音芯片以其定制化、低功效、高效能、端智能以及成本上的優(yōu)勢(shì)等勢(shì)必會(huì)在未來(lái)占據(jù)重要的市場(chǎng)地位,成為人與云端溝通的橋梁。在亞馬遜、阿里、小米等公司的助推之下,智能音箱的銷(xiāo)售在全球取得了爆發(fā)式的增長(zhǎng),語(yǔ)音芯片的出貨量也將出現(xiàn)一個(gè)爆發(fā)。縱觀這個(gè)語(yǔ)音芯片的發(fā)展歷史,他經(jīng)歷了通用組合芯片、語(yǔ)音芯片、語(yǔ)音AI芯片三個(gè)階段。而在起一個(gè)通用組合芯片階段,由于芯片本身漫長(zhǎng)的研發(fā)周期和高昂的研發(fā)投入,在當(dāng)時(shí)并沒(méi)有形成一定的市場(chǎng)規(guī)模的前提下,市場(chǎng)上并沒(méi)有后出現(xiàn)專門(mén)運(yùn)用了語(yǔ)音芯片的產(chǎn)品。另外一個(gè)方面,在語(yǔ)音交互場(chǎng)景出現(xiàn)的初期,智能設(shè)備并沒(méi)有形成一定規(guī)模的銷(xiāo)量,即使相關(guān)的從業(yè)者看到了潛在的機(jī)會(huì),研發(fā)一款成熟的語(yǔ)音芯片所需要的前期的投入成本決定在初期的智能設(shè)備上不可能大規(guī)模使用語(yǔ)音芯片,只能以其他芯片作為過(guò)渡。
趨勢(shì)二、AI語(yǔ)音芯片蓄勢(shì)待發(fā)
未來(lái),隨著華為麒麟970芯片以及蘋(píng)果A11芯片的推出,AI芯片成為行業(yè)熱議的話題。所謂AI芯片也被稱為AI加速器或計(jì)算卡,即專門(mén)用于處理人工智能應(yīng)用中的大量計(jì)算任務(wù)的模塊(其他非計(jì)算任務(wù)仍由CPU負(fù)責(zé)),從而實(shí)現(xiàn)端側(cè)智能。
目前無(wú)論是智能音箱還是其他智能設(shè)備,更多的智能都是在云端來(lái)實(shí)現(xiàn),但云端存在著語(yǔ)音交互“時(shí)延”的問(wèn)題,對(duì)網(wǎng)絡(luò)的需求限制了設(shè)備的使用空間,以及由此帶來(lái)的數(shù)據(jù)與隱私危機(jī)。為了讓設(shè)備使用場(chǎng)景不受局限,用戶體驗(yàn)更好,端側(cè)智能以成為一種趨勢(shì),語(yǔ)音AI芯片也隨之而來(lái)。
