91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

玩轉(zhuǎn)語(yǔ)音合成芯片(TTS芯片),看這一篇就夠了

智能語(yǔ)音 ? 來(lái)源:智能語(yǔ)音 ? 作者:智能語(yǔ)音 ? 2024-03-19 18:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言
什么是語(yǔ)音合成芯片:語(yǔ)音合成芯片也稱(chēng)為T(mén)TS芯片,即文字轉(zhuǎn)語(yǔ)音芯片,是一種能夠?qū)⑤斎氲奈淖中畔⑥D(zhuǎn)換為語(yǔ)音輸出的芯片。通過(guò)TTS芯片,我們可以將文字信息轉(zhuǎn)化為自然語(yǔ)音,實(shí)現(xiàn)人機(jī)語(yǔ)音交互。
語(yǔ)音合成芯片的應(yīng)用非常廣泛。例如,在智能家居領(lǐng)域,它可以用于語(yǔ)音控制家電設(shè)備;在車(chē)載設(shè)備中,它可以實(shí)時(shí)播報(bào)導(dǎo)航信息或交通提醒;在醫(yī)療設(shè)備中,它可以幫助醫(yī)生或患者獲取語(yǔ)音形式的醫(yī)療信息;在機(jī)器人領(lǐng)域,它使得機(jī)器人能夠與人類(lèi)進(jìn)行語(yǔ)音交互,提高人機(jī)交互的便捷性和自然性。

wKgZomX5OteAMkkyAACVX1ew54M478.png

一、芯片介紹
我們以市場(chǎng)中主流的TTS芯片SYN8086為例,它是一款性/價(jià)比更高,效果更自然的一款高端語(yǔ)音合成芯片。本芯片通過(guò)UART接口,接收待合成的文本數(shù)據(jù),實(shí)現(xiàn)文本到語(yǔ)音(或TTS語(yǔ)音)的轉(zhuǎn)換。
二、功能介紹
①、支持清晰、自然、準(zhǔn)確的任意中文文本的合成,文本編碼可采用GB2312、GBK、Unicode和UTF8四種編碼方式。
②、芯片支持文本智能分析處理功能,對(duì)常見(jiàn)的數(shù)值、電話(huà)號(hào)碼、時(shí)間日期、度量衡符號(hào)等格式的文本,芯片能夠根據(jù)內(nèi)置的文本匹配規(guī)則進(jìn)行正確的識(shí)別和處理。
③、支持多音字和姓氏處理、多個(gè)發(fā)音人、音量、語(yǔ)速、語(yǔ)調(diào)調(diào)整、提示音等
④、支持低功耗模式、UART通訊方式。支持多種控制命令等
三、應(yīng)用場(chǎng)景
- 車(chē)載終端 智慧停車(chē) 智能家居 智能鬧鐘
- 考勤終端 公交報(bào)站 智能手表 智能家電
- 排隊(duì)叫號(hào) 預(yù)警終端 智能門(mén)鈴 智能藥盒
- 儀器儀表 智能玩具 智能門(mén)鎖 智能穿戴
- 語(yǔ)音對(duì)講 自助終端 血壓計(jì) 充電樁

wKgZomX5O1GADNUPAAKOcoBgqfc777.png

四、最小系統(tǒng)
- 最小系統(tǒng)包括:控制器模塊、語(yǔ)音合成芯片、功放模塊和喇叭。
- 主控制器和語(yǔ)音合成芯片之間通過(guò)UART接口連接,主控芯片UART接口向語(yǔ)音合成芯片發(fā)送控制命令和文本,語(yǔ)音合成芯片把接收到的文本合成為語(yǔ)音信號(hào)輸出,輸出的信號(hào)經(jīng)功率放大器進(jìn)行放大后連接到喇叭進(jìn)行播放。

wKgaomX5O4GAdapdAACtirs-b9M286.png

五、軟件設(shè)計(jì)
1、串口命令
說(shuō)明:上位機(jī)通過(guò)串口發(fā)送給語(yǔ)音合成芯片的所有命令和數(shù)據(jù)都需要用“幀”的方式進(jìn)行封裝后傳輸。
- 公共命令匯總

wKgZomX5PL2AWtwpAAE03pr5GqQ665.png

- 語(yǔ)音合成命令匯總

wKgaomX5PM6AAnIOAAClUV3kLhI091.png

舉例:播放文本編碼格式為 “GBK” 的文本“宇音天下”
命令幀:0xFD 0x00 0x0A 0x01 0x01 0xD3 0xEE 0xD2 0xF4 0xCC 0xEC 0xCF 0xC2

wKgaomX5POCAGgaAAAB3hx72uZU410.png

2、控制標(biāo)記
說(shuō)明:漢字博大精深的文化底蘊(yùn),和當(dāng)前技術(shù)發(fā)展的限制,語(yǔ)音合成還不能做到百分之百的準(zhǔn)確。為滿(mǎn)足客戶(hù)在各種復(fù)雜環(huán)境的個(gè)性化需求,特推出以下文本控制標(biāo)記,用于靈活控制漢字發(fā)音的變化。

- 部分控制標(biāo)記

wKgaomX5PPuATTvkAACBgHe4xCY797.png

wKgaomX5PQqAa8O9AAD2ERb06Co485.png

- 控制標(biāo)記舉例:

wKgaomX5PRqAQgahAABeWNKx8u0054.png

舉例:設(shè)置TTS音量為10級(jí)
命令幀:0xFD 0x00 0x07 0x06 0x01 0x5B 0x76 0x31 0x30 0x5D
舉例:設(shè)置TTS語(yǔ)速為10級(jí)
命令幀:0xFD 0x00 0x07 0x06 0x01 0x5B 0x73 0x31 0x30 0x5D

3、提示音
SYN8086語(yǔ)音合成芯片內(nèi)集成了多首聲音提示音,可用于不同行業(yè)不同場(chǎng)合的信息提醒、報(bào)警等功能。例如:刷卡音,門(mén)鈴音,警報(bào)音等。
- 部分提示音舉例

wKgaomX5PTyAVpCYAADT2eY7IB4248.png

舉例:播放名稱(chēng)為“sound901”的提示音
命令幀:FD 00 0A 01 01 73 6F 75 6E 64 39 30 31

4、C語(yǔ)言范例

#include #include void main(void) { /需要發(fā)送的文本******************/ char code text[ ] = {"歡迎使用宇音天下研發(fā)的語(yǔ)音合成芯片"}; unsigned char headOfFrame[5]; unsigned char length ; unsigned int i = 0; length = strlen(text); //需要發(fā)送文本的長(zhǎng)度 /串口的初始化********************/ TL1 = 0xFA; // 在11.0592MHz 下,設(shè)置波特率9600bps,工作方式2 TH1 = 0xFA; TMOD = 0x20; SCON = 0x50; // 串口工作方式1,允許接收 PCON = 0x80; EA = 0; REN = 1; TI = 0; //發(fā)送中斷標(biāo)志位置零 RI = 0; //接收中斷標(biāo)志位置零 TR1 = 1; //定時(shí)器1 用作波特率發(fā)生 /發(fā)送過(guò)程*********************/ headOfFrame[0] = 0xFD ; //構(gòu)造幀頭FD headOfFrame[1] = 0x00 ; //構(gòu)造數(shù)據(jù)區(qū)長(zhǎng)度的高字節(jié) headOfFrame[2] = length + 2; //構(gòu)造數(shù)據(jù)區(qū)長(zhǎng)度的低字節(jié) headOfFrame[3] = 0x01 ; //構(gòu)造命令字:合成播放命令 headOfFrame[4] = 0x01 ; //構(gòu)造命令參數(shù):編碼格式為GBK for(i = 0; i

六、硬件設(shè)計(jì)
1、通訊方式
語(yǔ)音合成芯片支持UART接口通訊方式,可通過(guò)UART 接口接收上位機(jī)發(fā)送的命令和數(shù)據(jù)。

wKgZomX5PvyAQ0TOAAAz4FJE3PI000.png

2、引腳定義

wKgZomX5Pw2AcgYNAAPw1PBBLZA511.png

3、參考電路

wKgaomX5P96AakEnAAIlYcZoups919.png

4、電源電路設(shè)計(jì)
3.1V-4.2V單獨(dú)供電,接VCC口。POPEN、BAUD0、BAUD1、WAKEUP默認(rèn)均有上拉電阻,如果IO需要上拉請(qǐng)上拉到VDDIO,而不是VCC。

- 功放參考電路

wKgZomX7pTeANy6VAAESqXMif7Y557.png

以CS8126T為參考

5、芯片參數(shù)
- 特性極限值

wKgaomX7p5uAeh_lAAB-jJH89ik981.png


- 電壓工作范圍

wKgaomX7p6uALOphAAA5nRrmrg8604.png


6、模塊說(shuō)明
- 模塊實(shí)物圖

wKgZomX7p7qAEH8MAAF_whG6BGU347.png

- 模塊尺寸

wKgaomX7p8uABle2AACiaKiwV-Y110.png



- 模塊引腳圖

wKgaomX7p9aAIKmvAACss9n2HrI718.png

- 模塊引腳定義

wKgaomX7p-GAGpwqAADLnsChdrA276.png

結(jié)語(yǔ)
智能語(yǔ)音技術(shù)正在引領(lǐng)人機(jī)交互進(jìn)入全新的時(shí)代。其卓越的語(yǔ)音處理能力、高度集成化和小型化設(shè)計(jì),以及不斷優(yōu)化的低功耗特性,使得語(yǔ)音合成芯片在智能家居、智能車(chē)載、可穿戴設(shè)備等多個(gè)領(lǐng)域展現(xiàn)出廣闊的應(yīng)用前景。
在此,我們期待語(yǔ)音合成芯片技術(shù)的不斷創(chuàng)新與發(fā)展,為人與人、人與機(jī)器之間的溝通搭建起更加便捷、高效的橋梁,共同開(kāi)啟智能語(yǔ)音交互的新篇章。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • TTS
    TTS
    +關(guān)注

    關(guān)注

    0

    文章

    62

    瀏覽量

    11546
  • 語(yǔ)音合成芯片
    +關(guān)注

    關(guān)注

    0

    文章

    27

    瀏覽量

    7840
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    文了解語(yǔ)音AI的運(yùn)作方式

    語(yǔ)音 AI 是對(duì)話(huà)式 AI 的個(gè)子集,包括可將人類(lèi)語(yǔ)音轉(zhuǎn)換為文本的自動(dòng)語(yǔ)音識(shí)別 (ASR) 和文本轉(zhuǎn)語(yǔ)音 (
    的頭像 發(fā)表于 02-27 16:10 ?299次閱讀
    <b class='flag-5'>一</b>文了解<b class='flag-5'>語(yǔ)音</b>AI的運(yùn)作方式

    語(yǔ)音報(bào)警器:TTS語(yǔ)音播報(bào),云平臺(tái)邏輯自控

    TTS語(yǔ)音播報(bào)報(bào)警器是種集成了傳統(tǒng)報(bào)警器和TTS(文本轉(zhuǎn)語(yǔ)音)技術(shù)的智能設(shè)備。清晰、準(zhǔn)確地用人類(lèi)語(yǔ)言播報(bào)報(bào)警原因、位置、狀態(tài)等具體信息。
    的頭像 發(fā)表于 10-29 16:31 ?757次閱讀

    基于開(kāi)源鴻蒙的語(yǔ)音識(shí)別及語(yǔ)音合成應(yīng)用開(kāi)發(fā)樣例

    本期內(nèi)容由AI Model SIG提供,介紹了在開(kāi)源鴻蒙中,利用sherpa_onnx開(kāi)源三方庫(kù)進(jìn)行ASR語(yǔ)音識(shí)別與TTS語(yǔ)音合成應(yīng)用開(kāi)發(fā)的流程。
    的頭像 發(fā)表于 08-25 14:26 ?4110次閱讀
    基于開(kāi)源鴻蒙的<b class='flag-5'>語(yǔ)音</b>識(shí)別及<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>合成</b>應(yīng)用開(kāi)發(fā)樣例

    TTS文字合成語(yǔ)音芯片的使用場(chǎng)景

    下觸發(fā)固定的語(yǔ)音內(nèi)容,而TTS文字合成語(yǔ)音播報(bào)芯片則不樣的,他可以通過(guò)文章直接生成語(yǔ)音播報(bào),
    的頭像 發(fā)表于 08-22 17:11 ?1004次閱讀

    開(kāi)源TTS應(yīng)用:打破技術(shù)壟斷,讓語(yǔ)音合成成為每個(gè)人的創(chuàng)造力工具

    傳統(tǒng)語(yǔ)音合成技術(shù)往往被巨頭壟斷,成本高且定制難。開(kāi)源TTS應(yīng)用的誕生,徹底改變游戲規(guī)則。其開(kāi)放源代碼讓中小企業(yè)、個(gè)人開(kāi)發(fā)者乃至普通用戶(hù)都能低成本接入并改造語(yǔ)音技術(shù),將
    的頭像 發(fā)表于 08-15 14:03 ?604次閱讀
    開(kāi)源<b class='flag-5'>TTS</b>應(yīng)用:打破技術(shù)壟斷,讓<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>合成</b>成為每個(gè)人的創(chuàng)造力工具

    TTS語(yǔ)音芯給產(chǎn)品增加智能語(yǔ)音播報(bào)能力

    TTS語(yǔ)音芯片給產(chǎn)品增加智能語(yǔ)音播報(bào)能力 傳統(tǒng)語(yǔ)音播報(bào)
    的頭像 發(fā)表于 08-14 16:33 ?733次閱讀

    從開(kāi)發(fā)工程師視角看TTS語(yǔ)音合成芯片

    功能機(jī),有著諸多跨越性?xún)?yōu)勢(shì)。 、TTS 語(yǔ)音合成芯片vs傳統(tǒng)播報(bào)芯片 (
    的頭像 發(fā)表于 08-13 14:52 ?829次閱讀

    Air8000 TTS開(kāi)源,語(yǔ)音合成從此“零距離”!

    文本轉(zhuǎn)語(yǔ)音)——是種將書(shū)面文本轉(zhuǎn)換為人類(lèi)可聽(tīng)語(yǔ)音的技術(shù),通過(guò)算法和模型模擬人類(lèi)發(fā)聲,實(shí)現(xiàn)機(jī)器“說(shuō)話(huà)”。其核心目標(biāo)是生成自然、流暢且富有表現(xiàn)力的語(yǔ)音。 ?
    的頭像 發(fā)表于 07-03 16:33 ?615次閱讀
    Air8000 <b class='flag-5'>TTS</b>開(kāi)源,<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>合成</b>從此“零距離”!

    從代碼到聲音,Air8000 TTS開(kāi)源應(yīng)用開(kāi)啟創(chuàng)作新紀(jì)元!

    轉(zhuǎn)語(yǔ)音)——是種將書(shū)面文本轉(zhuǎn)換為人類(lèi)可聽(tīng)語(yǔ)音的技術(shù),通過(guò)算法和模型模擬人類(lèi)發(fā)聲,實(shí)現(xiàn)機(jī)器“說(shuō)話(huà)”。其核心目標(biāo)是生成自然、流暢且富有表現(xiàn)力的語(yǔ)音。 ?
    的頭像 發(fā)表于 06-27 17:06 ?571次閱讀
    從代碼到聲音,Air8000 <b class='flag-5'>TTS</b>開(kāi)源應(yīng)用開(kāi)啟創(chuàng)作新紀(jì)元!

    零死角玩轉(zhuǎn)STM32——中級(jí)

    本文共4冊(cè),由于資料內(nèi)存過(guò)大,分開(kāi)上傳,有需要的朋友可以去主頁(yè)搜索下載哦~ 《零死角玩轉(zhuǎn) STM32》系列教程由初級(jí)、中級(jí)、高級(jí)、系統(tǒng)
    發(fā)表于 05-21 13:56

    智能收銀語(yǔ)音交互新標(biāo)桿—WT3000T8語(yǔ)音合成芯片TTS技術(shù)應(yīng)用解析

    、行業(yè)應(yīng)用背景在零售業(yè)態(tài)智能化轉(zhuǎn)型的浪潮中,收銀設(shè)備正經(jīng)歷從功能型向服務(wù)型轉(zhuǎn)變的關(guān)鍵階段。WT3000T8語(yǔ)音合成芯片應(yīng)運(yùn)而生,專(zhuān)為滿(mǎn)足新零售場(chǎng)景下智能收銀終端的
    的頭像 發(fā)表于 04-24 08:45 ?994次閱讀
    智能收銀<b class='flag-5'>語(yǔ)音</b>交互新標(biāo)桿—WT3000T8<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b><b class='flag-5'>TTS</b>技術(shù)應(yīng)用解析

    WT3000TX語(yǔ)音合成芯片介紹V1

    WT3000TX是系列功能強(qiáng)大的高品質(zhì)語(yǔ)音芯片,采用了高性能32位處理器、最高頻率可達(dá)240MHz。WT3000TX高集成度的語(yǔ)音合成
    發(fā)表于 04-17 08:43 ?0次下載

    芯資訊|WT3000T8語(yǔ)音合成芯片TTS在智能收款機(jī)中的創(chuàng)新應(yīng)用設(shè)計(jì)方案介紹

    體驗(yàn)的關(guān)鍵模塊。廠家廣州唯創(chuàng)電子推出的WT3000T8作為新代高性能語(yǔ)音合成芯片,憑借其優(yōu)異的處理能力和靈活的功能配置,正在為收款機(jī)智能化升級(jí)提供核心技術(shù)支持。
    的頭像 發(fā)表于 04-15 08:55 ?890次閱讀
    芯資訊|WT3000T8<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b><b class='flag-5'>TTS</b>在智能收款機(jī)中的創(chuàng)新應(yīng)用設(shè)計(jì)方案介紹

    【CW32模塊使用】語(yǔ)音合成播報(bào)模塊

    SYN6288E 中文語(yǔ)音合成芯片是北京宇音天下科技有限公司在 2010 年初推出的款性/價(jià)比更高的 SYN6288 芯片的基礎(chǔ)上更改封裝
    的頭像 發(fā)表于 03-29 17:25 ?1212次閱讀
    【CW32模塊使用】<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>合成</b>播報(bào)模塊

    WT3000T8-32N語(yǔ)音合成TTS芯片:小體積、強(qiáng)性能,重塑智能語(yǔ)音交互體驗(yàn)

    在萬(wàn)物互聯(lián)的智能化浪潮中,語(yǔ)音交互已成為人機(jī)交互的核心入口。廣州唯創(chuàng)電子推出的WT3000T8-32N語(yǔ)音合成芯片,憑借其4×4mm超小封裝、240MHz超強(qiáng)算力與多場(chǎng)景
    的頭像 發(fā)表于 03-21 09:20 ?1037次閱讀
    WT3000T8-32N<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>合成</b><b class='flag-5'>TTS</b><b class='flag-5'>芯片</b>:小體積、強(qiáng)性能,重塑智能<b class='flag-5'>語(yǔ)音</b>交互體驗(yàn)