91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于百度3麥克風(fēng)陣列智能音箱功能介紹

聲智科技 ? 來源:djl ? 作者:聲智科技 ? 2019-08-13 09:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

6月11日,百度“新聲出道”的小度新品發(fā)布會在北京百度科技園K6熊掌報告廳召開,新品“小度智能音箱”正式在后廠村C位“出道”,嘗鮮價89元。這款“后廠村C位出道”的百元AI實力擔(dān)當(dāng)產(chǎn)品——“小度智能音箱”憑借“好聽、好用、好玩”的特性,新晉成為智能音箱屆的“三好生”!

這款定價89元的小度智能音箱是如何成為智能音箱屆的“三好生”?聲智科技作為小度智能音箱的技術(shù)合作伙伴,帶您一起解鎖小度智能音箱背后的秘密武器!

(1)好聽:采用全球首款3麥克風(fēng)陣列設(shè)計,硬件毫不妥協(xié)!

小度智能音箱作為一款定價89元的智能音箱,其跨級音質(zhì)體驗是百元檔音質(zhì)最佳的人工智能音箱。小度智能音箱音質(zhì)出眾,卻身量小巧,而且有著毫不妥協(xié)的遠(yuǎn)場語音交互體驗。它是如何平衡ID、音質(zhì)設(shè)計和產(chǎn)品體驗之間的矛盾呢?

作為一款支持遠(yuǎn)場語音交互的智能音箱,一定離不開麥克風(fēng)陣列。麥克風(fēng)陣列的主要作用是幫助機器適應(yīng)更加復(fù)雜的場景。麥克風(fēng)陣列是由一定數(shù)目的聲學(xué)傳感器組成,用來對聲場的空間特性進(jìn)行采樣并處理的系統(tǒng),將會影響真實環(huán)境下的語音喚醒和識別率,是決定用戶體驗的關(guān)鍵因素。

然而,當(dāng)前市場上的麥克風(fēng)陣列方案中,常見的陣型多為4麥,6麥,8麥等陣元的線型、環(huán)型、菱型等陣列方案,亞馬遜的Echo還采用過6+1麥的方案,亞馬遜主流產(chǎn)品仍在沿用6麥環(huán)形和8麥跑道型方案。從技術(shù)原理來看,更多數(shù)量麥克風(fēng)的陣列方案在遠(yuǎn)場語音交互效果上更具有優(yōu)勢,但是多麥陣型也限制了ID設(shè)計的想象空間,對音箱設(shè)計提出包括ID、成本等更多苛刻要求。

圖為麥克風(fēng)陣列模組

聲智科技為小度智能音箱量身打造的全球首款3麥環(huán)型麥克風(fēng)陣列,很好的平衡了ID、成本、音質(zhì)設(shè)計和產(chǎn)品體驗之間的矛盾。這款全球首款3麥克風(fēng)陣列構(gòu)型靈活,打破了音腔設(shè)計的局限,并釋放ID設(shè)計的無限空間,同時平衡了成本和效果之間的矛盾。

聲智科技推出的這款全球首款的3麥環(huán)型麥克風(fēng)陣列內(nèi)置通話降噪、混響抑制、回聲抵消、噪聲抑制、語音增強、波束形成、增益控制、語音識別等遠(yuǎn)場語音交互技術(shù),5米內(nèi)的嘈雜環(huán)境中,仍可以有卓越的遠(yuǎn)場語音喚醒性能、精準(zhǔn)的遠(yuǎn)近場語音識別,實現(xiàn)輕松喚醒,無懼環(huán)境,想說就說,聲隨心動,保證遠(yuǎn)場語音交互的完美體驗。而且,相比4麥、6麥、8麥陣列方案的成本偏高,3麥陣列方案價格更加親民,相比2麥又有效果優(yōu)勢。

不僅如此,為了釋放ID設(shè)計的無限空間,聲智科技針對小體積智能音箱尺寸特性,進(jìn)行了獨家的技術(shù)優(yōu)化。小尺寸智能音箱的麥克風(fēng)陣列與喇叭的位置,以及ID結(jié)構(gòu)都較為受限,特別是麥克風(fēng)陣列與大音量喇叭相距很近,帶給語音交互技術(shù)處理極大的壓力,特別是自噪聲抑制和遠(yuǎn)場信號處理的難度極具增加。為了在這樣的特殊結(jié)構(gòu)設(shè)計獲得更好的語音交互效果,聲智科技獨家設(shè)計優(yōu)化,采用抗強噪喚醒技術(shù)(AKS技術(shù))、垂直抗強噪識別技術(shù)(VAN技術(shù))、OpenAEC技術(shù)等提升遠(yuǎn)場語音交互體驗。

(2)好用:完整遠(yuǎn)場語音喚醒和識別服務(wù),又快又準(zhǔn)!

為了讓小度智能音箱更好用,提升產(chǎn)品的凈推薦值NPS,聲智科技通過SoundAI Voice Kit(以下簡稱SVK)為小度帶來更敏捷、更貼合人性化的語音交互設(shè)計。

SVK是一款集成聲波配網(wǎng)、波束形成、聲源測向、定向拾音、噪聲抑制、混響消除、回聲消除、語音喚醒、端點檢測、語音識別、語義理解、語音合成、雙工通話等全鏈路的智能語音交互開發(fā)套件,兼容主流智能語音硬件架構(gòu),支持DuerOS、AliGenies、小愛平臺、騰訊叮當(dāng)、Amazon Alexa等主流AI平臺, 助力品牌廠商實現(xiàn)智能硬件產(chǎn)品的極速開發(fā)和量產(chǎn)上市。

什么樣的響應(yīng)時間才能帶來完美的語音交互體驗?人機語音交互是讓機器模擬人的行為,讓機器適應(yīng)人類的交互習(xí)慣。大多數(shù)情況下,在生活中人與人對話時,一個過快的回答會給用戶帶來輕浮感和搶話感,而一個過慢的回答會給用戶帶來遲緩感和愚鈍感。因此智能音箱的響應(yīng)時間對于用戶體驗至關(guān)重要。

此次,小度智能音箱采用了聲智科技的SVK完整的遠(yuǎn)場語音喚醒、遠(yuǎn)場語音識別(Far-Field ASR)服務(wù)。聲智科技精準(zhǔn)的“遠(yuǎn)場語音喚醒技術(shù)”和”遠(yuǎn)場語音識別技術(shù)”,面向垂直領(lǐng)域深度優(yōu)化,達(dá)到平均96%以上的準(zhǔn)確率。而且,不僅識別率極大的提升,也帶來了更符合人性化的語音交互速度體驗,使得小度智能音箱從喚醒到內(nèi)容的全鏈條響應(yīng)速度達(dá)到全球極致的1.4S以內(nèi),而用戶喚醒以后的機器應(yīng)答響應(yīng)時間更是做到了400~500毫秒的極致速度。

什么樣的語音喚醒體驗才能帶來完美語音交互體驗?語音喚醒是智能音箱用戶的第一體驗。聲智科技通過寬場景高靈敏喚醒技術(shù),很好的平衡了喚醒率和誤喚醒率。眾所周知喚醒率和誤喚醒是一對蹺蹺板,當(dāng)喚醒效果很好的時候,誤喚醒通常也會很高,智能音箱毫無征兆的突然喚醒也是很麻煩的事情。為解決這個矛盾,聲智科技的技術(shù)不走討巧路線,而是采用全新的喚醒模型,優(yōu)先保證用戶的體驗,在此基礎(chǔ)上再降低誤喚醒率,同時還要提升強噪環(huán)境下的喚醒率。

當(dāng)然,不同麥克風(fēng)器件的選擇帶來不同的語音交互效果,信噪比(SNR)70dB以上的麥克風(fēng)要比信噪比60DB的麥克風(fēng)的遠(yuǎn)場和抗噪效果更好,但是選用高信噪比的麥克風(fēng),其結(jié)果就是成本會高出很多。徹底屏蔽硬件的差異化,面向低成本高失真產(chǎn)品,努力幫助客戶降低成本,聲智科技推出了低成本高容錯喚醒技術(shù)。即便在一致性和失真度非常大的情況下,也要出色的保證用戶體驗的效果,這是聲智科技給所有客戶一直的承諾。

什么樣的語音識別體驗才能帶來完美語音交互體驗?由于遠(yuǎn)場智能產(chǎn)品的場景特殊性,遠(yuǎn)場語音識別相對更加垂直,比如智能音箱的識別偏重于音樂和百科領(lǐng)域,智能汽車的識別偏重于地圖和音樂領(lǐng)域,而對于地域性的覆蓋,則是遠(yuǎn)場語音識別著重考慮的,并不能簡單把方言劃歸為一個技術(shù)系列,特別是消費電子領(lǐng)域的高度標(biāo)準(zhǔn)化思維,對于遠(yuǎn)場語音識別的場景兼容更加看重。所以聲智科技的Far-Field ASR就要在垂直領(lǐng)域考慮更多場景難題,不僅如此,為保證云端服務(wù)的穩(wěn)定性和并發(fā)能力,聲智科技采用端云強耦的技術(shù)架構(gòu),合理在端云分配計算能力,與Amazon AWS、阿里云等主流云計算平臺采用相同的服務(wù)可靠性標(biāo)準(zhǔn),SLA高達(dá)99.99%。

(3)好玩:滿足兒童與極客不同需求,解決寬場景難題

真正的產(chǎn)品落地需要考慮眾多應(yīng)用場景的難題,聲智科技的Far-Field ASR就要在垂直領(lǐng)域考慮更多場景難題,比如老人和小孩的識別怎么辦?南方和北方的語言差異怎么辦?而并非只是簡單的技術(shù)疊加。

智能音箱市場的用戶群中有20%+是兒童,如何滿足兒童用戶群體的需求,提供零溝通距離,優(yōu)質(zhì)精選內(nèi)容,保證健康安全又不失好玩有趣的語音交互體驗?聲智科技推出了遠(yuǎn)近場的兒童語音識別技術(shù),針對兒童的語音特點,例如:兒童生理上發(fā)育不夠成熟,不善于掌握發(fā)音部位與方法,輔音發(fā)音分化不明顯。而且,兒童發(fā)音單音重復(fù)較多,往往發(fā)出單個的、重疊的音,他們會說“車車”、“糖糖”、“兔兔”、“飯飯”,而不說“汽車”、“糖”、“兔子”、“飯”這樣的兒童的交流方式,聲智科技進(jìn)行聲學(xué)模型優(yōu)化訓(xùn)練,升級打造ASR技術(shù),使得兒童識別率更準(zhǔn)確,更貼合兒童的交互習(xí)慣。

除了兒童模式,小度智能音箱還推出了極客模式。極客模式下,一次喚醒之后,用戶可以進(jìn)行多輪對話。針對用戶多輪對話的語音交互需求,聲智科技推出了支持多輪對話的端云交互技術(shù),從麥克風(fēng)陣列、語音喚醒、端點檢測和語音識別四個技術(shù)鏈條進(jìn)行深度優(yōu)化,滿足了百度對于用戶體驗的極致追求。其中,端點檢測技術(shù)既要保證響應(yīng)速度,又要準(zhǔn)確識別斷句以保證語言連貫性,在復(fù)雜場景下的技術(shù)實現(xiàn)非常困難。聲智科技率先突破這些技術(shù)難關(guān),將會推動智能音箱技術(shù)向著更加智能的方向快速發(fā)展。

隨著用戶認(rèn)知度提升、整體產(chǎn)業(yè)鏈的成熟、用戶體驗提升等因素,2018年智能音箱將會持續(xù)爆發(fā)。但語音交互技術(shù)仍需繼續(xù)發(fā)力,聲智科技作為國內(nèi)知名的語音交互技術(shù)提供商,將持續(xù)聚焦在技術(shù)領(lǐng)域,與眾多合作伙伴一道推動智能語音行業(yè)的發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 智能語音
    +關(guān)注

    關(guān)注

    11

    文章

    826

    瀏覽量

    50278
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    352

    瀏覽量

    29175
  • 智能音箱
    +關(guān)注

    關(guān)注

    31

    文章

    1794

    瀏覽量

    80840
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    探索LMV1091:高性能麥克風(fēng)陣列放大器的卓越之選

    探索LMV1091:高性能麥克風(fēng)陣列放大器的卓越之選 在當(dāng)今的語音通信應(yīng)用中,背景噪音的干擾常常影響語音的清晰和可懂。德州儀器(TI)推出的LMV1091
    的頭像 發(fā)表于 02-02 10:35 ?188次閱讀

    探索MAX9814:帶AGC和低噪聲麥克風(fēng)偏置的麥克風(fēng)放大器

    推出的MAX9814,這是一款帶有自動增益控制(AGC)和低噪聲麥克風(fēng)偏置的麥克風(fēng)放大器,它在眾多音頻應(yīng)用中都有著出色的表現(xiàn)。 文件下載: MAX9814.pdf 基本概述 MAX9814是一款低成本、高質(zhì)量的麥克風(fēng)放大器,具備
    的頭像 發(fā)表于 01-19 11:00 ?322次閱讀

    為什么你的藍(lán)牙耳機通話清晰?MEMS麥克風(fēng)是關(guān)鍵

    絕大多數(shù)用戶不知道,藍(lán)牙耳機和小音箱的清晰通話、主動降噪都依賴MEMS麥克風(fēng)。本文詳解MEMS麥克風(fēng)原理、優(yōu)勢及其在音頻設(shè)備中的核心應(yīng)用,帶您了解這項關(guān)鍵科技。
    的頭像 發(fā)表于 01-05 17:04 ?658次閱讀

    探究 InvenSense ICS - 40214 模擬 MEMS 麥克風(fēng):性能與應(yīng)用全解析

    探究 InvenSense ICS - 40214 模擬 MEMS 麥克風(fēng):性能與應(yīng)用全解析 在當(dāng)今的電子設(shè)備領(lǐng)域,從智能手機到可穿戴設(shè)備,麥克風(fēng)作為音頻輸入的關(guān)鍵組件,其性能的優(yōu)劣直接影響著音頻
    的頭像 發(fā)表于 12-26 11:15 ?378次閱讀

    TDK InvenSense ICS - 40800麥克風(fēng):性能、設(shè)計與應(yīng)用全解析

    TDK InvenSense ICS - 40800麥克風(fēng):性能、設(shè)計與應(yīng)用全解析 在當(dāng)今的電子設(shè)備中,麥克風(fēng)作為音頻輸入的關(guān)鍵組件,其性能和可靠性直接影響著設(shè)備的音頻質(zhì)量。TDK
    的頭像 發(fā)表于 12-26 11:15 ?629次閱讀

    探索英飛凌XENSIV? MEMS麥克風(fēng)柔性評估套件

    探索英飛凌XENSIV? MEMS麥克風(fēng)柔性評估套件 引言 在當(dāng)今的電子設(shè)備設(shè)計中,麥克風(fēng)的性能和易用性至關(guān)重要。英飛凌的XENSIV? MEMS麥克風(fēng)柔性評估套件為工程師們提供了一種便捷的方式來
    的頭像 發(fā)表于 12-21 10:55 ?838次閱讀

    測量麥克風(fēng)接口指南類型、區(qū)別與應(yīng)用解析你都知道嗎?

    供電 校準(zhǔn)/識別信號 l 機械鎖緊非??煽縧 適合實驗室、計量、半消聲室等高精度場合外極化供電要點 極化電壓常見為 200 V部分系統(tǒng)可在 0 / 200 V 間切換 極化電壓穩(wěn)定會影響麥克風(fēng)靈敏
    發(fā)表于 12-15 19:07

    揭秘藍(lán)牙耳機清晰通話的核心:高性能MEMS麥克風(fēng)

    為什么你的藍(lán)牙耳機通話不清、降噪不佳?問題可能出在MEMS麥克風(fēng)上。本文將揭秘MEMS麥克風(fēng)如何成為智能設(shè)備聽覺命脈,并重點介紹華芯邦MEMS產(chǎn)品如何憑借高信噪比與一致性提升音頻體驗。
    的頭像 發(fā)表于 11-11 14:16 ?754次閱讀

    藍(lán)牙耳機降噪核心技術(shù)解析:MEMS硅麥克風(fēng)如何重塑聽覺體驗?

    深入剖析藍(lán)牙耳機中MEMS硅麥克風(fēng)的技術(shù)優(yōu)勢,從微型化設(shè)計到射頻抗干擾能力,解讀索尼、Jabra等品牌如何通過多麥克風(fēng)陣列實現(xiàn)精準(zhǔn)降噪。結(jié)合瑞聲科技70dB高信噪比芯片案例,揭示國產(chǎn)MEMS突破對行業(yè)的影響,文末揭秘華芯邦研發(fā)方
    的頭像 發(fā)表于 11-06 16:04 ?691次閱讀
    藍(lán)牙耳機降噪核心技術(shù)解析:MEMS硅<b class='flag-5'>麥克風(fēng)</b>如何重塑聽覺體驗?

    ?基于STEVAL-STWINMA2麥克風(fēng)陣列擴展板的工業(yè)音頻傳感技術(shù)解析

    STMicroelectronics STEVAL-STWINMA2麥克風(fēng)陣列擴展板可為STEVAL-STWINKT1B(和STEVAL-STWINKT1)SensorTile無線工業(yè)節(jié)點
    的頭像 發(fā)表于 10-24 10:54 ?645次閱讀
    ?基于STEVAL-STWINMA2<b class='flag-5'>麥克風(fēng)</b><b class='flag-5'>陣列</b>擴展板的工業(yè)音頻傳感技術(shù)解析

    MEMS麥克風(fēng)設(shè)計注意事項和應(yīng)用指南

    MEMS麥克風(fēng)以其極致的小巧、卓越的性能、強大的穩(wěn)定性和極具競爭力的成本,席卷了從消費電子到工業(yè)物聯(lián)網(wǎng)的各個角落。無論是打造清晰通話的TWS耳機,賦予智能設(shè)備“聽”的能力,還是在嘈雜環(huán)境中精準(zhǔn)拾音,MEMS麥克風(fēng)都扮演著至關(guān)重要
    的頭像 發(fā)表于 08-29 13:48 ?8187次閱讀
    MEMS<b class='flag-5'>麥克風(fēng)</b>設(shè)計注意事項和應(yīng)用指南

    麥克風(fēng)輸入是否具有耳機控制功能(例如播放/停止、音量增減)?

    麥克風(fēng)輸入是否具有耳機控制功能(例如播放/停止、音量增減)
    發(fā)表于 08-29 06:14

    請問NUC505 支持?jǐn)?shù)字麥克風(fēng)嗎?

    NUC505 支持?jǐn)?shù)字麥克風(fēng)嗎?
    發(fā)表于 08-28 07:03

    麥克風(fēng)CE認(rèn)證要求

    哪些?麥克風(fēng)是否具有無線功能,決定適用的CE指令種類:1.普通有線麥克風(fēng)(無無線功能)適用以下指令:LVD指令(2014/35/EU):電氣安全要求EMC指令(2014/
    的頭像 發(fā)表于 07-28 17:25 ?964次閱讀
    <b class='flag-5'>麥克風(fēng)</b>CE認(rèn)證要求

    芯知識|語音識別芯片麥克風(fēng)配置指南:單麥與雙麥方案的技術(shù)選擇

    智能語音產(chǎn)品的開發(fā)過程中,麥克風(fēng)陣列的選型直接決定了用戶體驗的優(yōu)劣。廣州唯創(chuàng)電子提供的單麥克風(fēng)與雙麥克風(fēng)解決方案,為不同場景下的語音交互需
    的頭像 發(fā)表于 03-27 09:20 ?1962次閱讀
    芯知識|語音識別芯片<b class='flag-5'>麥克風(fēng)</b>配置指南:單麥與雙麥方案的技術(shù)選擇