91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

讓萬物聽說:亞馬遜Alexa語音交互系統(tǒng)背后的聲音

姚小熊27 ? 來源:與非網(wǎng) ? 作者:夏珍 ? 2020-06-17 14:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

“宿命”之說

“目前音頻壓縮算法的碼率日趨降低,研究空間相對較窄,主要是在某種算法的基礎(chǔ)上對特定應用的改進和定制。音頻信號的研究還可以在下列更廣闊的方向開展下去:基于信號模型的音頻內(nèi)容描述、特征提取、分類與檢索。這些研究可以作為多媒體數(shù)據(jù)庫研究的一個子課題,實現(xiàn)音頻數(shù)據(jù)庫的組織和管理,基于內(nèi)容的音頻點播等。在人機交互方面,音頻內(nèi)容的描述可以用于音頻一視頻信號處理(Audio 一 Visual Signal Processing),實現(xiàn)音視頻信號交互、信號對應、信號關(guān)連等應用?!?/p>

這段文字來源于 2003 年一篇題為《基于正弦+噪聲模型的寬帶音頻信號的表示與壓縮》的文章,是今天筆者要介紹的主人公——宋少鵬的碩士畢業(yè)論文節(jié)選。細讀這段文字,一個即將畢業(yè)的學生對音頻信號未來的發(fā)展是有積極想法的,我們似乎就可以清晰地看到這個年輕人將走上的職業(yè)生涯道路。

時間是最好的證明,這個從華南理工大學無線電系畢業(yè)的小伙子近 20 年來真的就只做了一件事,這件事就是音頻信號處理。常有人問他為什么喜歡這個領(lǐng)域、認定這個方向的時候,他都會笑著答道,“兒時的興趣,我一直對聲波、電波充滿興趣,小時候聽黑膠唱片,聽磁帶,就一直想鉆進去看看是誰在里面唱歌。此外,我的中文名字宋少鵬的拼音首字母縮寫是 SSP,而音頻信號處理(Sound Signal Processing)的英文首字母縮寫也是 SSP,因此這是一種宿命,很早就注定了的?!?/p>

我的職業(yè)生涯一路向前,沒有轉(zhuǎn)折

上面講到 2003 年宋少鵬碩士畢業(yè),這一年他放棄了大公司的 offer,選擇進入一家以色列芯片公司 Zoran 做軟件開發(fā),鉆研音頻 DSP 技術(shù)。值得一提的是,全球第一個全套杜比單芯片解決方案就來自這家公司。

2010 年,他又去了微軟亞洲硬件中心,從事硬件產(chǎn)品的研發(fā)制造,經(jīng)手產(chǎn)品包括智能攝像頭、Kinnet 體感設備等。

就在 2012 年左右,他發(fā)現(xiàn)智能手機、電視、汽車都在向聯(lián)網(wǎng)化發(fā)展,由于給用戶帶來了豐富的內(nèi)容、社交和娛樂體驗,這些產(chǎn)業(yè)得到蓬勃發(fā)展。與此同時,音頻設備卻還沒有聯(lián)網(wǎng),這在一個專業(yè)音頻從業(yè)者眼中,便是機遇。而眼前急切要弄清楚的是:如何聯(lián)網(wǎng)?如何承載娛樂和社交?

帶著這些思考,還在微軟供職的宋少鵬便尋找機會開始嘗試,這次嘗試不算成功,在他看來,原因有兩點,一是當時行業(yè)環(huán)境還不太成熟,二是大公司的體制存在一定的限制。

宋少鵬在后來接受利器的采訪時被問到職業(yè)生涯的轉(zhuǎn)折點,他直言不諱地說:“我的職業(yè)生涯一路向前,沒有轉(zhuǎn)折?!币虼?,回溯到上述那次不太成功的嘗試,摸清原因,認準方向也是他職業(yè)道路上的收貨,當然不止于此,他還結(jié)識了一幫志同道合的朋友。于是在 2013 年的某一天,他帶著這個團隊毅然決然的開始了他們的創(chuàng)業(yè)闖蕩。

2014 年,米唐在深圳這個遠離中國的政治和經(jīng)濟中心的灣區(qū)成立了,他喜歡那里自發(fā)式、民營式、創(chuàng)新型的經(jīng)濟模式,大家都來自江西、湖南、江蘇、四川、中國各地,移民所帶來的一些共同的特質(zhì),比如說勇敢、不屈服、創(chuàng)新,這些都與他的團隊惺惺相惜。

從產(chǎn)品到解決方案,都在用心做“耳朵”

公司成立初期,產(chǎn)業(yè)的不成熟,加上創(chuàng)業(yè)公司交付能力的有限,使得米唐沒辦法短時間內(nèi)在語音交互領(lǐng)域拿出產(chǎn)品化的東西,基于訊飛 SDK 和谷歌 SDK 的嘗試又均不能滿足這個團隊對產(chǎn)品體驗的要求,而一家公司要生存下去就必須要有良好的資金回流,于是他們的第一款產(chǎn)品“方糖音箱”放棄了語音的交互,只保留了兩項特殊的“體感”操作方式:輕拍音箱頂部開始播放音樂或暫停,向左或向右傾斜切換上下曲目。

這款音箱通過 WiFi 連接上網(wǎng),可脫離手機獨立工作,并內(nèi)置了不少音樂電臺,比如豆瓣電臺、荔枝 FM、還有一些國際電臺,同時它還能記錄個人喜好,進行智能推薦。若是用戶在互動中能會心一笑,那在宋少鵬的眼中,除了趣味更是一種關(guān)懷帶來的暖意。

“產(chǎn)品就像藝術(shù)品,源于生活,高于生活,要從生活中抽象提煉需求,發(fā)掘人性?!边@與宋少鵬以人性、人文觀點來思考產(chǎn)品設計的觀點高度契合。但生活要繼續(xù),公司更需發(fā)展,經(jīng)濟基礎(chǔ)決定上層建筑,即使方糖在 2015 年就開始銷往海外,并推出了同樣設計的藍牙音箱,以謀取更多的利潤,一年數(shù)萬臺的銷量還是顯得捉襟見肘。

作為一家始終觀察著這個領(lǐng)域的創(chuàng)業(yè)企業(yè),2015 年底,他們看到了亞馬遜的 Echo 和背后的 Alexa 語音交互系統(tǒng)。最初亞馬遜 Echo 以 MVP(最小可用原型)的形態(tài)交付用戶,語音識別和語義理解都僅能滿足流媒體播放的簡單需求,但是經(jīng)過一兩年的打磨,到了 2016 年,Echo 的體驗就好了很多,它既可以提供音頻內(nèi)容,也可以提供生活服務,包括音樂、電臺、有聲書、新聞、天氣、鬧鐘、日程等。這時候亞馬遜也將 Alexa 語音交互平臺開放出來,于是米唐團隊在第一時間找到了亞馬遜。大概花了三四個月的時間,在眾多想接入 Alexa 的競爭者中,方糖成為首個通過亞馬遜認證的第三方音箱產(chǎn)品。

“通過亞馬遜的認證后,Alexa 團隊的人就主動找到了我,問我一年能夠賣多少,我說幾萬臺,亞馬遜就說做他們的技術(shù)方案商,可以幫米唐一年賣幾百萬個解決方案”,宋少鵬回憶稱這是亞馬遜幫團隊找到了方向。于是,一個擅長做技術(shù)的團隊,開始從做 C 端產(chǎn)品轉(zhuǎn)向做 B 端的方案,并決意將自己定位為聚焦海外市場的語音交互解決方案提供商。

“讓萬物聽說”是使命所在

目前,米唐的業(yè)務已擴展到家用電器、汽車和消費電子產(chǎn)品等多個領(lǐng)域,而其核心競爭力是他們的遠場語音交互算法,在響應速度、識別率、去噪、聲源定位和產(chǎn)品良率方面均做得還不錯。

“作為創(chuàng)業(yè)狗,在哪都能工作。出差路上的飛行和堵車時的 YY 是獲得靈感的方式,出差的時候會帶一本書,和一個趁早筆記本?!彼紊蠃i如是說,“當你做一個事情,真正站在場景和用戶的角度去思考,才有可能在價值上有所突破,而當你受制于既得利益時,其實會做很多束縛手腳的事情?!?/p>

未來的米唐會發(fā)展成怎樣,沒人可以預判,但“讓萬物聽說”會成為它和它背后的這個團隊不變的使命。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    21

    文章

    3122

    瀏覽量

    122322
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    354

    瀏覽量

    29188
  • 亞馬遜
    +關(guān)注

    關(guān)注

    8

    文章

    2732

    瀏覽量

    85832
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    智能網(wǎng)關(guān):開啟萬物互聯(lián)的智慧新篇章

    。它不僅是技術(shù)進步的產(chǎn)物,更是人類對美好生活追求的體現(xiàn)。隨著AI、6G、量子通信等技術(shù)的融合,智能網(wǎng)關(guān)將推動萬物互聯(lián)向更深層次發(fā)展,為智能家居、工業(yè)4.0、智慧城市等領(lǐng)域注入持續(xù)動能。 未來,每一個智能場景的背后,都將有一臺強大的智能網(wǎng)關(guān)在默默支撐。它或許不顯眼,卻正在改
    發(fā)表于 01-09 10:41

    芯知識|可錄音語音芯片如何實現(xiàn)聲音的儲存與重放?

    語音交互技術(shù)高速發(fā)展的今天,絕大多數(shù)設備的“聲音”功能仍停留在單向播報階段。然而,有一類特殊的語音芯片,不僅能讓設備“開口說話”,更能使其“聽見并記住”外界
    的頭像 發(fā)表于 01-08 09:44 ?228次閱讀
    芯知識|可錄音<b class='flag-5'>語音</b>芯片如何實現(xiàn)<b class='flag-5'>聲音</b>的儲存與重放?

    從感知到播放,WT2003H語音芯片完美適配不同類型傳感器,省事又省錢!

    聲音背后,其實蘊含著一套完整的智能感知體系。今天的#唯創(chuàng)語音芯片小課堂,就讓我們一起走進語音芯片和傳感交互的世界,看看它是如何
    的頭像 發(fā)表于 09-30 15:50 ?996次閱讀
    從感知到播放,WT2003H<b class='flag-5'>語音</b>芯片完美適配不同類型傳感器,省事又省錢!

    華為攜手共贏萬物互聯(lián)的智能時代

    ”,站在新的起點上,通過創(chuàng)新與開放,持續(xù)為產(chǎn)業(yè)創(chuàng)造新價值。鴻蒙智聯(lián)萬物,打造AI原生的全場景終端操作系統(tǒng);鯤鵬昇騰全面開源開放,為世界提供堅實的算力底座;華為云做智能世界黑土地,加速千行業(yè)智能化;開放、合作、共贏,構(gòu)建可持續(xù)發(fā)
    的頭像 發(fā)表于 09-20 15:54 ?1836次閱讀

    “芯”聲代,智未來—VS680本地語音交互系統(tǒng) #語音交互 #芯片

    語音交互
    深蕾半導體
    發(fā)布于 :2025年09月17日 10:59:30

    IOTE聯(lián)網(wǎng)展|智聲賦能萬物,唯創(chuàng)知音【新】品齊聚深圳

    聯(lián)盛會啟幕,智聲創(chuàng)新登場8月27日至29日,IOTE聯(lián)網(wǎng)展會·深圳站在深圳國際會展中心(寶安新館)盛大啟幕,唯創(chuàng)知音以"智聲賦能萬物"為主題,攜六大核心產(chǎn)品線重磅亮相展位
    的頭像 發(fā)表于 08-29 12:03 ?1126次閱讀
    IOTE<b class='flag-5'>物</b>聯(lián)網(wǎng)展|智聲賦能<b class='flag-5'>萬物</b>,唯創(chuàng)知音【新】品齊聚深圳

    聯(lián)網(wǎng)云平臺的作用有哪些?萬物互聯(lián)

    、城市管理、民生服務等諸多領(lǐng)域的運作模式。 一、設備互聯(lián)的“翻譯官”:打破異構(gòu)設備的通信壁壘 聯(lián)網(wǎng)的核心是“萬物互聯(lián)”,但現(xiàn)實中設備的多樣性和協(xié)議的碎片化,使得“連接”成為首要難題。聯(lián)網(wǎng)云平臺的首要作用,就是
    的頭像 發(fā)表于 08-07 18:00 ?1065次閱讀

    聯(lián)網(wǎng)設備也能‘開口說話’?Aircall實時通話功能讓智能交互觸手可及

    成為能‘聽懂’需求、‘說出’答案的智能伙伴?!?在萬物互聯(lián)的時代,語音通話是最自然的交互方式。 ? Air8000工業(yè)引擎Aircall功能:將復雜的通話流程簡化為三次點擊,為聯(lián)網(wǎng)設
    的頭像 發(fā)表于 07-07 09:26 ?832次閱讀
    <b class='flag-5'>物</b>聯(lián)網(wǎng)設備也能‘開口說話’?Aircall實時通話功能讓智能<b class='flag-5'>交互</b>觸手可及

    從‘指令接收器’到‘語音伙伴’:Aircall聯(lián)網(wǎng)設備實時通話能力落地!

    萬物互聯(lián)的時代,語音通話是最自然的交互方式。 Air8000工業(yè)引擎Aircall功能: 將復雜的通話流程簡化為三次點擊,為聯(lián)網(wǎng)設備賦予實時通話能力。其簡潔的API設計大幅降低開發(fā)門
    的頭像 發(fā)表于 07-06 16:12 ?551次閱讀
    從‘指令接收器’到‘<b class='flag-5'>語音</b>伙伴’:Aircall<b class='flag-5'>讓</b><b class='flag-5'>物</b>聯(lián)網(wǎng)設備實時通話能力落地!

    思必馳天穹3.0交互更自由隨心

    作為全屋智能語音交互系統(tǒng),天穹3.0基于思必馳中樞大模型構(gòu)建,融合了全鏈路語音交互技術(shù),采用“云端 + SDK”架構(gòu),云端有多個大模型協(xié)同運
    的頭像 發(fā)表于 07-01 14:44 ?921次閱讀

    華為攜手產(chǎn)業(yè)伙伴共贏萬物智聯(lián)新時代未來

    ,IoT與AI融合共生智能無處不在、無所不達。他進一步在發(fā)言中表示“實現(xiàn)萬物智聯(lián)需要具備三大關(guān)鍵要素:全場景物聯(lián),所有對象可連接;全超寬網(wǎng)絡,所有數(shù)據(jù)聯(lián)云聯(lián)算;全智能加持,
    的頭像 發(fā)表于 06-23 16:53 ?1117次閱讀

    芯資訊|廣州唯創(chuàng)電子WTV系列語音芯片:以技術(shù)創(chuàng)新賦能智能語音交互

    萬物互聯(lián)的智能化時代,語音交互技術(shù)已成為人機交互的重要橋梁。廣州唯創(chuàng)電子深耕語音芯片領(lǐng)域多年,憑借自主研發(fā)的WTV系列
    的頭像 發(fā)表于 05-21 08:45 ?751次閱讀
    芯資訊|廣州唯創(chuàng)電子WTV系列<b class='flag-5'>語音</b>芯片:以技術(shù)創(chuàng)新賦能智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>

    從智能穿戴到智能家居:晶振如何賦能萬物互聯(lián)

    當你輕觸智能手表查看心率,或是通過語音指令智能家居開啟燈光,背后都有一個微小卻至關(guān)重要的元件在默默發(fā)力——晶振。在萬物互聯(lián)的時代浪潮下,從貼身的智能穿戴設備到全屋智能生態(tài)
    的頭像 發(fā)表于 04-22 11:08 ?645次閱讀
    從智能穿戴到智能家居:晶振如何賦能<b class='flag-5'>萬物</b>互聯(lián)

    智能語音交互方案在客服領(lǐng)域的應用

    在當今數(shù)字化浪潮中,客服領(lǐng)域正經(jīng)歷著前所未有的變革,智能語音交互方案憑借其高效、便捷的特性,成為推動這一變革的核心力量。其中,語音識別模型優(yōu)化私部署方案與語音合成
    的頭像 發(fā)表于 04-11 14:35 ?842次閱讀

    麻了!6440萬物聯(lián)網(wǎng)智慧路燈,我會……

    麻了!6440萬物聯(lián)網(wǎng)智慧路燈,我會……
    的頭像 發(fā)表于 04-10 08:43 ?751次閱讀
    麻了!6440<b class='flag-5'>萬物</b>聯(lián)網(wǎng)智慧路燈,我會……