近日,在美國波士頓舉行的Re-Work深度學習峰會上,美國高通公司的人工智能研究人員克里斯·洛特(Chris Lott)展示了其團隊在語音識別系統(tǒng)方面的新進展。
新語音識別系統(tǒng)識別單詞和短語的準確率達到了95%,可在智能手機或其他便攜設備上運行,包含兩個神經網絡:循環(huán)神經網絡(RNN)和卷積神經網絡(CNN)。循環(huán)神經網絡利用其內存來處理輸入信息,而卷積神經網絡則模仿人類大腦中神經元之間的聯(lián)系方式來處理信息。
洛特稱,現(xiàn)在大多數語音識別系統(tǒng)在云端進行運算過程。手機中的麥克風和芯片,智能音箱如谷歌Home和亞馬遜Echo,以及配置微軟Cortana 語音助手的Windows電腦,可以讓語音識別系統(tǒng)接傾聽一些熱門詞匯,例如“OK Google”或Hey Cortana,從而接受一系列語音指令。但是,它們不會分析這些指令,而只是將這些指令傳輸到運行復雜機器學習算法的強大遠程服務器上。
對于某些用戶來說,將其語音數據上傳到云端,這樣會讓他們擔心隱私方面的問題。亞馬遜Alexa和谷歌Assistant均會錄制語音片段,然后將它們發(fā)送出去進行分析。它們會一直保留這些語音片段,直到用戶選擇刪除它們。這兩家公司均表示,它們錄制語音是為了改善其服務,提供更加個性化的語音回答。
但是,在某些情況下,錄制語音無法保護用戶的隱私。在2016年,亞利桑那州調查一宗謀殺案的偵探在被告人的同意下訪問了一臺亞馬遜Echo智能音箱中的語音數據。
洛特稱,高通的這種語音識別系統(tǒng)直接在設備上處理數據,這樣做除了可以保護用戶的隱私之外,還具有多方面的好處。由于它不必將數據上傳到云端,它對于指令的反應速度更快。由于它不需要連接互聯(lián)網,因此它變得更加穩(wěn)定。
“我們努力按照某種神經網絡的形式來處理整個端到端系統(tǒng)?!彼f,“這樣可以讓用戶與設備的互動變得更加自然?!?/p>
洛特的話不無道理。在2016年,谷歌開發(fā)了一款離線語音識別系統(tǒng),它的速度是同時期其在線語音識別系統(tǒng)的7倍。這個離線語音識別系統(tǒng)利用語音數據進行了大約2000個小時的訓練,它的大小為20.3兆,在智能手機上運行,準確率為86.5%。
當然,這種設備端語音識別系統(tǒng)也有自身的局限性。離線工作的算法無法連接互聯(lián)網,并搜索問題的答案。而且,它們無法像云端系統(tǒng)那樣隨著數據的積累不斷地改進。
但是,洛特認為,高通的解決方案是面向未來的?!艾F(xiàn)在很多計算過程發(fā)生在云端,但是我們認為這個過程應該直接在設備上進行?!?/p>
-
高通
+關注
關注
78文章
7731瀏覽量
199816 -
語音識別系統(tǒng)
+關注
關注
0文章
19瀏覽量
11024
原文標題:高通宣稱其語音識別系統(tǒng)準確率高達95%
文章出處:【微信號:robotmagazine,微信公眾號:機器人技術與應用】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
鐵路車號識別系統(tǒng)的基本原理與應用
岸橋箱號識別系統(tǒng):精準高效,穩(wěn)定可靠#岸橋識別系統(tǒng) #岸橋理貨系統(tǒng) #岸橋箱號識別系統(tǒng)
手持火車號識別系統(tǒng)能識別哪些類型的火車#手持火車號識別設備 #手持終端火車號識別系統(tǒng)
工地AI行為識別系統(tǒng)作用
景區(qū)AI行為識別系統(tǒng)作用
工廠園區(qū)AI行為識別系統(tǒng)作用
岸橋箱號識別系統(tǒng)的應用場景#岸橋箱號識別軟件 #岸橋箱號識別系統(tǒng) #岸橋集裝箱號識別 #海關岸橋箱號識別
孚為智能岸橋識別系統(tǒng)實現(xiàn)秒級精準理貨 #岸橋集裝箱號碼識別系統(tǒng) #集裝箱岸橋理貨軟件 #AI岸橋識別系統(tǒng)
火車車號識別系統(tǒng)的工作原理 #火車車號識別系統(tǒng) #火車車號識別器 #火車車號識別裝置 #火車車號識別
高通語音識別系統(tǒng)近乎完美
評論