蘋果正在努力讓Siri等語音技術(shù)更容易被語言模式不典型的用戶所接受。根據(jù)《華爾街日報》的報道,該公司正在研究如何自動檢測某人說話是否有口吃。為此,該公司已經(jīng)從播客中積累了近2.8萬個人們說話時有口吃的片段。
這一數(shù)據(jù)發(fā)表在本周的一份蘋果研究報告中(PDF鏈接:https://arxiv.org/pdf/2102.12394.pdf)。
雖然蘋果發(fā)言人拒絕評論它將如何使用這些數(shù)據(jù)的發(fā)現(xiàn),但至少該公司計劃至少利用其中的一部分來改進語音識別系統(tǒng)。在此期間,蘋果在2015年推出的Hold to Talk功能允許用戶控制他們希望Siri傾聽多長時間。這有助于防止助手在命令完全說出之前打斷用戶或超時。
雖然文章沒有提到,但Siri也可以在macOS和iOS上使用Type to Siri功能來激活和控制。
針對非典型語音模式的訓練只是Siri改進的一個研究領(lǐng)域。蘋果還在開發(fā)系統(tǒng),可以通過鎖定用戶獨特的語音模式來幫助保護設備的安全?!度A爾街日報》還報道了亞馬遜和谷歌等其他科技公司如何訓練他們的數(shù)字助理,以了解更多可能在語音命令方面有問題的用戶。
亞馬遜在去年12月推出了一個新的基金,允許擁有非典型語音模式的用戶訓練算法,以識別他們獨特的聲音。谷歌也在收集非典型語音數(shù)據(jù),用于谷歌助手。
責編AJX
-
蘋果
+關(guān)注
關(guān)注
61文章
24600瀏覽量
208361 -
語音識別
+關(guān)注
關(guān)注
39文章
1812瀏覽量
116047 -
語音助手
+關(guān)注
關(guān)注
7文章
241瀏覽量
27606
發(fā)布評論請先 登錄
每年10億美元,蘋果與谷歌官宣合作,Gemini大模型注入Siri
端側(cè)大模型上車:從“語音助手”到“車內(nèi) AI 智能體”的躍遷革命
分享一款高端離線語音識別IC AT680系列
國產(chǎn)32位MCU語音識別方案
【AI語音模組】自制小智管家?安信可Ai-WV01-32S測試體驗
語音識別芯片有哪些(語音識別芯片AT680系列)
什么是離線語音識別芯片(離線語音識別芯片有哪些優(yōu)點)
如何選擇合適的語音識別芯片型號
語音識別系統(tǒng)的技術(shù)核心:從聲音到文字的智能轉(zhuǎn)換
語音識別---大家怎么看呢?
廣和通發(fā)布自研端側(cè)語音識別大模型FiboASR
語音控制模塊工作原理
蘋果正改進Siri等語音助手識別用戶是否口吃
評論