Mozilla 宣布它正在使其眾包項目 Common Voice 支持更多語言。Common Voice 是一個旨在創(chuàng)建開源語音識別數(shù)據(jù)集的項目,于去年6月發(fā)布,它邀請來自世界各地的志愿者通過網(wǎng)絡(luò)和移動應(yīng)用程序,用他們的聲音記錄文本片段。
業(yè)內(nèi)普遍認為語音將成為下一個重要的技術(shù)平臺,近年來隨著人工智能理論與技術(shù)的迅猛發(fā)展,語音識別技術(shù)在不斷突破,通過語音助手如 Alexa、Google Assistant、Siri 和 Cortana,各公司將收集到的用戶語音數(shù)據(jù)歸為公司自己所有,這些數(shù)據(jù)的價值或許目前很難被外界看出來,但是在信息化高度發(fā)達,特別是今天這樣一個大數(shù)據(jù)和人工智能時代,為開發(fā)機器學(xué)習(xí)模型提供語音數(shù)據(jù)集怎么看都是一件有深遠意義的事,這些語音數(shù)據(jù)的意義會慢慢體現(xiàn)。
而最終當它們的價值逐漸顯現(xiàn),人們會發(fā)現(xiàn)在這背后亞馬遜、谷歌、蘋果和微軟等公司已經(jīng)牢牢鎖住了語音技術(shù)的命門,主導(dǎo)了這場語音市場之爭。
Common Voice 項目就是為了避免這樣的事情而誕生的,它的目的是將收集到的語音數(shù)據(jù)集開源給公眾,使得任何人都可以自由使用這些數(shù)據(jù)集來將語音識別技術(shù)智能地構(gòu)建到各種應(yīng)用程序和服務(wù)中。Mozilla 已經(jīng)在去年11月公布了 Common Voice 英語數(shù)據(jù)集的第一批成果,其中收錄了20000個人錄制的40萬個錄音、大約500小時的演講。此次 Mozilla 又宣布它正式開始收集法語、德語和威爾士語三種語言的語音數(shù)據(jù),同時也在為收集另外40種語言做準備,巴西葡萄牙語、印度尼西亞語、波蘭語和荷蘭語等已經(jīng)準備好啟動眾包語音數(shù)據(jù)收集。
Mozilla 首席創(chuàng)新官 Katharina Borchert 在他的博客中寫到:“我們希望用戶使用自己的語言甚至方言的時候是可以被機器理解的,但是我們相信這些技術(shù)上的接口不應(yīng)該由少數(shù)幾家公司控制,他們不能像守門員一樣來完全把控語音服務(wù)?!?/p>
Common Voice 項目的意義與用于打擊私人平臺的開放許可證項目類似,OpenStreetMap 就是一個很好的例子。OpenStreetMap 為開發(fā)者提供了開放且可自由使用的世界地圖,使得開發(fā)商不再需要依賴于 Google Maps 這樣的競爭對手,不僅降低了成本開銷,技術(shù)上也不再受到限制。
“使用多種語言標志著 Common Voice 邁出了重要的一步,我們希望它對整體語音技術(shù)來說也是一大步”,Mozilla Common Voice 項目的數(shù)字策略師 Michael Henretty 補充到:“語音技術(shù)的民主化不僅會降低全球創(chuàng)新的障礙,也會讓人們獲取信息更加便捷?!?/p>
-
Mozilla
+關(guān)注
關(guān)注
0文章
50瀏覽量
11588 -
語音識別
+關(guān)注
關(guān)注
39文章
1812瀏覽量
116071
原文標題:打破語音壟斷 Mozilla Common Voice 支持更多語言
文章出處:【微信號:robot-1hjqr,微信公眾號:1號機器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
京東多語言質(zhì)量解決方案
阿里巴巴國際站關(guān)鍵字搜索 API 實戰(zhàn):3 步搞定多語言適配 + 限流破局,詢盤量提升 40%
速賣通全球運營利器:商品詳情接口多語言 + 合規(guī) + 物流適配技術(shù)全解析
端到端語音交互數(shù)據(jù) 精準賦能語音大模型進階
聲智科技出席2025年北京市多語種AI語音翻譯大賽
用藥提醒新升級:WT588E02B-8S語音提示芯片實現(xiàn)語言播報
使用aicube進行目標檢測識別數(shù)字項目的時候,在評估環(huán)節(jié)卡住了,怎么解決?
EASY EAl Orin Nano(RK3576) whisper語音識別訓(xùn)練部署教程
離在線語音芯片WT2606A在智能鎖行業(yè)的應(yīng)用場景
芯資訊|WT2003HP8-32N(A20)語音芯片:賦能換電柜智能語音交互與遠程升級新體驗
明遠智睿SSD2351開發(fā)板:語音機器人領(lǐng)域的變革力量
智能收銀語音交互新標桿—WT3000T8語音合成芯片TTS技術(shù)應(yīng)用解析
Mozilla使用開源Common Voice語音識別數(shù)據(jù)集進行多語言操作
評論