91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

蘋果正改進Siri等語音助手識別用戶是否口吃

如意 ? 來源:cnBeta.COM ? 作者:cnBeta.COM ? 2021-02-26 14:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

蘋果正在努力讓Siri等語音技術(shù)更容易被語言模式不典型的用戶所接受。根據(jù)《華爾街日報》的報道,該公司正在研究如何自動檢測某人說話是否有口吃。為此,該公司已經(jīng)從播客中積累了近2.8萬個人們說話時有口吃的片段。

這一數(shù)據(jù)發(fā)表在本周的一份蘋果研究報告中(PDF鏈接:https://arxiv.org/pdf/2102.12394.pdf)。

雖然蘋果發(fā)言人拒絕評論它將如何使用這些數(shù)據(jù)的發(fā)現(xiàn),但至少該公司計劃至少利用其中的一部分來改進語音識別系統(tǒng)。在此期間,蘋果在2015年推出的Hold to Talk功能允許用戶控制他們希望Siri傾聽多長時間。這有助于防止助手在命令完全說出之前打斷用戶或超時。

雖然文章沒有提到,但Siri也可以在macOS和iOS上使用Type to Siri功能來激活和控制。

針對非典型語音模式的訓練只是Siri改進的一個研究領(lǐng)域。蘋果還在開發(fā)系統(tǒng),可以通過鎖定用戶獨特的語音模式來幫助保護設備的安全?!度A爾街日報》還報道了亞馬遜和谷歌等其他科技公司如何訓練他們的數(shù)字助理,以了解更多可能在語音命令方面有問題的用戶。

亞馬遜在去年12月推出了一個新的基金,允許擁有非典型語音模式的用戶訓練算法,以識別他們獨特的聲音。谷歌也在收集非典型語音數(shù)據(jù),用于谷歌助手。
責編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 蘋果
    +關(guān)注

    關(guān)注

    61

    文章

    24600

    瀏覽量

    208361
  • 語音識別
    +關(guān)注

    關(guān)注

    39

    文章

    1812

    瀏覽量

    116047
  • 語音助手
    +關(guān)注

    關(guān)注

    7

    文章

    241

    瀏覽量

    27606
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    語音識別IC分類,語音識別芯片的工作原理

    語音識別芯片,也叫語音識別集成電路,是一種集聲音存儲、播放、錄音及語音識別功能于一體的專用芯片。
    的頭像 發(fā)表于 01-14 15:22 ?238次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>識別</b>IC分類,<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片的工作原理

    每年10億美元,蘋果與谷歌官宣合作,Gemini大模型注入Siri

    該協(xié)議,下一代蘋果基礎(chǔ)模型(Apple Foundation Models)將基于谷歌的Gemini模型和云技術(shù)。 ? 蘋果:借Gemini之力,加速AI追趕 ? 長期以來,蘋果在AI領(lǐng)域的發(fā)展相對滯后,其
    的頭像 發(fā)表于 01-13 14:59 ?1548次閱讀

    端側(cè)大模型上車:從“語音助手”到“車內(nèi) AI 智能體”的躍遷革命

    生活空間”的可能性。當7B級大模型在車規(guī)級芯片上流暢運行,當多模態(tài)交互(語音+視覺+傳感)成為標配,車載助手已從“被動響應”升級為“主動決策”,成為車內(nèi)真正的“數(shù)字大腦”。這場由端側(cè)大模型驅(qū)動的變革,推動主機廠將“支持7B模型
    的頭像 發(fā)表于 01-13 09:10 ?467次閱讀

    分享一款高端離線語音識別IC AT680系列

    離線語音識別IC的本地處理帶來極速響應,識別指令可在毫秒級完成,用戶體驗流暢無延遲。除此之外,離線語音
    的頭像 發(fā)表于 12-30 16:19 ?250次閱讀

    國產(chǎn)32位MCU語音識別方案

    在智能家居、工業(yè)控制及便攜設備領(lǐng)域,語音交互成為人機界面的重要發(fā)展方向。針對離線語音識別需求,基于國產(chǎn)32位MCU的解決方案日益成熟,其中以CH32V307
    的頭像 發(fā)表于 12-04 15:11 ?540次閱讀

    【AI語音模組】自制小智管家?安信可Ai-WV01-32S測試體驗

    項目名:默語小智管家 模組支持: 安信可科技 AI語音模組 作者:安信可論壇用戶 molun 這兩年, AI 硬件又卷起來了。 ? 語音助手、AI寵物、智能陪伴…… “小智”類AI設備
    的頭像 發(fā)表于 11-19 16:06 ?603次閱讀
    【AI<b class='flag-5'>語音</b>模組】自制小智管家?安信可Ai-WV01-32S測試體驗

    語音識別芯片有哪些(語音識別芯片AT680系列)

    在人工智能技術(shù)飛速發(fā)展的今天,語音識別芯片作為人機交互的重要橋梁,正逐漸成為各類智能設備不可或缺的核心部件。與傳統(tǒng)的語音芯片不同,語音識別
    的頭像 發(fā)表于 11-14 17:11 ?1368次閱讀

    什么是離線語音識別芯片(離線語音識別芯片有哪些優(yōu)點)

    指令的識別與響應。無論是在家庭還是嘈雜的工業(yè)場合,這一類芯片都可以實現(xiàn)高準確率的智能語音交互,這種離線控制方式為用戶提供了極大的便利。
    的頭像 發(fā)表于 10-31 15:27 ?506次閱讀

    如何選擇合適的語音識別芯片型號

    語音識別芯片(又稱語音識別IC)是現(xiàn)代智能設備的核心組件,與傳統(tǒng)語音芯片相比,其最大特點是能夠主動識別
    的頭像 發(fā)表于 10-30 16:32 ?611次閱讀

    語音識別系統(tǒng)的技術(shù)核心:從聲音到文字的智能轉(zhuǎn)換

    ? ? ? 語音識別技術(shù),也稱為自動語音識別(ASR),其核心目標是將人類語音信號轉(zhuǎn)換為對應的文本或指令。隨著人工智能的發(fā)展,
    的頭像 發(fā)表于 09-05 14:04 ?836次閱讀

    語音識別---大家怎么看呢?

    語音識別是一門交叉學科。近二十年來,語音識別技術(shù)取得顯著進步,開始從實驗室走向市場。人們預計,未來10年內(nèi),語音
    發(fā)表于 08-09 10:54

    廣和通發(fā)布自研端側(cè)語音識別大模型FiboASR

    、高效會議記錄、多語種即時翻譯核心領(lǐng)域?qū)崿F(xiàn)重大技術(shù)突破,致力于為終端用戶帶來更自然、高效、私密的語音交互體驗。
    的頭像 發(fā)表于 08-04 11:43 ?1590次閱讀

    語音控制模塊工作原理

    語音控制芯片或者說模塊的應用前景越來越廣泛,無論是設計方案還是廠家生產(chǎn)的產(chǎn)品在越來越多越來越頻繁的使用語音控制芯片。當然行業(yè)內(nèi)更多的是稱呼為語音識別芯片,因為
    的頭像 發(fā)表于 06-17 11:49 ?1366次閱讀
    <b class='flag-5'>語音</b>控制模塊工作原理

    明遠智睿SSD2351開發(fā)板:語音機器人領(lǐng)域的變革力量

    接口則讓語音機器人可以連接到互聯(lián)網(wǎng),實時獲取最新的信息,增強其智能性和交互能力。 在實際應用場景中,以智能客服語音機器人為例。SSD2351開發(fā)板可以驅(qū)動語音識別模塊,準確
    發(fā)表于 05-28 11:36

    智能語音交互方案在客服領(lǐng)域的應用

    在當今數(shù)字化浪潮中,客服領(lǐng)域正經(jīng)歷著前所未有的變革,智能語音交互方案憑借其高效、便捷的特性,成為推動這一變革的核心力量。其中,語音識別模型優(yōu)化私部署方案與語音合成聲音定制方案作為兩大核
    的頭像 發(fā)表于 04-11 14:35 ?793次閱讀