91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌宣布開源Android語音識別轉錄工具 —— Live Transcribe的語音引擎

SwM2_ChinaAET ? 來源:lq ? 2019-10-01 17:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌在其開源博客中宣布開源 Android 語音識別轉錄工具 —— Live Transcribe 的語音引擎(Live Transcribe Speech Engine),它旨在將語音或對話實時轉錄為文字,還能夠為聽障人士提供幫助。

Live Transcribe 是谷歌于今年 2 月推出的一款 Android 應用程序,它的語音識別由谷歌最先進的 Cloud Speech API 提供。但是,依賴于云引入了一些復雜性,不斷變化的網絡連接、數據成本和延遲的魯棒性等等都帶來一些考驗。因此,谷歌把它開源出來, 希望開發(fā)人員在已有的基礎上進一步構建和開發(fā)。

Cloud Speech API 目前無法支持無限的音頻流,團隊目前采取了一些措施來解決這一難題,例如在達到超時之前關閉并重新啟動流式傳輸請求,這將有效減少會話中丟失的文本量。

無限流媒體音頻帶來了一大挑戰(zhàn)。在許多國家,網絡數據非常昂貴,并且在互聯網較差的地方,帶寬可能有限。Live Transcribe Speech Engine 的團隊對音頻編解碼器進行了大量實驗,并最終在不影響精度的情況下將數據使用量減少了 10 倍。

另外,由于是提供實時語音轉錄,轉錄出來的文本會隨著語音的輸入不斷發(fā)生變化,降低延遲自然十分必要。該引擎能夠大大降低延遲率,這都要歸功于它的自定義 Opus 編碼器

此外,值得一提的是,Live Transcribe 支持超過 70 種語言,并能夠根據語音自動識別語種,其中也包括中文。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 解碼器
    +關注

    關注

    9

    文章

    1219

    瀏覽量

    43425
  • 谷歌
    +關注

    關注

    27

    文章

    6254

    瀏覽量

    111406
  • 語音識別
    +關注

    關注

    39

    文章

    1812

    瀏覽量

    116055

原文標題:【業(yè)內熱點】谷歌開源實時語音轉錄引擎 Live Transcribe Speech Engine

文章出處:【微信號:ChinaAET,微信公眾號:電子技術應用ChinaAET】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    語音識別IC分類,語音識別芯片的工作原理

    語音識別芯片,也叫語音識別集成電路,是一種集聲音存儲、播放、錄音及語音識別功能于一體的專用芯片。
    的頭像 發(fā)表于 01-14 15:22 ?243次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>識別</b>IC分類,<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片的工作原理

    語音識別芯片有哪些(語音識別芯片AT680系列)

    在人工智能技術飛速發(fā)展的今天,語音識別芯片作為人機交互的重要橋梁,正逐漸成為各類智能設備不可或缺的核心部件。與傳統的語音芯片不同,語音識別
    的頭像 發(fā)表于 11-14 17:11 ?1374次閱讀

    廣州唯創(chuàng)電子WTK6900H-24SS語音識別芯片:智能語音控制賦能臺燈創(chuàng)新應用 | 語音IC廠家

    在智能家居快速發(fā)展的今天,語音交互技術正在深刻改變人們與家居設備的互動方式。臺燈作為日常生活中不可或缺的照明工具,其智能化升級已成為行業(yè)發(fā)展的重要趨勢。廣州唯創(chuàng)電子作為國內領先的語音IC廠家,推出
    的頭像 發(fā)表于 11-05 09:20 ?783次閱讀
    廣州唯創(chuàng)電子WTK6900H-24SS<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片:智能<b class='flag-5'>語音</b>控制賦能臺燈創(chuàng)新應用 | <b class='flag-5'>語音</b>IC廠家

    廣州唯創(chuàng)電子WTK6900H-32N語音識別芯片:智能語音控制賦能LED燈帶創(chuàng)新應用 | 語音IC廠家

    芯片,憑借其卓越的性能和精準的識別能力,在LED燈帶控制領域展現出強大的應用價值,為智能照明系統帶來了革命性的創(chuàng)新突破。一、核心技術優(yōu)勢1.1高性能語音識別引擎WT
    的頭像 發(fā)表于 11-04 08:53 ?675次閱讀
    廣州唯創(chuàng)電子WTK6900H-32N<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片:智能<b class='flag-5'>語音</b>控制賦能LED燈帶創(chuàng)新應用 | <b class='flag-5'>語音</b>IC廠家

    什么是離線語音識別芯片(離線語音識別芯片有哪些優(yōu)點)

    離線語音識別芯片,是一種集成了語音信號采集、前端處理和本地識別功能的專用集成電路,無須聯網也可以進行語音控制。它內設先進的數字信號處理模塊及
    的頭像 發(fā)表于 10-31 15:27 ?511次閱讀

    如何選擇合適的語音識別芯片型號

    語音識別芯片(又稱語音識別IC)是現代智能設備的核心組件,與傳統語音芯片相比,其最大特點是能夠主動識別
    的頭像 發(fā)表于 10-30 16:32 ?615次閱讀

    基于開源鴻蒙的語音識別語音合成應用開發(fā)樣例

    本期內容由AI Model SIG提供,介紹了在開源鴻蒙中,利用sherpa_onnx開源三方庫進行ASR語音識別與TTS語音合成應用開發(fā)的
    的頭像 發(fā)表于 08-25 14:26 ?4117次閱讀
    基于<b class='flag-5'>開源</b>鴻蒙的<b class='flag-5'>語音</b><b class='flag-5'>識別</b>及<b class='flag-5'>語音</b>合成應用開發(fā)樣例

    瑞芯微RK3576語音識別算法

    1.語音識別簡介語音識別技術,也被稱為自動語音識別(AutomaticSpeechRecogni
    的頭像 發(fā)表于 08-15 15:13 ?2193次閱讀
    瑞芯微RK3576<b class='flag-5'>語音</b><b class='flag-5'>識別</b>算法

    語音識別---大家怎么看呢?

    語音識別是一門交叉學科。近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。人們預計,未來10年內,語音
    發(fā)表于 08-09 10:54

    廣和通發(fā)布自研端側語音識別大模型FiboASR

    7月,全球領先的無線通信模組及AI解決方案提供商廣和通,發(fā)布其自主研發(fā)的語音識別大模型FiboASR。該模型專為端側設備上面臨的面對面實時對話及多人會議場景深度優(yōu)化,在低延遲語音交互、實時語音
    的頭像 發(fā)表于 08-04 11:43 ?1598次閱讀

    EASY EAl Orin Nano(RK3576) whisper語音識別訓練部署教程

    1Whisper簡介Whisper是OpenAI開源的,識別語音識別能力已達到人類水準自動語音識別
    的頭像 發(fā)表于 07-25 15:21 ?855次閱讀
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>語音</b><b class='flag-5'>識別</b>訓練部署教程

    EASY EAl Orin Nano(RK3576) whisper語音識別訓練部署教程

    Whisper是OpenAI開源的,識別語音識別能力已達到人類水準自動語音識別系統。Whispe
    的頭像 發(fā)表于 07-17 14:55 ?1769次閱讀
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>語音</b><b class='flag-5'>識別</b>訓練部署教程

    明遠智睿SSD2351開發(fā)板:語音機器人領域的變革力量

    。 開發(fā)板支持浮點運算,這對于語音信號處理中的精確計算至關重要。在語音識別過程中,需要對語音信號的頻率、幅度等參數進行精確計算和分析,浮點運算能夠確保計算結果的準確性,從而提高
    發(fā)表于 05-28 11:36

    芯資訊|廣州唯創(chuàng)電子WTK6900P語音識別芯片:離線語音交互的革新者

    在智能設備全面普及的浪潮中,語音交互技術正逐步從“云端依賴”向“本地化高效處理”演進。廣州唯創(chuàng)電子推出的WTK6900P語音識別芯片,憑借其本地化離線語音
    的頭像 發(fā)表于 05-22 09:22 ?792次閱讀
    芯資訊|廣州唯創(chuàng)電子WTK6900P<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片:離線<b class='flag-5'>語音</b>交互的革新者