91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

比MP3小10倍,Meta公開全新音頻壓縮技術

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 作者:OSC開源社區(qū) ? 2022-11-07 11:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Meta 近日在一篇題為 “High Fidelity Neural Audio Compression”(高保真神經(jīng)音頻壓縮)的論文中公布了一項名為 "EnCodec" 的開源音頻壓縮技術,該技術由 AI 驅動,可以在音頻質量沒有損失的前提下,將音頻壓縮到比 MP3 格式還要小 10 倍的程度。

bc8c974c-5dd1-11ed-a3b6-dac502259ad0.jpg

Meta 將這項技術的實現(xiàn)方法分成了一個由三部分組成的系統(tǒng),經(jīng)過訓練后的 AI 可以將音頻壓縮到所需的目標大小,其實現(xiàn)過程如下:

首先,編碼器將未壓縮的數(shù)據(jù)轉換為較低幀率的 "latent space" 表示(representation);

然后,量化器將這個表示壓縮到目標大小,同時跟蹤最重要的信息,這些信息以后將被用于重建原始信號(這個壓縮信號將通過網(wǎng)絡發(fā)送或保存在磁盤上);

最后,解碼器使用單個 CPU 上的神經(jīng)網(wǎng)絡將壓縮的數(shù)據(jù)實時地轉變回音頻;

至于應用,Meta 表示這種由人工智能驅動的 "超壓縮音頻" 可以在惡劣的網(wǎng)絡條件下獲得更快、更優(yōu)質的通話效果。作為一家 “梭哈” 元宇宙的公司,這項技術還可以提供更加豐富的元宇宙體驗(視頻會議、影音流媒體、VR 游戲等),而不需要提高帶寬。 除了語音通話,這項技術同樣可以應用于音樂領域,未來我們有望可以獲得高品質、小體積的音頻文件。 目前這項技術仍處于研究階段,源代碼和一些音頻樣本都已公開在 GitHub 上:https://github.com/facebookresearch/encodec

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265402
  • Meta
    +關注

    關注

    0

    文章

    322

    瀏覽量

    12458

原文標題:比MP3小10倍,Meta公開全新音頻壓縮技術

文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    為什么你的設備需要一款“不留痕”的MP3錄音芯片?揭秘WT2605-24SS如何引領音頻新潮流

    、高效。今天,我們要深入探討的,正是由專業(yè)語音芯片、語音IC廠家——廣州唯創(chuàng)電子推出的創(chuàng)新力作:WT2605-24SS高品質錄音芯片。它不僅重新定義了MP3錄音芯片
    的頭像 發(fā)表于 02-25 09:57 ?146次閱讀
    為什么你的設備需要一款“不留痕”的<b class='flag-5'>MP3</b>錄音芯片?揭秘WT2605-24SS如何引領<b class='flag-5'>音頻</b>新潮流

    芯知識|MP3語音芯片如何成為現(xiàn)代智能設備的“聲音心臟”?

    在智能化浪潮席卷全球的今天,從智能家居的溫聲細語到車載導航的清晰指引,背后都離不開一個核心元器件的驅動——MP3語音芯片。這種高度集成的MP3音頻解碼芯片,憑借其卓越的性能,已成為現(xiàn)代電子產(chǎn)品實現(xiàn)
    的頭像 發(fā)表于 01-05 08:50 ?217次閱讀
    芯知識|<b class='flag-5'>MP3</b>語音芯片如何成為現(xiàn)代智能設備的“聲音心臟”?

    MP3010M - EV 10變焦模組

    在無人機航拍技術快速發(fā)展的當下,一款合適的攝像機模組對提升航拍效果十分關鍵。MP3010M - EV 10變焦攝像機模組,憑借自身特性,在無人機航拍領域展現(xiàn)出獨特價值。
    的頭像 發(fā)表于 11-14 10:52 ?671次閱讀

    廣州唯創(chuàng)電子WT2003H MP3語音芯片方案:強大、靈活且易于集成的高性能音頻解決方案

    配置和簡便的集成方式,為各行業(yè)提供了一套完善的高品質聲音播報芯片解決方案。強大音頻處理能力,滿足多元應用場景WT2003H語音芯片支持MP3和WAV兩種主流音頻格式
    的頭像 發(fā)表于 10-27 08:33 ?464次閱讀
    廣州唯創(chuàng)電子WT2003H <b class='flag-5'>MP3</b>語音芯片方案:強大、靈活且易于集成的高性能<b class='flag-5'>音頻</b>解決方案

    多封裝長錄音:WT2003H系列MP3錄音芯片滿足全場景音頻需求

    系列MP3錄音芯片在8K采樣率下支持最長達70秒的連續(xù)錄音,這一時長指標在同類產(chǎn)品中表現(xiàn)優(yōu)異。通過優(yōu)化的存儲架構和高效的壓縮算法,芯片在保證語音清晰度的同時,實現(xiàn)了
    的頭像 發(fā)表于 10-16 09:12 ?859次閱讀
    多封裝長錄音:WT2003H系列<b class='flag-5'>MP3</b>錄音芯片滿足全場景<b class='flag-5'>音頻</b>需求

    廣州唯創(chuàng)WT2003H錄音芯片-高精度ADC/DAC+64mA驅動MP3音頻芯片

    一、產(chǎn)品概述:WT2003H系列MP3錄音芯片的技術優(yōu)勢1.1芯片定位與市場價值廣州唯創(chuàng)電子作為國內領先的語音IC廠家,推出的WT2003H系列MP3音頻芯片集高精度信號處理和強大驅動
    的頭像 發(fā)表于 10-16 09:03 ?507次閱讀
    廣州唯創(chuàng)WT2003H錄音芯片-高精度ADC/DAC+64mA驅動<b class='flag-5'>MP3</b><b class='flag-5'>音頻</b>芯片

    廣州唯創(chuàng)電子WT2003Hx高品質MP3語音芯片:重塑智能設備音頻體驗

    32位處理器與工業(yè)級品質的完美結合,為智能設備注入卓越音頻性能在智能化浪潮席卷各行各業(yè)的今天,音頻體驗已成為衡量智能設備品質的重要標準。廣州唯創(chuàng)電子推出的高品質MP3音頻解碼語音芯片W
    的頭像 發(fā)表于 09-29 09:27 ?593次閱讀
    廣州唯創(chuàng)電子WT2003Hx高品質<b class='flag-5'>MP3</b>語音芯片:重塑智能設備<b class='flag-5'>音頻</b>體驗

    Waytronic廣州唯創(chuàng)電子 MP3語音芯片:現(xiàn)代智能設備的音頻解決方案

    高品質音頻與低功耗設計的完美結合,為智能設備注入聲音靈魂在智能化浪潮席卷全球的今天,語音交互已成為人機互動的重要方式。MP3語音芯片作為高度集成的音頻處理解決方案,正以其出色的性能和創(chuàng)新技術
    的頭像 發(fā)表于 09-23 08:41 ?763次閱讀
    Waytronic廣州唯創(chuàng)電子 <b class='flag-5'>MP3</b>語音芯片:現(xiàn)代智能設備的<b class='flag-5'>音頻</b>解決方案

    廣州唯創(chuàng)電子WT2003HX高品質MP3音頻語音芯片在早教故事機中的智能化應用

    體驗與內容品質,廣州唯創(chuàng)電子推出的WT2003HX高品質MP3音頻語音芯片,為早教故事機提供了高音質、高靈活性的語音解決方案。一、清晰語音引導,提升人機交互體驗WT200
    的頭像 發(fā)表于 08-25 08:00 ?889次閱讀
    廣州唯創(chuàng)電子WT2003HX高品質<b class='flag-5'>MP3</b><b class='flag-5'>音頻</b>語音芯片在早教故事機中的智能化應用

    廣州唯創(chuàng)電子WT2003H4-16S高品質MP3音頻語音芯片在智能足浴桶中的應用介紹

    。廣州唯創(chuàng)電子研發(fā)的WT2003H4-16S高品質MP3音頻語音芯片,正是實現(xiàn)此類產(chǎn)品語音提示與多媒體功能的核心部件,為其賦予了更人性化、更智能的交互體驗。一、WT2
    的頭像 發(fā)表于 08-21 08:30 ?693次閱讀
    廣州唯創(chuàng)電子WT2003H4-16S高品質<b class='flag-5'>MP3</b><b class='flag-5'>音頻</b>語音芯片在智能足浴桶中的應用介紹

    廣州唯創(chuàng)電子WT2605C音頻藍牙MP3語音芯片:樓宇對講門鈴的智能“聲”力軍

    在智慧社區(qū)與智能家居深度融合的浪潮中,樓宇對講門鈴已從單純的通話工具,進化為社區(qū)安防與智慧生活的關鍵入口。廣州唯創(chuàng)電子推出的WT2605C-L011音頻藍牙MP3語音芯片,憑借其強大的多模通信與智能
    的頭像 發(fā)表于 08-05 08:45 ?2854次閱讀
    廣州唯創(chuàng)電子WT2605C<b class='flag-5'>音頻</b>藍牙<b class='flag-5'>MP3</b>語音芯片:樓宇對講門鈴的智能“聲”力軍

    新品|Unit AudioPlayer,支持 MP3/WAV 播放的音頻播放單元

    UnitAudioPlayer是一款自帶MP3解碼功能的音頻播放單元,內置高性能音頻解碼芯片N9301,自帶microSD卡座。該產(chǎn)品采用UART通信接口,用戶可通過配置指令實現(xiàn)音頻
    的頭像 發(fā)表于 06-20 15:59 ?926次閱讀
    新品|Unit AudioPlayer,支持 <b class='flag-5'>MP3</b>/WAV 播放的<b class='flag-5'>音頻</b>播放單元

    請問k230如何讀取sd卡并播放其中的mp3音頻,他有庫支持嗎?

    k230如何讀取sd卡并播放其中的mp3音頻,他有庫支持嗎?
    發(fā)表于 06-04 06:24

    芯資訊|廣州唯創(chuàng)電子語音芯片U盤MP3播放IC技術解析與應用指南

    ,在語音芯片領域積累了深厚的技術實力。唯創(chuàng)電子的核心創(chuàng)新之一是其支持U盤直讀的MP3語音芯片系列,這些芯片解決了傳統(tǒng)語音芯片需要專用工具更新語音內容的痛點,為用戶提
    的頭像 發(fā)表于 05-30 09:17 ?822次閱讀
    芯資訊|廣州唯創(chuàng)電子語音芯片U盤<b class='flag-5'>MP3</b>播放IC<b class='flag-5'>技術</b>解析與應用指南

    芯資訊|廣州唯創(chuàng)電子MP3語音芯片IC的音頻解碼方式解析

    格式支持、技術特性及應用場景三方面,解析其解碼方案的設計邏輯與優(yōu)勢。一、音頻解碼格式的支持MP3播放類芯片的主流解碼能力唯創(chuàng)電子的MP3語音芯片(如WT2003H系列)
    的頭像 發(fā)表于 05-28 08:48 ?841次閱讀
    芯資訊|廣州唯創(chuàng)電子<b class='flag-5'>MP3</b>語音芯片IC的<b class='flag-5'>音頻</b>解碼方式解析