91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

借助深度學(xué)習(xí)算法實(shí)現(xiàn)5秒內(nèi)克隆你的聲音

Android編程精選 ? 來源:開源前線整理 ? 作者:開源前線整理 ? 2021-09-29 11:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大家應(yīng)該都知道聲音克隆技術(shù),通俗的來說就是借助深度學(xué)習(xí)算法,可以完全模擬某個(gè)人的聲音,而且由機(jī)器合成的語音連情緒都能夠完美表達(dá)出來,基本可以以假亂真,只要不見面,你根本就察覺不出來向你發(fā)出聲音的知識一個(gè)機(jī)器。

語音克隆最大的創(chuàng)新之一是減少創(chuàng)建語音所需的原始數(shù)據(jù)量。過去,該系統(tǒng)需要數(shù)十甚至數(shù)百小時(shí)的音頻。但是,今天猿妹要和大家分享的這個(gè)工具5秒鐘就可以克隆成功,這個(gè)工具名叫——MockingBird。

MockingBird已經(jīng)登上Github熱榜,收獲3.5K的Star,累計(jì)分支 303(Github地址:https://github.com/babysor/MockingBird)

MockingBird具有如下特性:

支持普通話并使用多種中文數(shù)據(jù)集進(jìn)行測試

適用于 pytorch,已在 1.9.0 版本(最新于 2021 年 8 月)中測試,GPU Tesla T4 和 GTX 2060

支持 Windows + Linux

僅使用新訓(xùn)練的合成器(synthesizer)就有良好效果,復(fù)用預(yù)訓(xùn)練的編碼器/聲碼器

MockingBird如何使用

MockingBird的安裝要求如下:

首先,MockingBird需要Python 3.7 或更高版本

安裝 PyTorch

安裝 ffmpeg。

運(yùn)行pip install -r requirements.txt 來安裝剩余的必要包。

安裝 webrtcvad 用 pip install webrtcvad-wheels。

接著,你需要使用數(shù)據(jù)集訓(xùn)練合成器:

下載 數(shù)據(jù)集并解壓:確保您可以訪問 train 文件夾中的所有音頻文件(如.wav)

使用音頻和梅爾頻譜圖進(jìn)行預(yù)處理:python synthesizer_preprocess_audio.py 《datasets_root》 可以傳入?yún)?shù) --dataset {dataset} 支持 adatatang_200zh, magicdata, aishell3

預(yù)處理嵌入:python synthesizer_preprocess_embeds.py 《datasets_root》/SV2TTS/synthesizer

訓(xùn)練合成器:python synthesizer_train.py mandarin 《datasets_root》/SV2TTS/synthesizer

當(dāng)你在訓(xùn)練文件夾 synthesizer/saved_models/ 中看到注意線顯示和損失滿足您的需要時(shí),請轉(zhuǎn)到下一步。

使用預(yù)先訓(xùn)練好的合成器,如果沒有設(shè)備或者不想慢慢調(diào)試,可以使用網(wǎng)友貢獻(xiàn)的模型。

訓(xùn)練聲碼器

預(yù)處理數(shù)據(jù): python vocoder_preprocess.py 《datasets_root》

訓(xùn)練聲碼器: python vocoder_train.py mandarin 《datasets_root》

啟動(dòng)工具箱

然后你可以嘗試使用工具箱:python demo_toolbox.py -d 《datasets_root》

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    4204

    瀏覽量

    46130
  • 克隆
    +關(guān)注

    關(guān)注

    0

    文章

    22

    瀏覽量

    8036
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5599

    瀏覽量

    124396

原文標(biāo)題:5秒內(nèi)克隆你的聲音,并生成任何內(nèi)容,這個(gè)工具細(xì)思極恐...還特么的開源~

文章出處:【微信號:AndroidPush,微信公眾號:Android編程精選】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    歡迎使用中國香河英茂科工豆包智能體

    (替出鏡/直播) 適合:短視頻、直播、虛擬主播、口播 1. 剪映(最快,免費(fèi)) 導(dǎo)入的30+說話視頻(單人、清晰) 底部工具欄 → 文本 → 滑到數(shù)字人 → 選克隆視頻形象 上傳
    發(fā)表于 02-14 07:22

    穿孔機(jī)頂頭檢測儀 機(jī)器視覺深度學(xué)習(xí)

    頂頭狀態(tài)。 檢測頂頭算法 引入人工智深度學(xué)習(xí)技術(shù),通過Keras實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)(CNN),用Numpy實(shí)現(xiàn)采集數(shù)據(jù)的訓(xùn)練,得到符合現(xiàn)場需求
    發(fā)表于 12-22 14:33

    【團(tuán)購】獨(dú)家全套珍藏!龍哥LabVIEW視覺深度學(xué)習(xí)實(shí)戰(zhàn)課(11大系列課程,共5000+分鐘)

    行業(yè)市場具備深度學(xué)習(xí)能力的視覺系統(tǒng)占比已突破40%,催生大量復(fù)合型技術(shù)崗位需求: ? 崗位缺口:視覺算法工程師全國缺口15萬+,缺陷檢測專項(xiàng)人才招聘響應(yīng)率僅32% ? 薪資水平:掌握LabVIEW+
    發(fā)表于 12-04 09:28

    【團(tuán)購】獨(dú)家全套珍藏!龍哥LabVIEW視覺深度學(xué)習(xí)實(shí)戰(zhàn)課程(11大系列課程,共5000+分鐘)

    行業(yè)市場具備深度學(xué)習(xí)能力的視覺系統(tǒng)占比已突破40%,催生大量復(fù)合型技術(shù)崗位需求: ? 崗位缺口:視覺算法工程師全國缺口15萬+,缺陷檢測專項(xiàng)人才招聘響應(yīng)率僅32% ? 薪資水平:掌握LabVIEW+
    發(fā)表于 12-03 13:50

    如何深度學(xué)習(xí)機(jī)器視覺的應(yīng)用場景

    深度學(xué)習(xí)視覺應(yīng)用場景大全 工業(yè)制造領(lǐng)域 復(fù)雜缺陷檢測:處理傳統(tǒng)算法難以描述的非標(biāo)準(zhǔn)化缺陷模式 非標(biāo)產(chǎn)品分類:對形狀、顏色、紋理多變的產(chǎn)品進(jìn)行智能分類 外觀質(zhì)量評估:基于學(xué)習(xí)的外觀質(zhì)量標(biāo)
    的頭像 發(fā)表于 11-27 10:19 ?220次閱讀

    利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保護(hù)科學(xué)

    Cat M-1 用于遙測/連接。 用于邊緣處理和機(jī)器學(xué)習(xí)的 ARMSoM 計(jì)算模塊 (CM5)。 項(xiàng)目背景 []() 通過聆聽自然界的聲音,我們可以監(jiān)測動(dòng)物之間的交流方式,并獲得基本的基線數(shù)據(jù),從而
    發(fā)表于 10-27 09:18

    重大更新,LVGL有UI編輯器用了,2秒內(nèi)加載,快到飛起!

    憑借對平臺的深度適配與輕量化優(yōu)勢,成為圖形界面開發(fā)的最優(yōu)解。LVGL與Linux系統(tǒng)的高度協(xié)同性,完美平衡了開發(fā)效率與硬件資源占用,適配從ARM到X86再到RISC
    的頭像 發(fā)表于 10-21 12:58 ?1634次閱讀
    重大更新,LVGL有UI編輯器用了,2<b class='flag-5'>秒內(nèi)</b>加載,快到飛起!

    信息流全面轉(zhuǎn)向AI推薦!馬斯克稱X本周內(nèi)將發(fā)布AI算法更新

    X 平臺將于本周內(nèi)發(fā)布更新后的“新”算法,據(jù)其表示,新算法更新后,X 將實(shí)現(xiàn)完全的 AI 推薦。
    的頭像 發(fā)表于 10-21 10:19 ?412次閱讀
    信息流全面轉(zhuǎn)向AI推薦!馬斯克稱X本周<b class='flag-5'>內(nèi)</b>將發(fā)布AI<b class='flag-5'>算法</b>更新

    思必馳聲音轉(zhuǎn)換算法通過國家備案

    近日,國家互聯(lián)網(wǎng)信息辦公室公告第十三批深度合成服務(wù)算法備案信息,思必馳聲音轉(zhuǎn)換算法通過備案,這也是思必馳第7項(xiàng)通過備案的算法,標(biāo)志著思必馳在
    的頭像 發(fā)表于 09-18 14:05 ?934次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+第二章 實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    、Transformer 模型的后繼者 二、用創(chuàng)新方法實(shí)現(xiàn)深度學(xué)習(xí)AI芯片 1、基于開源RISC-V的AI加速器 RISC-V是一種開源、模塊化的指令集架構(gòu)(ISA)。優(yōu)勢如下: ①模塊化特性②標(biāo)準(zhǔn)接口③開源
    發(fā)表于 09-12 17:30

    零基礎(chǔ)在智能硬件上克隆原神可莉實(shí)現(xiàn)桌面陪伴(提供人設(shè)提示詞、知識庫、固件下載)

    個(gè)步驟:1、創(chuàng)建智能體:配置可莉的基礎(chǔ)信息2、聲音復(fù)刻:克隆可莉的聲音3、配置知識庫:配置可莉和嘟嘟可的背景、故事經(jīng)歷、語錄等知識庫 4、自定義喚醒詞:修改喚醒詞和喚醒回復(fù)語 (篇尾提供修改了喚醒詞
    發(fā)表于 08-22 19:51

    思必馳聲音復(fù)刻算法獲得深度合成服務(wù)算法備案

    近日,國家互聯(lián)網(wǎng)信息辦公室正式發(fā)布第十二批深度合成服務(wù)算法備案信息,思必馳聲音復(fù)刻算法通過此次備案。該算法能夠高精度復(fù)刻人類
    的頭像 發(fā)表于 07-31 17:42 ?866次閱讀

    思必馳7月份大事件回顧

    近日,思必馳聲音復(fù)刻算法通過國家互聯(lián)網(wǎng)信息辦公室第十二批深度合成服務(wù)算法備案。該算法能夠高精度復(fù)刻人類
    的頭像 發(fā)表于 07-28 17:52 ?797次閱讀

    【高云GW5AT-LV60 開發(fā)套件試用體驗(yàn)】基于開發(fā)板進(jìn)行深度學(xué)習(xí)實(shí)踐,并盡量實(shí)現(xiàn)皮膚病理圖片的識別,第二階段

    算法一個(gè)一個(gè)的去用verilog實(shí)現(xiàn),我還是有點(diǎn)吃力的?因?yàn)槲矣袔讉€(gè)問題還沒有弄清楚? 1、圖像的采集,保存,以及相關(guān)處理,以便符合后續(xù)model的需要? 當(dāng)然談到model,這里有好多可以
    發(fā)表于 06-23 18:37

    正點(diǎn)原子 AI BOX0 智能伴侶,1.54寸高清屏+長效續(xù)航,語音暢聊,情景對話,知識科普,多色可選,隨身攜帶!

    ! ③ 聲音克隆黑科技:錄制聲音,定制專屬家人的聲音,異地也能溫暖相伴! 全場景覆蓋的神器 ① 學(xué)習(xí)加速器:孩子作業(yè)輔導(dǎo)、英語對話練習(xí)、百科
    發(fā)表于 04-24 16:11