自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

五秒內(nèi)克隆你的聲音,并生成任何內(nèi)容,這個(gè)開(kāi)源工具細(xì)思極恐

開(kāi)發(fā) 前端
語(yǔ)音克隆最大的創(chuàng)新之一是減少創(chuàng)建語(yǔ)音所需的原始數(shù)據(jù)量。過(guò)去,該系統(tǒng)需要數(shù)十甚至數(shù)百小時(shí)的音頻。但是,今天猿妹要和大家分享的這個(gè)工具5秒鐘就可以克隆成功,這個(gè)工具名叫——MockingBird。

大家應(yīng)該都知道聲音克隆技術(shù),通俗的來(lái)說(shuō)就是借助深度學(xué)習(xí)算法,可以完全模擬某個(gè)人的聲音,而且由機(jī)器合成的語(yǔ)音連情緒都能夠完美表達(dá)出來(lái),基本可以以假亂真,只要不見(jiàn)面,你根本就察覺(jué)不出來(lái)向你發(fā)出聲音的知識(shí)一個(gè)機(jī)器。

[[420637]]

語(yǔ)音克隆最大的創(chuàng)新之一是減少創(chuàng)建語(yǔ)音所需的原始數(shù)據(jù)量。過(guò)去,該系統(tǒng)需要數(shù)十甚至數(shù)百小時(shí)的音頻。但是,今天猿妹要和大家分享的這個(gè)工具5秒鐘就可以克隆成功,這個(gè)工具名叫——MockingBird。

MockingBird已經(jīng)登上Github熱榜,收獲3.5K的Star,累計(jì)分支 303(Github地址:https://github.com/babysor/MockingBird)

MockingBird具有如下特性:

  • 支持普通話(huà)并使用多種中文數(shù)據(jù)集進(jìn)行測(cè)試
  • 適用于 pytorch,已在 1.9.0 版本(最新于 2021 年 8 月)中測(cè)試,GPU Tesla T4 和 GTX 2060
  • 支持 Windows + Linux
  • 僅使用新訓(xùn)練的合成器(synthesizer)就有良好效果,復(fù)用預(yù)訓(xùn)練的編碼器/聲碼器

MockingBird如何使用

MockingBird的安裝要求如下:

  • 首先,MockingBird需要Python 3.7 或更高版本
  • 安裝 PyTorch
  • 安裝 ffmpeg。
  • 運(yùn)行pip install -r requirements.txt 來(lái)安裝剩余的必要包。
  • 安裝 webrtcvad 用 pip install webrtcvad-wheels。

接著,你需要使用數(shù)據(jù)集訓(xùn)練合成器:

  • 下載 數(shù)據(jù)集并解壓:確保您可以訪(fǎng)問(wèn) train 文件夾中的所有音頻文件(如.wav)
  • 使用音頻和梅爾頻譜圖進(jìn)行預(yù)處理:python synthesizer_preprocess_audio.py 可以傳入?yún)?shù) --dataset {dataset} 支持 adatatang_200zh, magicdata, aishell3
  • 預(yù)處理嵌入:python synthesizer_preprocess_embeds.py /SV2TTS/synthesizer
  • 訓(xùn)練合成器:python synthesizer_train.py mandarin /SV2TTS/synthesizer

當(dāng)你在訓(xùn)練文件夾 synthesizer/saved_models/ 中看到注意線(xiàn)顯示和損失滿(mǎn)足您的需要時(shí),請(qǐng)轉(zhuǎn)到下一步。

[[420638]]

 

使用預(yù)先訓(xùn)練好的合成器,如果沒(méi)有設(shè)備或者不想慢慢調(diào)試,可以使用網(wǎng)友貢獻(xiàn)的模型。

訓(xùn)練聲碼器

  • 預(yù)處理數(shù)據(jù): python vocoder_preprocess.py
  • 訓(xùn)練聲碼器: python vocoder_train.py mandarin

啟動(dòng)工具箱

然后你可以嘗試使用工具箱:python demo_toolbox.py -d<datasets_root>

 

責(zé)任編輯:未麗燕 來(lái)源: 開(kāi)源前線(xiàn)
相關(guān)推薦

2019-12-27 08:33:45

Java工具IDE

2017-09-13 13:54:09

2023-01-11 12:51:04

微軟音頻

2019-08-28 13:44:51

人工智能AI機(jī)器人

2018-08-23 15:47:43

個(gè)人信息安全

2022-08-11 10:25:01

U盤(pán)Python代碼

2022-08-21 10:32:38

python

2022-10-08 11:18:08

光攻擊Zoom

2018-12-05 12:59:28

比特幣區(qū)塊鏈BTC

2015-10-28 16:32:52

人工智能谷歌搜索算法

2023-03-24 12:10:47

面部識(shí)別算法

2015-08-14 13:37:46

DEFCON磁盤(pán)安全

2021-10-08 15:21:52

AI 數(shù)據(jù)人工智能

2019-03-04 08:11:53

AIDeepFakes深度學(xué)習(xí)

2024-05-06 10:11:51

2025-04-30 09:20:00

2021-02-23 15:36:32

人工智能機(jī)器人工具

2024-11-08 17:34:38

2022-10-11 16:57:29

開(kāi)源工具開(kāi)源

2022-07-27 14:01:57

AI機(jī)器人
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)