自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI孫燕姿翻唱爆火,多虧這個開源項目!廣西老表帶頭打造,上手指南已出

人工智能 新聞
最近,這波AI翻唱趨勢大火,不僅是AI孫燕姿唱的歌越來越多,AI歌手的范圍也在擴(kuò)大,就連制作教程都層出不窮了。

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

AI孫燕姿這么快翻唱了這么多首歌,到底是咋實(shí)現(xiàn)的?

關(guān)鍵在于一個開源項目

圖片

最近,這波AI翻唱趨勢大火,不僅是AI孫燕姿唱的歌越來越多,AI歌手的范圍也在擴(kuò)大,就連制作教程都層出不窮了。

而如果在各大教程中溜達(dá)一圈后就會發(fā)現(xiàn),其中的關(guān)鍵秘訣,還是要靠一個名為so-vits-svc的開源項目。

圖片

它提供了一種音色替換的辦法,項目在今年3月發(fā)布。

貢獻(xiàn)成員應(yīng)該大部分都來自國內(nèi),其中貢獻(xiàn)量最高的還是一位玩明日方舟的廣西老表。

圖片

如今,項目已經(jīng)停止更新了,但是星標(biāo)數(shù)量還在蹭蹭上漲,目前已經(jīng)到了8.4k。

所以它到底實(shí)現(xiàn)了哪些技術(shù)能引爆這波趨勢?

一起來看。

多虧了一個開源項目

這個項目名叫SoftVC VITS Singing Voice Conversion(歌聲轉(zhuǎn)換)。

它提供了一種音色轉(zhuǎn)換算法,采用SoftVC內(nèi)容編碼器提取源音頻語音特征,然后將矢量直接輸入VITS,中間不轉(zhuǎn)換成文本,從而保留了音高和語調(diào)。

此外,還將聲碼器改為NSF HiFiGAN,可以解決聲音中斷的問題。

具體分為以下幾步:

  • 預(yù)訓(xùn)練模型
  • 準(zhǔn)備數(shù)據(jù)集
  • 預(yù)處理
  • 訓(xùn)練
  • 推理

其中,預(yù)訓(xùn)練模型這步是關(guān)鍵之一,因為項目本身不提供任何音色的音頻訓(xùn)練模型,所以如果你想要做一個新的AI歌手出來,需要自己訓(xùn)練模型。

而預(yù)訓(xùn)練模型的第一步,是準(zhǔn)備干聲,也就是無音樂的純?nèi)寺暋?/p>

很多博主使用的工具都是UVR_v5.5.0

推特博主@歸藏介紹說,在處理前最好把聲音格式轉(zhuǎn)成WAV格式,因為So-VITS-SVC 4.0只認(rèn)這個格式,方便后面處理。

想要效果好一些,需要處理兩次背景音,每次的設(shè)置不同,能最大限度提高干聲質(zhì)量。

得到處理好的音頻后,需要進(jìn)行一些預(yù)處理操作。

比如音頻太長容易爆顯存,需要對音頻切片,推薦5-15秒或者再長一點(diǎn)也OK。

然后要重新采樣到44100Hz和單聲道,并自動將數(shù)據(jù)集劃分為訓(xùn)練集和驗證集,生成配置文件。再生成Hubert和f0。

接下來就能開始訓(xùn)練和推理了。

具體的步驟可以移步GitHub項目頁查看(指路文末)。

值得一提的是,這個項目在今年3月上線,目前貢獻(xiàn)者有25位。從貢獻(xiàn)用戶的簡介來看,很多應(yīng)該都來自國內(nèi)。

據(jù)說項目剛上線時也有不少漏洞并且需要編程,但是后面幾乎每一天都有人在更新和修補(bǔ),現(xiàn)在的使用門檻已經(jīng)降低了不少。

目前項目已經(jīng)停止更新了,但還是有一些開發(fā)者創(chuàng)建了新的分支,比如有人做出了支持實(shí)時轉(zhuǎn)換的客戶端。

圖片

項目貢獻(xiàn)量最多的一位開發(fā)者是Miuzarte,從簡介地址判斷應(yīng)該來自廣西。

圖片

隨著想要上手使用的人越來越多,也有不少博主推出了上手難度更低、更詳細(xì)的使用指南。

歸藏推薦的方法是使用整合包來推理(使用模型)和訓(xùn)練,還有B站的Jack-Cui展示了Windows下的步驟指南(https://www.bilibili.com/read/cv22375562)

需要注意的是,模型訓(xùn)練對顯卡要求還是比較高的,顯存小于6G容易出現(xiàn)各類問題。

Jack-Cui建議使用N卡,他用RTX 2060 S,訓(xùn)練自己的模型大概用了14個小時

訓(xùn)練數(shù)據(jù)也同樣關(guān)鍵,越多高質(zhì)量音頻,就意味著最后效果可以越好。

還是會擔(dān)心版權(quán)問題

值得一提的是,在so-vits-svc的項目主頁上,著重強(qiáng)調(diào)了版權(quán)問題。

警告:請自行解決數(shù)據(jù)集的授權(quán)問題。因使用未經(jīng)授權(quán)的數(shù)據(jù)集進(jìn)行培訓(xùn)而產(chǎn)生的任何問題及其一切后果,由您自行承擔(dān)責(zé)任。存儲庫及其維護(hù)者、svc開發(fā)團(tuán)隊,與生成結(jié)果無關(guān)!

圖片

這和AI畫畫爆火時有點(diǎn)相似。

因為AI生成內(nèi)容的最初數(shù)據(jù)取材于人類作品,在版權(quán)方面的爭論不絕于耳。

而且隨著AI作品盛行,已經(jīng)有版權(quán)方出手下架平臺上的視頻了。

據(jù)了解,一首AI合成的《Heart on My Sleeve》在Tik Tok上爆火,它合成了Drake和Weekend演唱的版本。

但隨后,Drake和Weekend的唱片公司環(huán)球音樂將這個視頻從平臺上下架了,并在聲明里向潛在的仿冒者發(fā)問,“是要站在藝術(shù)家、粉絲和人類創(chuàng)造性表達(dá)的一邊,還是站在Deepfake、欺詐和拒付藝術(shù)家賠償?shù)囊贿???/p>

此外,歌手Drake對AI合成翻唱歌曲表達(dá)了不滿。

而另一邊,也有人選擇擁抱這項技術(shù)。

加拿大歌手Grimes表示,她愿意讓別人使用自己的聲音合成歌曲,但是要給她一半版權(quán)費(fèi)。

GitHub地址:https://github.com/svc-develop-team/so-vits-svc

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2023-05-16 20:21:58

AI孫燕姿GPT-4

2013-12-04 13:27:56

Android SDK項目

2013-12-26 15:40:33

Android SDK項目

2021-01-26 08:37:18

MobXVueReact

2024-01-29 00:36:50

Backstage設(shè)施工具

2014-06-24 09:41:56

Android Stu教程

2022-05-16 15:37:32

開源軟件

2016-06-20 10:20:22

Docker云計算

2021-11-26 09:40:37

EclipseIDEA開發(fā)

2014-01-22 10:00:10

Android SDKAndroid開發(fā)

2013-12-04 14:44:41

Android SDK用戶交互

2014-06-06 14:25:03

iOS 8SwiftWWDC2014

2013-12-26 15:14:38

Android SDK運(yùn)行調(diào)試

2012-08-01 17:39:17

2025-01-07 08:28:22

2013-12-26 14:52:52

Android SDK物理設(shè)備

2021-01-19 06:16:05

前端Babel 技術(shù)熱點(diǎn)

2017-10-23 16:28:33

2013-12-04 14:29:18

Android SDK應(yīng)用程序

2013-11-27 10:12:11

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號