自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

百度發(fā)布DeepVoice最終版:模仿萬人、半小時學(xué)會一種口音

新聞 深度學(xué)習(xí)
搜索巨頭百度推出了一個名叫 DeepVoice 的全新人工智能系統(tǒng),借助熱門的深度學(xué)習(xí)技術(shù),它能夠?qū)崿F(xiàn)文本到語音(TTS)的轉(zhuǎn)換。

今年早些時候,搜索巨頭百度推出了一個名叫 DeepVoice 的全新人工智能系統(tǒng),借助熱門的深度學(xué)習(xí)技術(shù),它能夠?qū)崿F(xiàn)文本到語音(TTS)的轉(zhuǎn)換。初版 DeepVoice 可以產(chǎn)生較短的語句,不仔細(xì)聽還以為是個真人在說話。該系統(tǒng)還可以每次學(xué)習(xí)一種聲音,在數(shù)小時后即可掌握。而今年 5 月份推出 DeepVoice 2,可以在一小時內(nèi)模仿出一種口音,單系統(tǒng)就可以學(xué)習(xí)數(shù)百種不同的口音。 

20170526101712551.png

現(xiàn)在,百度推出了 DeepVoice 的“最終版”,聲稱可以在每半個小時內(nèi)完成對 10000 種語音的數(shù)據(jù)學(xué)習(xí)。這種高效生成各種各樣聲音的技術(shù),為許多用例打開了大門。

例如,在有聲書或視頻游戲中,每個角色都可以有自己獨特的聲音,以獲得更強的用戶體驗。不過與真人配音相比,百度 DeepVoice 產(chǎn)出的口音,其合成感還是很明顯的。

對此,百度表示這并不是他們的目標(biāo):“如果只生成一兩種口音的話,我們的系統(tǒng)早已證實能夠合成相當(dāng)自然的、接近真人的口音,且可以輕易將它用作數(shù)字助理”。

Deep Voice 3 架構(gòu)圖

百度所要嘗試的,是制造出一種能夠掌握多種口音或字符間細(xì)微差別的系統(tǒng):

這只是最初的工作,展示了可伸縮的可能性。我們的系統(tǒng)成功地量訓(xùn)練擴(kuò)大了一個規(guī)模,此前發(fā)表的 TTS 模型中尚未達(dá)到過。

我們相信,通過使用大型高質(zhì)量數(shù)據(jù)集、和額外的機(jī)器學(xué)習(xí)工程訓(xùn)練,其質(zhì)量可在不久的將來大幅提升。

需要指出的是,百度并不是唯一一家從事計算機(jī)語音合成工作的搜索巨頭,Google 旗下的 DeepMind 部門也一直在進(jìn)行一個名叫 WaveNet 的類似項目。

在最新的版本中,WaveNet 已經(jīng)能夠在掌握口音方面做到更好,甚至像真人那樣產(chǎn)生“唇音”?,F(xiàn)在,它已經(jīng)被用到了英語和日語版本的 Google Assistant 上。

[編譯自:TheVerge , 來源:百度研究院]

責(zé)任編輯:張燕妮 來源: cnBeta
相關(guān)推薦

2012-05-28 09:30:43

JavaJFile

2009-09-28 15:28:07

Jython 2.5.

2011-12-31 10:31:06

Linux Deepi

2009-05-13 10:02:37

Tapestry 5.servletApache

2011-04-27 08:50:33

ExtJS

2022-04-22 19:14:51

LinuxUbuntu

2010-06-01 09:03:58

2012-07-20 11:05:34

Android 4.1SDKADT Plugin

2013-09-12 14:26:47

百度云網(wǎng)盤

2024-05-21 22:18:30

2012-10-19 09:47:30

百度云百度音樂云計算

2009-05-30 10:11:08

微軟Silverlight瀏覽器

2015-10-28 13:13:41

2018-01-09 14:59:30

2010-11-03 09:18:03

Zend Studio

2021-08-18 16:40:54

百度人工智能

2015-09-02 11:25:31

Ubuntu下載

2011-10-31 14:19:10

Fedora 16

2018-10-19 10:05:14

區(qū)塊鏈百度百度搜索

2020-09-16 13:57:27

百度世界2020百度大腦
點贊
收藏

51CTO技術(shù)棧公眾號