自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

百度發(fā)布DeepVoice最終版：模仿萬人、半小時學(xué)會一種口音

作者：佚名 2017-10-25 09:51:08

新聞深度學(xué)習(xí)

搜索巨頭百度推出了一個名叫 DeepVoice 的全新人工智能系統(tǒng)，借助熱門的深度學(xué)習(xí)技術(shù)，它能夠?qū)崿F(xiàn)文本到語音（TTS）的轉(zhuǎn)換。

今年早些時候，搜索巨頭百度推出了一個名叫 DeepVoice 的全新人工智能系統(tǒng)，借助熱門的深度學(xué)習(xí)技術(shù)，它能夠?qū)崿F(xiàn)文本到語音（TTS）的轉(zhuǎn)換。初版 DeepVoice 可以產(chǎn)生較短的語句，不仔細(xì)聽還以為是個真人在說話。該系統(tǒng)還可以每次學(xué)習(xí)一種聲音，在數(shù)小時后即可掌握。而今年 5 月份推出 DeepVoice 2，可以在一小時內(nèi)模仿出一種口音，單系統(tǒng)就可以學(xué)習(xí)數(shù)百種不同的口音。

現(xiàn)在，百度推出了 DeepVoice 的“最終版”，聲稱可以在每半個小時內(nèi)完成對 10000 種語音的數(shù)據(jù)學(xué)習(xí)。這種高效生成各種各樣聲音的技術(shù)，為許多用例打開了大門。

例如，在有聲書或視頻游戲中，每個角色都可以有自己獨特的聲音，以獲得更強的用戶體驗。不過與真人配音相比，百度 DeepVoice 產(chǎn)出的口音，其合成感還是很明顯的。

對此，百度表示這并不是他們的目標(biāo)：“如果只生成一兩種口音的話，我們的系統(tǒng)早已證實能夠合成相當(dāng)自然的、接近真人的口音，且可以輕易將它用作數(shù)字助理”。

Deep Voice 3 架構(gòu)圖

百度所要嘗試的，是制造出一種能夠掌握多種口音或字符間細(xì)微差別的系統(tǒng)：

這只是最初的工作，展示了可伸縮的可能性。我們的系統(tǒng)成功地量訓(xùn)練擴(kuò)大了一個規(guī)模，此前發(fā)表的 TTS 模型中尚未達(dá)到過。

我們相信，通過使用大型高質(zhì)量數(shù)據(jù)集、和額外的機(jī)器學(xué)習(xí)工程訓(xùn)練，其質(zhì)量可在不久的將來大幅提升。

需要指出的是，百度并不是唯一一家從事計算機(jī)語音合成工作的搜索巨頭，Google 旗下的 DeepMind 部門也一直在進(jìn)行一個名叫 WaveNet 的類似項目。

在最新的版本中，WaveNet 已經(jīng)能夠在掌握口音方面做到更好，甚至像真人那樣產(chǎn)生“唇音”?，F(xiàn)在，它已經(jīng)被用到了英語和日語版本的 Google Assistant 上。

[編譯自：TheVerge , 來源：百度研究院]

責(zé)任編輯：張燕妮來源： cnBeta

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<var id="nrjmx"><button id="nrjmx"><span id="nrjmx"></span></button></var><cite id="nrjmx"></cite>