自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

微軟推出語音合成模型 NaturalSpeech2：語音重構(gòu)“更準(zhǔn)確”，不會“棒讀”

作者：漾仔 2023-07-27 16:51:05

微軟推出了一款名為 NaturalSpeech2 的語音模型，該模型采用“潛在擴散”式設(shè)計，在零樣本語音合成層面效果出眾，微軟宣稱該模型提供了“商業(yè)級”的語音 / 歌唱解決方案，能夠給予用戶高質(zhì)量、多樣化的語音合成體驗。

7 月 27 日消息，微軟日前推出了一款名為 NaturalSpeech2 的語音模型，該模型采用“潛在擴散”式設(shè)計，在零樣本語音合成層面效果出眾，微軟宣稱該模型提供了“商業(yè)級”的語音 / 歌唱解決方案，能夠給予用戶高質(zhì)量、多樣化的語音合成體驗。

微軟對 NaturalSpeech2 進行了一系列演示，展示了其在零樣本情況下生成具有不同說話人身份、韻律和風(fēng)格（如唱歌）的語音的能力。

▲ 圖源 NaturalSpeech 2 論文

據(jù)悉，與傳統(tǒng)的語音轉(zhuǎn)文字（TTS）系統(tǒng)不同，微軟的 NaturalSpeech2 使用“連續(xù)向量”取代“離散標(biāo)記”來表示語音，從而生成更完整的語音片段，不會產(chǎn)生“缺乏感情”的“棒讀（一字一頓地講話）”現(xiàn)象。

▲ 圖源 NaturalSpeech 2 論文

實驗結(jié)果表明，NaturalSpeech2 在零樣本條件下生成的語音與語音提示和真實語音的韻律近乎一致，并且在 LibriTTS 和 VCTK 測試集上的自然度（以 CMOS 為度量）與真人語音難以區(qū)分。

該項目的論文目前已經(jīng)發(fā)布于 GitHub 中，感興趣的IT之家小伙伴們可以點此訪問。

責(zé)任編輯：龐桂玉來源： IT之家

微軟語音模型人工智能

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

^{<thead id="763zn"></thead>}<legend id="763zn"><track id="763zn"></track></legend>

<cite id="763zn"></cite>