自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

OpenAI首次展示音頻模型Voice Engine，生成的聲音太逼真了！

發(fā)布于 2024-4-1 15:21

瀏覽

0收藏

3月30日凌晨，OpenAI在官網(wǎng)首次展示了全新自定義音頻模型“Voice Engine”。

用戶只需要提供15秒左右的參考聲音，通過(guò)Voice Engine就能生成幾乎和原音一模一樣的全新音頻，在清晰度、語(yǔ)音連貫、音色、自然度等方面比市面上多數(shù)產(chǎn)品都強(qiáng)很多。

除了能合成音頻之外，OpenAI還展示了Voice Engine很多其他際商業(yè)用途，例如，一位失去聲音表達(dá)能力的女孩，在Voice Engine幫助下能像以前一樣正常發(fā)音說(shuō)話。

Voice Engine功能展示

OpenAI并非展示了一些簡(jiǎn)單的demo，而是一些實(shí)際場(chǎng)景化用例，這也就是說(shuō)Voice Engine的技術(shù)已經(jīng)非常成熟。

Age of Learning 是一家兒童教育公司，他們一直在使用Voice Engine生成各種有聲讀物。同時(shí)還通過(guò)與GPT-4的相結(jié)合使用，創(chuàng)建實(shí)時(shí)、個(gè)性化的回答與學(xué)生互動(dòng)。

例如，使用一段15秒的參考音頻。就可以生成幾乎一模一樣的語(yǔ)音。

?

除了語(yǔ)音合成之外，Voice Engine還能提供視頻翻譯功能，可以將一種視頻語(yǔ)音無(wú)差別的翻譯成多國(guó)語(yǔ)言。

HeyGen是一家AI視頻合成平臺(tái)，主要幫助企業(yè)開(kāi)發(fā)商品展示的“數(shù)字人”。他們通過(guò)使用Voice Engine進(jìn)行視頻翻譯，擴(kuò)展至多國(guó)語(yǔ)言來(lái)擴(kuò)大全球覆蓋受眾。

輸入一段原參考語(yǔ)音，就能將其轉(zhuǎn)化成中文語(yǔ)音

幫助聲音受損的人恢復(fù)聲音：諾曼-普林斯生命科學(xué)研究所正在測(cè)試一項(xiàng)實(shí)驗(yàn)，正通過(guò)Voice Engine幫助那些因腫瘤或神經(jīng)系統(tǒng)病因，導(dǎo)致語(yǔ)言障礙的患者恢復(fù)聲音。

目前，他們已經(jīng)幫助一位因血管性腦腫瘤，而失去流利語(yǔ)言表達(dá)能力的年輕女患者恢復(fù)了聲音。

現(xiàn)在這位女患者可以正常與其他人交流了。

?

OpenAI表示，其實(shí)他們?cè)?022年底便開(kāi)發(fā)了Voice Engine，并將其用于支持文本到語(yǔ)音 API 中的預(yù)設(shè)語(yǔ)音以及 ChatGPT 的語(yǔ)音和朗讀功能。

但出于安全考慮一直沒(méi)有全面公測(cè)，目前也只是小范圍測(cè)試。因?yàn)橄啾任谋?、視頻，音頻的造假能力太強(qiáng)了幾乎無(wú)法分辨出來(lái)。

此外，OpenAI首席技術(shù)官M(fèi)ira Murati在前不久接受的采訪時(shí)表示，未來(lái)Sora生成的視頻會(huì)帶聲音的，很可能為其提供聲音的就是Voice Engine。

本文轉(zhuǎn)自AIGC開(kāi)放社區(qū) 作者：AIGC開(kāi)放社區(qū)

原文鏈接:??https://mp.weixin.qq.com/s/ErMhYBEjjDMpJfPlj9NiIw??

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

音頻驅(qū)動(dòng)逼真人像動(dòng)畫(huà)合成！人人都是歌手！

angel ? 3972瀏覽 ? 0回復(fù)
OpenAI 推出語(yǔ)音引擎，只需15秒樣本，即能重建任何人的聲音

pangguiyu ? 2460瀏覽 ? 0回復(fù)
一張照片+音頻=超逼真數(shù)字人視頻！VASA-1模型拉開(kāi)「實(shí)時(shí)交互」大幕

duhorse ? 2769瀏覽 ? 0回復(fù)
OpenAI首次公開(kāi)前沿大模型安全：基礎(chǔ)架構(gòu)、保護(hù)措施等

Aceryt ? 4386瀏覽 ? 0回復(fù)
開(kāi)源音頻模型Stable Audio Open，文本生成47秒高清音效

Aceryt ? 4107瀏覽 ? 0回復(fù)
Stability AI開(kāi)源47秒音頻生成模型，蟲(chóng)鳴鳥(niǎo)叫、搖滾、鼓點(diǎn)都能生成

輕薄滴假象 ? 2543瀏覽 ? 0回復(fù)
太逼真了！Gen-3 Alpha重磅發(fā)布，Sora最強(qiáng)競(jìng)爭(zhēng)對(duì)手！

Aceryt ? 2770瀏覽 ? 0回復(fù)
谷歌“另辟蹊徑”，展示AI視頻生音頻最新進(jìn)展，效果驚艷！網(wǎng)友：但有一個(gè)缺點(diǎn)

51CTO技術(shù)棧 ? 2411瀏覽 ? 0回復(fù)
耳朵沒(méi)錯(cuò)，是聲音太真了，字節(jié)豆包語(yǔ)音合成成果Seed-TTS技術(shù)揭秘

輕薄滴假象 ? 3333瀏覽 ? 0回復(fù)
曠視開(kāi)源的AI人像視頻生成太炸了！輸入照片即可模仿任意表情包

輕薄滴假象 ? 2779瀏覽 ? 0回復(fù)
OpenAI展示草莓，很快發(fā)布“GPT-5”獵戶座！

Aceryt ? 1783瀏覽 ? 0回復(fù)
Real-Time Voice Cloning：5 秒解鎖聲音克隆，憑啥斬獲 52.9k Stars？

穿越時(shí)空111 ? 3852瀏覽 ? 0回復(fù)
NVIDIA AI 推出 Fugatto：一個(gè) 25 億參數(shù)的音頻模型，可從文本和音頻輸入生成音樂(lè)、語(yǔ)音和聲音

Halo咯咯 ? 2101瀏覽 ? 0回復(fù)
擊敗99.9%的程序員！o3來(lái)了！AGI測(cè)試實(shí)現(xiàn)躍升！網(wǎng)友：推理scaling law太炸了！一文回顧OpenAI直播帶貨12天

51CTO技術(shù)棧 ? 2840瀏覽 ? 0回復(fù)
DeepSeek太給力了！自家的大模型秘方開(kāi)源到底！國(guó)產(chǎn)大模型雄起

51CTO技術(shù)棧 ? 2307瀏覽 ? 0回復(fù)
馬斯克阻止OpenAI營(yíng)利化慘遭駁回！將秋季開(kāi)庭判決；法官：收購(gòu)提議太雙標(biāo)了！

51CTO技術(shù)棧 ? 1523瀏覽 ? 0回復(fù)
用 MCP 讓大模型自動(dòng)批量下載文獻(xiàn)，太香了！

機(jī)器學(xué)習(xí)與數(shù)學(xué) ? 3417瀏覽 ? 0回復(fù)
剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨

Aceryt ? 1282瀏覽 ? 0回復(fù)
谷歌推出Veo 2，生成8秒超逼真視頻

Aceryt ? 1130瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

剛剛，OpenAI發(fā)布GPT-image-1模型，更強(qiáng)吉卜力版本來(lái)啦 6天前發(fā)布
字節(jié)跳動(dòng)開(kāi)源多模態(tài)AI Agent—UI-TARS-1.5 7天前發(fā)布

熱門(mén)推薦

微軟開(kāi)源DeepSeek-R1魔改版：響應(yīng)99%敏感提示，風(fēng)險(xiǎn)降50% 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣(mài)點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開(kāi)發(fā) 0回復(fù)

Dify從入門(mén)到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開(kāi)源爬蟲(chóng)神器 0回復(fù)

上一篇：文本直接生成2分鐘視頻，即將開(kāi)源模型StreamingT2V

下一篇：谷歌推出多模態(tài)視頻模型，自動(dòng)生成豐富動(dòng)作視頻

社區(qū)精華內(nèi)容

目錄

<blockquote id="ic1wh"></blockquote>

<dfn id="ic1wh"><sup id="ic1wh"><kbd id="ic1wh"></kbd></sup></dfn>