自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sup id="tq6ck"><rt id="tq6ck"></rt></sup>

<legend id="tq6ck"><track id="tq6ck"></track></legend>

<style id="tq6ck"></style>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術網(wǎng)站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

谷歌發(fā)布超強AI視頻編輯工具！施展魔法的VLOGGER，音頻加圖片就搞定唇形和手勢，還把表情編輯玩出花了！

發(fā)布于 2024-4-7 13:47

瀏覽

0收藏

出品 | 51CTO技術棧（微信號：blog51cto）

編譯丨伊風

視頻生成模型的腳步永不停歇！

谷歌發(fā)布超強AI視頻編輯工具！施展魔法的VLOGGER，音頻加圖片就搞定唇形和手勢，還把表情編輯玩出花了！-AI.x社區(qū) 圖片

4月2日，谷歌剛剛發(fā)布了強到可怕的AI視頻編輯工具VLOGGER。VLOGGER就像收集了很多視頻生成領域的前沿AI技能，而打造出的一款百寶箱。其中也有一些亮點細節(jié)，例如通過AI編輯，將讓畫面中講話者的閉眼、閉嘴、甚至“wink”。

這意味著視頻編輯在細節(jié)的深入上又精進了一個level！

VLOGGER的工作原理即輸入音頻和圖像，由“讀唇器”根據(jù)音頻預測說話者的動作，而“動畫器”根據(jù)說話者的照片和動作細節(jié)創(chuàng)建視頻幀。

谷歌發(fā)布超強AI視頻編輯工具！施展魔法的VLOGGER，音頻加圖片就搞定唇形和手勢，還把表情編輯玩出花了！-AI.x社區(qū) 圖片

要知道VLOGGER這個百寶箱里都裝了什么，可以跟隨以下示例來看！

1.VLOGGER的多面能力

基礎的圖生視頻功能

將圖片驅(qū)動為一段視頻。

谷歌發(fā)布超強AI視頻編輯工具！施展魔法的VLOGGER，音頻加圖片就搞定唇形和手勢，還把表情編輯玩出花了！-AI.x社區(qū) 圖片

多語種唇形切換

輸入一種語言的視頻和另一種語言的音頻，它能根據(jù)新輸入的語言調(diào)整說話者的嘴部動作！

順便一提，OpenAI的VOICE ENGINE也在關注多語種的能力。可以根據(jù)一段音頻生成一段保留原聲音色及口音的外語視頻，如果這些能力都能打通，那么音視頻內(nèi)容的出海將會暢通無阻。

谷歌發(fā)布超強AI視頻編輯工具！施展魔法的VLOGGER，音頻加圖片就搞定唇形和手勢，還把表情編輯玩出花了！-AI.x社區(qū) 圖片

表情細節(jié)編輯

VLOGGER使得表情編輯更進一步，例如單獨控制一只眼睛等。通過使用工具，將生成新的面部表情和動作，用以提升視頻的創(chuàng)意。

谷歌發(fā)布超強AI視頻編輯工具！施展魔法的VLOGGER，音頻加圖片就搞定唇形和手勢，還把表情編輯玩出花了！-AI.x社區(qū) 圖片

2.最終效果，進步了但未完全消除“恐怖谷”

谷歌發(fā)布超強AI視頻編輯工具！施展魔法的VLOGGER，音頻加圖片就搞定唇形和手勢，還把表情編輯玩出花了！-AI.x社區(qū) 圖片

毫無疑問VLOGGER的視頻留下了令人印象深刻的亮點。如講話時自然的身體姿勢，增加手部運動以在一定程度上提升了視頻的真實感。然而，生成的表情和動作比起真實視頻還存在機械感重、不流暢的問題，因此會存在一定的“恐怖谷”效應。

參考鏈接：??https://twitter.com/hey_madni/status/1774832882902864327??

標簽

已于2024-4-7 14:45:12修改

贊

收藏

回復

舉報

回復

相關推薦

在ChatGPT中，能用DALL·E 3編輯圖片啦！

Aceryt ? 3925瀏覽 ? 0回復
谷歌將免費提供3款，生成式AI圖像編輯工具

Aceryt ? 2922瀏覽 ? 0回復
205 個強大的AI編輯寫作提示

數(shù)師兄 ? 2774瀏覽 ? 0回復
DiT架構(gòu)大一統(tǒng)：一個框架集成圖像、視頻、音頻和3D生成，可編輯、能試玩

輕薄滴假象 ? 2655瀏覽 ? 0回復
谷歌發(fā)布文生圖模型Imagen 3，寫實效果超強！

Aceryt ? 3642瀏覽 ? 0回復
視頻版PS！0樣本視頻編輯模型，普通人秒變鋼鐵俠

Aceryt ? 2153瀏覽 ? 0回復
The Annotated Transformer注釋加量版，讀懂代碼就真的懂了Transformer

魚蟲子 ? 2963瀏覽 ? 0回復
編輯能力無上限！北航&谷歌&曠視等開源Chat-Edit-3D: 3D 場景編輯新范式！

angel ? 2247瀏覽 ? 0回復
超越DiffEdit、SDEdit等6大編輯模型！字節(jié)等提出人像服飾、卡通表情編輯新SOTA！

angel ? 2204瀏覽 ? 0回復
超越Text2Video-Zero｜無需額外訓練，條件生成、專門生成和指令引導的視頻編輯全搞定！

angel ? 2337瀏覽 ? 0回復
OpenAI 發(fā)布 Sora：最受期待的 AI 視頻生成工具

Halo咯咯 ? 1789瀏覽 ? 0回復
從數(shù)據(jù)集到模型：視頻和音頻情緒分析的綜合研究

xuxiangda ? 3344瀏覽 ? 0回復
NeurIPS 2024 | 像素級LLM實現(xiàn)圖像視頻理解、生成、分割和編輯大統(tǒng)一

angel ? 3450瀏覽 ? 0回復
視頻編輯最新SOTA！港中文&Adobe等發(fā)布統(tǒng)一視頻生成傳播框架——GenProp

angel ? 1757瀏覽 ? 0回復
運動應用（生成&克隆&遷移&編輯）全搞定！阿里通義提出動畫框架Perception-as-Control

angel ? 2030瀏覽 ? 0回復
基于 Gemini AI 實現(xiàn)音頻和視頻解析

丟翅膀的魚 ? 2477瀏覽 ? 0回復
騰訊&港中文發(fā)布影視后期黑科技！VideoPainter：視頻編輯修復8項SOTA!

angel ? 1426瀏覽 ? 0回復
Wan2.1背后的技術：阿里發(fā)布全能框架VACE，一統(tǒng)視頻生成與編輯，效果驚艷！

angel ? 3326瀏覽 ? 0回復
外科手術式編輯圖片！賓大突破性算法CoLan ：15萬場景概念庫讓AI秒懂你的P圖意圖！

angel ? 338瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

中國開源大模型新成員：小米推理大模型首秀！ 3h前發(fā)布
剛剛！一場直播讓宇樹成功正名！直播G1長跑操場40圈，6萬人點贊！真實跑步水平曝光：2m/s接近天工！ 8h前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

微軟突然封鎖Cursor，全面禁用C、C++、C#擴展，網(wǎng)友：理解微軟，Cursor白嫖VSCode 0回復

王炸！MCP 架構(gòu)設計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

上一篇：大模型新漏洞！Anthropic警告：新式“多輪越獄”攻破AI防線，或禍起長文本

下一篇： Scaling Law被證偽，谷歌研究人員實錘研究力挺小模型更高效，不局限于特定采樣技術！

社區(qū)精華內(nèi)容

目錄

<big id="ucus4"><code id="ucus4"><option id="ucus4"></option></code></big>