自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

讓夢露和龍媽學著你說話,只需一張靜態(tài)圖和一個視頻

新聞 人工智能
想讓名人學著你說話,怎么辦?很簡單,只要一張名人的照片,配上你說話的視頻,分分鐘就能搞定。

 本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯(lián)系出處。

想讓名人學著你說話,怎么辦?

很簡單,只要一張名人的照片,配上你說話的視頻,分分鐘就能搞定。

來看下效果:

讓夢露和龍媽學著你說話,只需一張靜態(tài)圖和一個視頻 | 項目開源

無論你是擠眉弄眼,還是搖頭晃腦,照片里的名人們都能跟你神同步!

這就是來自意大利特倫托大學的一項研究:

利用一個一階運動模型 (First Order Motion Model),靜態(tài)圖也能動起來,換臉也不在話下。

當然,這么有意思的項目,已經(jīng)開源了!

一個川普在說話,一群史塔克也有話說

其實,這項研究早在數(shù)月前便已發(fā)表。

當時用的輸入視頻是川建國同志,靜態(tài)照片用的是一組《冰與火之歌》史塔克家族及劇中其他人物圖片。

效果是這樣的:

讓夢露和龍媽學著你說話,只需一張靜態(tài)圖和一個視頻 | 項目開源

可以看到,無論川建國同志是眨眼、晃頭,劇中的人物做到了神同步。

就連那張標志性的O型嘴,也“模仿”的惟妙惟肖。

而時隔幾個月,這項技術又在Reddit爆火了起來。

讓夢露和龍媽學著你說話,只需一張靜態(tài)圖和一個視頻 | 項目開源

一個可能的原因是,這次輸入的視頻來自流行的短視頻平臺,也就是說我們自己錄一段視頻也能用。

加上效果的逼真、有趣,或許用不了多長時間,短視頻內(nèi)容平臺可能就會推出這個功能了吧。

當然,這個模型的魔力不止于此。

輸入一個模特換pose的視頻,再配上多張靜態(tài)服飾照片,就能批量輸出動態(tài)展示服裝的視頻了。

讓夢露和龍媽學著你說話,只需一張靜態(tài)圖和一個視頻 | 項目開源

換臉,也是小菜一碟。

讓夢露和龍媽學著你說話,只需一張靜態(tài)圖和一個視頻 | 項目開源

不過,也要溫馨提醒一句:慎用靜態(tài)照片,不然出來的效果可能就不太像“陽間的東西”了……

一階運動模型

在訓練階段,研究人員采用了大量的視頻序列集合,包含相同類別的對象。模型通過結合視頻中的單幀,和學習到的潛在運動表示,來訓練重構視頻。

在測試階段,研究人員將模型應用于由源圖像和驅動視頻的每一幀組成的對,并執(zhí)行源對象的圖像動畫。

模型的框架就如下圖所示:

讓夢露和龍媽學著你說話,只需一張靜態(tài)圖和一個視頻 | 項目開源

框架主要由2部分構成:運動估計模塊圖像生成模塊

運動估計模塊的目的,是預測一個密集的運動場。研究人員假設存在一個抽象的參考框架,并且獨立估計兩個變換,分別是「從參考到源」和「從參考到驅動」。這樣就能夠獨立處理源幀和驅動幀。

研究人員認為這個步驟是必要的,因為在測試時,模型會接收從不同視頻中采樣的源圖像和驅動幀對,它們在視覺上可能非常不同。

在第一步中,研究人員從稀疏軌跡集近似這兩種變換,通過使用以自監(jiān)督方式學習的關鍵點來獲得。利用局部仿射變換對每個關鍵點附近的運動進行建模。

在第二步中,密集運動網(wǎng)絡結合局部近似得到密集運動場。除此之外,這個網(wǎng)絡還輸出遮擋的mask,指示哪些圖像的驅動部分可以通過源圖像的扭曲(warping)來重建,哪些部分應該被繪制(根據(jù)上下文推斷)。

在第三步中,生成模塊按照驅動視頻中,提供的源對象移動的圖像進行渲染。此處,研究人員使用一個生成器網(wǎng)絡,根據(jù)密集的運動對源圖像進行扭曲,并對源圖像中被遮擋的圖像部分進行著色。

最后,這個模型已經(jīng)在GitHub上開源,我們在“傳送門”中已經(jīng)奉上地址鏈接。

快去試試吧~

傳送門

GitHub項目地址:
https://github.com/AliaksandrSiarohin/first-order-model

論文地址:
https://arxiv.org/pdf/2003.00196.pdf

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2014-03-14 09:47:08

手游進化產(chǎn)品

2012-09-10 14:07:58

JavaScriptJS類型

2022-08-19 14:46:16

視覺框架

2021-02-07 09:01:10

Java并發(fā)編程

2012-12-24 10:29:42

大數(shù)據(jù)生態(tài)系統(tǒng)數(shù)據(jù)庫451Research

2012-07-20 17:24:51

HTML5

2019-09-11 10:12:12

華為

2015-03-10 10:15:27

AppleWatch開發(fā)Swift

2020-09-09 08:30:42

內(nèi)網(wǎng)隱蔽端口

2015-01-22 11:37:44

Android

2019-06-23 17:30:07

AI 數(shù)據(jù)人工智能

2012-03-14 20:59:32

iPad

2015-03-27 14:27:41

戴爾云計算

2015-09-14 09:07:15

Java多線程

2024-03-28 13:14:00

數(shù)據(jù)訓練

2015-07-20 17:01:12

APP崩潰云智慧

2013-11-29 10:09:41

物聯(lián)網(wǎng)

2015-02-26 15:29:56

微信支付寶紅包

2017-07-18 13:09:20

互聯(lián)網(wǎng)

2022-04-25 15:01:07

系統(tǒng)程序員調(diào)度
點贊
收藏

51CTO技術棧公眾號