自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

抖音跳舞不用真人出鏡,一張照片就能生成高質(zhì)量視頻!字節(jié)新技術(shù)連抱抱臉CTO都下場體驗(yàn)了

人工智能 存儲
這是來自新加坡國立大學(xué)和字節(jié)跳動最新的一項(xiàng)研究,名叫MagicAnimate。它的作用簡單來說可以總結(jié)為一個公式:一張圖片 + 一組動作 = 毫無違和感的視頻。

看!現(xiàn)在正有四位小姐姐在你面前大秀熱舞:

圖片

以為是某些主播在短視頻平臺發(fā)布的作品?

No,No,No。

真實(shí)答案是:假的,生成的,而且還是只靠了一張圖的那種!

圖片

真實(shí)的打開方式是這樣的:

圖片

這就是來自新加坡國立大學(xué)和字節(jié)跳動最新的一項(xiàng)研究,名叫MagicAnimate

它的作用簡單來說可以總結(jié)為一個公式:一張圖片 + 一組動作 = 毫無違和感的視頻。

圖片

然后啊,這項(xiàng)技術(shù)一經(jīng)公布,可謂是在科技圈里掀起了不小的波瀾,眾多科技大佬和極客們紛紛下場耍了起來。

就連HuggingFace CTO都拿自己的頭像體驗(yàn)了一把:

圖片

順便還風(fēng)趣地開了句玩笑:

這算是健身了吧?我這周可以不去健身房了。

還有相當(dāng)與時俱進(jìn)的網(wǎng)友,拿著剛出爐的GTA6(俠盜獵車手6)預(yù)告片中的人物玩了一把:

圖片

甚至就連表情包們也成了網(wǎng)友們pick的對象……

圖片

MagicAnimate可以說是把科技圈的目光聚焦到了自己身上,因此也有網(wǎng)友調(diào)侃說:

OpenAI可以休息一下了。

圖片

火,著實(shí)是火。

一張圖即可生成一段舞

那么如此火爆的MagicAnimate,該如何“食用”?

話不多說,我們現(xiàn)在就來手把手地體驗(yàn)一次。

目前項(xiàng)目團(tuán)隊(duì)已經(jīng)在HuggingFace中開放了在線體驗(yàn)的頁面:

圖片

操作也是非常得簡單,只需三步即可:

  1. 上傳一張靜態(tài)人物照片
  2. 上傳想要生成的動作demo視頻
  3. 調(diào)整參數(shù),點(diǎn)擊“Animate”即可

例如下面就是鄙人照片和一段近期席卷全球的《科目三》舞蹈片段:

圖片

△視頻源:抖音(ID:QC0217)

也可以選擇頁面下方提供的模版進(jìn)行體驗(yàn):

圖片

不過需要注意的是,由于MagicAnimate目前過于火爆,在生成的過程中可能會出現(xiàn)“宕機(jī)”的情況:

圖片

即便成功“食用”,可能也得排大隊(duì)圖片……

圖片

(沒錯!截至發(fā)稿,還是沒有等到結(jié)果!)

除此之外,MagicAnimate在GitHub中也給出了本地體驗(yàn)的方式,感興趣的小伙伴可以試試哦~

圖片

那么接下來的一個問題便是:

怎么做到的?

整體而言,MagicAnimate采用的是基于擴(kuò)散模型(diffusion)的一個框架,目的就是增強(qiáng)時間一致性、保持參考圖像的真實(shí)性,并提高動畫保真度。

圖片

為此,團(tuán)隊(duì)首先開發(fā)了一個視頻擴(kuò)散模型(Temporal Consistency Modeling)來編碼時間信息。

這個模型通過在擴(kuò)散網(wǎng)絡(luò)中加入時間注意力模塊,來編碼時間信息,從而確保動畫中各幀之間的時間一致性。

其次,為了保持幀間的外觀一致性,團(tuán)隊(duì)引入了一種新的外觀編碼器(Appearance Encoder)來保留參考圖像的復(fù)雜細(xì)節(jié)。

這個編碼器與以往使用CLIP編碼的方法不同,能夠提取密集的視覺特征來引導(dǎo)動畫,從而更好地保留身份、背景和服裝等信息。

在這兩項(xiàng)創(chuàng)新技術(shù)的基礎(chǔ)之上,團(tuán)隊(duì)進(jìn)一步采用了一種簡單的視頻融合技術(shù)(Video Fusion Technique)來促進(jìn)長視頻動畫的平滑過渡。

最終,在兩個基準(zhǔn)上的實(shí)驗(yàn)表明,MagicAnimate的結(jié)果要遠(yuǎn)優(yōu)于以往的方法。

尤其是在具有挑戰(zhàn)性的TikTok舞蹈數(shù)據(jù)集上,MagicAnimate在視頻保真度方面比最強(qiáng)基線高出38%以上!

團(tuán)隊(duì)所給出的定性比較如下:

圖片

以及與cross-ID的SOTA基線相比,結(jié)果如下:

圖片

One More Thing

不得不說,諸如MagicAnimate的項(xiàng)目最近著實(shí)是有點(diǎn)火爆。

這不,在它“出道”前不久,阿里團(tuán)隊(duì)也發(fā)布了一個名叫Animate Anyone的項(xiàng)目,同樣是只要“一張圖”和“想要的動作”:

圖片

由此,也有網(wǎng)友發(fā)出了疑問:

這似乎是MagicAnimate和AnimateAnyone之間的戰(zhàn)爭。誰更勝一籌?

圖片

你覺得呢?

論文地址:https://arxiv.org/abs/2311.16498

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2023-12-05 13:49:00

AI模型

2019-06-23 17:30:07

AI 數(shù)據(jù)人工智能

2019-11-21 08:57:31

GPS信息定位

2023-12-03 08:40:18

微軟模型

2023-10-15 12:07:09

2023-05-26 00:19:07

照片模型個性化

2024-01-18 15:19:23

模型數(shù)據(jù)

2024-12-31 07:15:00

2022-03-02 13:44:10

3D模型數(shù)據(jù)

2011-02-16 11:18:15

思科無線網(wǎng)絡(luò)視頻

2020-01-21 21:20:00

人臉識別人工智能數(shù)據(jù)

2020-01-14 10:39:00

網(wǎng)絡(luò)安全網(wǎng)絡(luò)安全技術(shù)周刊

2025-04-10 09:54:40

2011-05-31 13:43:46

外鏈

2017-07-14 09:54:47

代碼函數(shù)程序

2024-03-28 13:14:00

數(shù)據(jù)訓(xùn)練

2019-09-11 10:12:12

華為

2023-08-16 14:51:35

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號