自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

抖音跳舞不用真人出鏡，一張照片就能生成高質(zhì)量視頻！字節(jié)新技術(shù)連抱抱臉CTO都下場體驗(yàn)了

作者：金磊 2023-12-06 12:54:00

人工智能存儲

這是來自新加坡國立大學(xué)和字節(jié)跳動最新的一項(xiàng)研究，名叫MagicAnimate。它的作用簡單來說可以總結(jié)為一個公式：一張圖片 + 一組動作 = 毫無違和感的視頻。

看！現(xiàn)在正有四位小姐姐在你面前大秀熱舞：

以為是某些主播在短視頻平臺發(fā)布的作品？

No，No，No。

真實(shí)答案是：假的，生成的，而且還是只靠了一張圖的那種！

真實(shí)的打開方式是這樣的：

這就是來自新加坡國立大學(xué)和字節(jié)跳動最新的一項(xiàng)研究，名叫MagicAnimate。

它的作用簡單來說可以總結(jié)為一個公式：一張圖片 + 一組動作 = 毫無違和感的視頻。

然后啊，這項(xiàng)技術(shù)一經(jīng)公布，可謂是在科技圈里掀起了不小的波瀾，眾多科技大佬和極客們紛紛下場耍了起來。

就連HuggingFace CTO都拿自己的頭像體驗(yàn)了一把：

順便還風(fēng)趣地開了句玩笑：

這算是健身了吧？我這周可以不去健身房了。

還有相當(dāng)與時俱進(jìn)的網(wǎng)友，拿著剛出爐的GTA6（俠盜獵車手6）預(yù)告片中的人物玩了一把：

甚至就連表情包們也成了網(wǎng)友們pick的對象……

MagicAnimate可以說是把科技圈的目光聚焦到了自己身上，因此也有網(wǎng)友調(diào)侃說：

OpenAI可以休息一下了。

火，著實(shí)是火。

一張圖即可生成一段舞

那么如此火爆的MagicAnimate，該如何“食用”？

話不多說，我們現(xiàn)在就來手把手地體驗(yàn)一次。

目前項(xiàng)目團(tuán)隊(duì)已經(jīng)在HuggingFace中開放了在線體驗(yàn)的頁面：

操作也是非常得簡單，只需三步即可：

上傳一張靜態(tài)人物照片
上傳想要生成的動作demo視頻
調(diào)整參數(shù)，點(diǎn)擊“Animate”即可

例如下面就是鄙人照片和一段近期席卷全球的《科目三》舞蹈片段：

△視頻源：抖音（ID：QC0217）

也可以選擇頁面下方提供的模版進(jìn)行體驗(yàn)：

不過需要注意的是，由于MagicAnimate目前過于火爆，在生成的過程中可能會出現(xiàn)“宕機(jī)”的情況：

即便成功“食用”，可能也得排大隊(duì)……

（沒錯！截至發(fā)稿，還是沒有等到結(jié)果！）

除此之外，MagicAnimate在GitHub中也給出了本地體驗(yàn)的方式，感興趣的小伙伴可以試試哦~

那么接下來的一個問題便是：

怎么做到的？

整體而言，MagicAnimate采用的是基于擴(kuò)散模型（diffusion）的一個框架，目的就是增強(qiáng)時間一致性、保持參考圖像的真實(shí)性，并提高動畫保真度。

為此，團(tuán)隊(duì)首先開發(fā)了一個視頻擴(kuò)散模型（Temporal Consistency Modeling）來編碼時間信息。

這個模型通過在擴(kuò)散網(wǎng)絡(luò)中加入時間注意力模塊，來編碼時間信息，從而確保動畫中各幀之間的時間一致性。

其次，為了保持幀間的外觀一致性，團(tuán)隊(duì)引入了一種新的外觀編碼器（Appearance Encoder）來保留參考圖像的復(fù)雜細(xì)節(jié)。

這個編碼器與以往使用CLIP編碼的方法不同，能夠提取密集的視覺特征來引導(dǎo)動畫，從而更好地保留身份、背景和服裝等信息。

在這兩項(xiàng)創(chuàng)新技術(shù)的基礎(chǔ)之上，團(tuán)隊(duì)進(jìn)一步采用了一種簡單的視頻融合技術(shù)（Video Fusion Technique）來促進(jìn)長視頻動畫的平滑過渡。

最終，在兩個基準(zhǔn)上的實(shí)驗(yàn)表明，MagicAnimate的結(jié)果要遠(yuǎn)優(yōu)于以往的方法。

尤其是在具有挑戰(zhàn)性的TikTok舞蹈數(shù)據(jù)集上，MagicAnimate在視頻保真度方面比最強(qiáng)基線高出38%以上！

團(tuán)隊(duì)所給出的定性比較如下：

以及與cross-ID的SOTA基線相比，結(jié)果如下：

One More Thing

不得不說，諸如MagicAnimate的項(xiàng)目最近著實(shí)是有點(diǎn)火爆。

這不，在它“出道”前不久，阿里團(tuán)隊(duì)也發(fā)布了一個名叫Animate Anyone的項(xiàng)目，同樣是只要“一張圖”和“想要的動作”：

由此，也有網(wǎng)友發(fā)出了疑問：

這似乎是MagicAnimate和AnimateAnyone之間的戰(zhàn)爭。誰更勝一籌？

你覺得呢？

論文地址：https://arxiv.org/abs/2311.16498

責(zé)任編輯：張燕妮來源：量子位

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<s id="palj6"><li id="palj6"><menuitem id="palj6"></menuitem></li></s>

<style id="palj6"></style>