自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

谷歌DeepMind重磅推出多視角視頻擴(kuò)散模型CAT4D,單視角視頻也能轉(zhuǎn)換多視角了

人工智能 新聞
給定輸入單目視頻,我們使用多視圖視頻擴(kuò)散模型生成新視點(diǎn)的多視圖視頻。然后,使用這些生成的視頻將動態(tài) 3D 場景重建為變形 3D 高斯。

本文經(jīng)AIGC Studio公眾號授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

單目視覺4D重建再突破!谷歌DeepMind等團(tuán)隊,推出了多視角視頻擴(kuò)散模型CAT4D,它支持輸入單個視角的視頻,轉(zhuǎn)換后可以自行拖動。

該模型可以分別固定視角和時間,然后分別輸出了視角不動(機(jī)位固定)時間變、時間不變視角動,以及視角時間均變動的效果。 如下圖所示:

圖片圖片

相關(guān)鏈接

? 論文:https://arxiv.org/pdf/2411.18613

? 主頁:https://cat-4d.github.io/

論文介紹

圖片

    CAT4D:使用多視圖視頻擴(kuò)散模型以 4D 形式創(chuàng)建任何內(nèi)容

工作原理

它是如何運(yùn)作的

給定輸入單目視頻,我們使用多視圖視頻擴(kuò)散模型生成新視點(diǎn)的多視圖視頻。然后,使用這些生成的視頻將動態(tài) 3D 場景重建為變形 3D 高斯。

圖片

獨(dú)立的攝像頭和時間控制

CAT4D 的核心是多視圖視頻擴(kuò)散模型,它可以解開攝像機(jī)和場景運(yùn)動的控制。我們通過給定 3 個輸入圖像(帶有相機(jī)姿勢)生成三種類型的輸出序列來演示這一點(diǎn):1)固定視點(diǎn)和變化時間,2)變化視點(diǎn)和固定時間,3)變化視點(diǎn)和變化時間。

圖片

比較

將我們的方法與不同任務(wù)的基線進(jìn)行比較。嘗試選擇不同的任務(wù)和場景!

給定 3 個輸入圖像,我們生成三種類型的輸出序列:

1. 固定視點(diǎn)和變化時間

2. 變化視點(diǎn)和固定時間

3. 變化視點(diǎn)和變化時間。

圖片

僅給定動態(tài)場景的一些姿勢圖像,我們就可以通過重建與一個輸入視圖的時間相對應(yīng)的靜態(tài) 3D 場景來創(chuàng)建“子彈時間”效果。三個輸入圖像顯示在左側(cè),其中第一個是目標(biāo)子彈時間幀。

圖片

DyCheck 數(shù)據(jù)集上單目視頻動態(tài)場景重建的比較。

圖片

責(zé)任編輯:張燕妮 來源: AIGC Studio
相關(guān)推薦

2024-12-16 14:40:00

AI模型訓(xùn)練

2022-08-28 16:20:44

模型數(shù)學(xué)

2024-12-18 15:20:00

視圖生成AI

2023-08-14 08:30:32

2023-10-23 10:11:36

自動駕駛技術(shù)

2024-02-20 13:44:00

AI數(shù)據(jù)

2023-11-23 07:41:54

因果推斷大模型

2021-10-18 10:14:54

數(shù)據(jù)技術(shù)模型

2022-12-13 10:17:05

技術(shù)目標(biāo)檢測

2017-07-11 15:00:04

前端CSS3D視角

2022-08-24 14:50:09

谷歌3D

2021-06-18 05:59:37

Css前端CSS 特效

2022-06-09 12:07:14

行業(yè)云首席信息官

2010-06-01 09:20:45

jQuery

2023-02-20 19:52:53

場景商品業(yè)務(wù)

2012-08-17 09:32:08

云計算架構(gòu)

2022-01-19 09:00:51

UI前端手機(jī)開發(fā)

2013-04-27 09:24:33

2015-09-10 13:28:51

暢享網(wǎng)

2024-09-18 13:03:52

AI視頻生成
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號