自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

英偉達(dá)新方法入選CVPR 2023:對未知物體的6D姿態(tài)追蹤和三維重建

人工智能 新聞
這就是英偉達(dá)最新提出的方法BundleSDF。

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

普通手機(jī)“隨手”拍的雕像,一下就變成了精細(xì)的三維重建圖。

水杯來回動的動態(tài)場景下,細(xì)節(jié)清晰可見:

圖片

靜態(tài)場景效果也同樣nice,狗狗突出的肋骨都被還原了出來:

圖片

對比來看其他方法,效果是醬嬸的……

圖片

這就是英偉達(dá)最新提出的方法BundleSDF

這是一種可對未知物體的6D姿態(tài)追蹤和三維重建的方法。

用于從單目RGBD視頻序列中跟蹤未知物體的6自由度運(yùn)動,同時進(jìn)行物體的隱式神經(jīng)三維重建,方法接近于實(shí)時(10Hz)。

這種方法適用于任意剛性物體,即使視覺紋理大部分確實(shí),僅需在第一幀中分割出物體,不需要任何額外的信息,并且不對智能體與物體的交互模式做任何假設(shè)。

目前,該方法已被CVPR 2023接收。

可處理大幅度姿態(tài)變化、有遮擋視頻

該方法的關(guān)鍵是一個神經(jīng)物體場,它與姿態(tài)圖優(yōu)化過程同時進(jìn)行,以便將信息穩(wěn)健地累積到一致的3D表示中,捕捉幾何和外觀。

方法自動維護(hù)了一組動態(tài)的姿態(tài)內(nèi)存幀,以便這些線程之間進(jìn)行通信。

它能處理具有大幅度姿態(tài)變化、部分和完全遮擋、無紋理表面和高光反射等具有挑戰(zhàn)性的視頻。

作者展示了HO3D、YCBInEOAT和BEHAVE數(shù)據(jù)集上的結(jié)果,證明了我們的方法顯著優(yōu)于現(xiàn)有方法。

野外測試

用于iPhone 12 Pro Max的效果:

圖片

用于Intel RealSense的效果:

圖片

該方法不僅適用于更具挑戰(zhàn)性的動態(tài)場景,還適用于此前經(jīng)常被考慮的靜態(tài)場景(移動相機(jī))。

因此實(shí)現(xiàn)了比專門設(shè)計(jì)用于靜態(tài)場景的那些方法更好或相當(dāng)?shù)慕Y(jié)果(即文章開頭展示動圖)。

圖片

與SOTA對比

HO3D數(shù)據(jù)集上三種最具競爭力方法的定性比較。

左圖:6自由度姿態(tài)跟蹤可視化,其中輪廓(青色)以估計(jì)的姿態(tài)渲染。

值得注意的是,如第二列所示,我們的預(yù)測姿態(tài)有時甚至?xí)m正GT的錯誤。

右圖:每種方法輸出的最終3D重建的正面和背面視圖。

由于手部遮擋,視頻中的某些部分永遠(yuǎn)不可見。雖然從相同的視角渲染網(wǎng)格,但是DROID-SLAM和BundleTrack的顯著漂移導(dǎo)致網(wǎng)格錯誤旋轉(zhuǎn)。

圖片

定量結(jié)果對比如下:

圖片

圖片

圖片

問題設(shè)置

給定一段單目RGBD輸入視頻以及僅在第一幀中目標(biāo)物體的分割掩碼,該方法能持續(xù)追蹤物體的6-DoF姿態(tài)并重建物體的3D模型。

所有處理都是在線自回歸的(沒有假設(shè)未來幀可用)。

處理的物體是剛性的,但不依賴其特定豐富的紋理 - 方法適用于無紋理的物體。

此外,不需要物體的實(shí)例級CAD模型,也不需要物體類別的先驗(yàn)知識(例如事先對同一物體類別進(jìn)行預(yù)訓(xùn)練)。

具體框架

圖片

首先,在連續(xù)的分割圖像之間匹配特征,以獲得粗略的姿態(tài)估計(jì)(第3.1節(jié))。

其中一些帶姿態(tài)的幀被存儲在內(nèi)存池中,以便稍后使用和精化(第3.2節(jié))。

從內(nèi)存池的子集動態(tài)創(chuàng)建位姿圖(第3.3節(jié));在線優(yōu)化與當(dāng)前姿態(tài)一起聯(lián)合細(xì)化圖中的所有姿態(tài)。

然后,這些更新的姿態(tài)被存儲回內(nèi)存池中。

最后,內(nèi)存池中的所有帶姿態(tài)的幀用于學(xué)習(xí)神經(jīng)物體場(在單獨(dú)的線程中),該場建模了物體的幾何和視覺紋理(第3.4節(jié)),同時調(diào)整其先前估計(jì)的姿態(tài),使姿態(tài)跟蹤更加魯棒。

項(xiàng)目地址:https://bundlesdf.github.io/

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2023-12-13 10:14:00

機(jī)器視覺技術(shù)

2024-04-07 06:30:00

AI開源

2023-12-29 09:36:51

三維模型

2021-03-16 09:53:35

人工智能機(jī)器學(xué)習(xí)技術(shù)

2024-09-04 09:38:02

2023-10-27 14:54:33

智能駕駛云計(jì)算

2025-04-10 09:38:37

2023-10-16 09:51:47

模型視覺

2023-03-21 09:19:42

技術(shù)圖像

2023-06-02 14:10:05

三維重建

2024-03-25 08:35:00

6DAI

2024-02-20 09:46:00

模型技術(shù)

2024-03-06 14:57:13

火山引擎

2021-11-26 18:37:39

技術(shù)人工智能計(jì)算機(jī)

2024-06-19 11:30:36

2021-10-09 15:36:31

技術(shù)研發(fā)三維

2025-04-08 09:30:00

模型AI機(jī)器人

2022-09-26 15:18:15

3D智能

2022-05-20 15:28:25

3D算法

2015-08-21 09:14:40

大數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號