自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

INTERMIMIC:打破限制!從模仿到生成,物理驅(qū)動(dòng)的人體-物體交互新范式

開發(fā) 前端
INTERMIMIC?提出了一種?基于物理模擬的人體-物體交互控制框架,采用?教師-學(xué)生蒸餾訓(xùn)練策略,在從?不完美 MoCap 數(shù)據(jù)?中學(xué)習(xí)多樣化全身運(yùn)動(dòng)技能的同時(shí),提升交互的物理真實(shí)性與泛化能力。

1. 一眼概覽

INTERMIMIC 提出了一種 基于物理模擬的人體-物體交互控制框架,采用 教師-學(xué)生蒸餾訓(xùn)練策略,在從 不完美 MoCap 數(shù)據(jù) 中學(xué)習(xí)多樣化全身運(yùn)動(dòng)技能的同時(shí),提升交互的物理真實(shí)性與泛化能力。實(shí)驗(yàn)表明,該方法能夠在多種動(dòng)態(tài)物體交互任務(wù)中實(shí)現(xiàn)零樣本泛化,并與運(yùn)動(dòng)生成模型無縫結(jié)合,實(shí)現(xiàn)從模仿學(xué)習(xí)到生成建模的跨越

2. 核心問題

高真實(shí)性的 人體-物體交互(HOI)模擬 一直是計(jì)算機(jī)動(dòng)畫、機(jī)器人學(xué)和虛擬現(xiàn)實(shí)的重要目標(biāo)。然而,當(dāng)前方法面臨諸多挑戰(zhàn):

MoCap 誤差:傳統(tǒng)運(yùn)動(dòng)捕捉數(shù)據(jù)中存在 接觸誤差、手部細(xì)節(jié)缺失,導(dǎo)致模擬的交互不真實(shí)。

交互泛化難:現(xiàn)有方法大多局限于 特定任務(wù)或固定物體,難以擴(kuò)展到多樣化的全身交互場(chǎng)景。

強(qiáng)化學(xué)習(xí)低效:基于強(qiáng)化學(xué)習(xí)的物理模擬通常 訓(xùn)練成本高,數(shù)據(jù)效率低,難以在大規(guī)模 HOI 任務(wù)上擴(kuò)展。

INTERMIMIC 旨在解決:如何從大量不完美的 MoCap 交互數(shù)據(jù)中學(xué)習(xí)多種運(yùn)動(dòng)技能,并確保高物理真實(shí)感和泛化性?

3. 技術(shù)亮點(diǎn)

教師-學(xué)生蒸餾訓(xùn)練策略:高效技能整合

教師策略:針對(duì)特定子任務(wù)訓(xùn)練多個(gè)教師策略,糾正 MoCap 誤差,提升交互質(zhì)量。

學(xué)生策略:整合所有教師策略的知識(shí),形成通用化的交互控制策略,實(shí)現(xiàn)跨任務(wù)泛化。

物理增強(qiáng)的運(yùn)動(dòng)校正(Physics-Enhanced Motion Refinement):強(qiáng)化現(xiàn)實(shí)感

? 采用 物理模擬 來自動(dòng)修正 MoCap 誤差,如手部接觸偏差、浮動(dòng)接觸點(diǎn)等,提升運(yùn)動(dòng)真實(shí)性。

? 設(shè)計(jì) 基于接觸引導(dǎo)的獎(jiǎng)勵(lì)函數(shù),確保交互符合物理規(guī)律,而非僅模仿表面運(yùn)動(dòng)軌跡。

零樣本泛化能力:與運(yùn)動(dòng)生成模型無縫結(jié)合

? 可直接集成 文本驅(qū)動(dòng)交互生成(Text-to-Interaction) 和 未來交互預(yù)測(cè)(Interaction Prediction),支持開放式任務(wù)。

無須額外微調(diào),即可適應(yīng)未見過的物體和交互任務(wù),大幅提高應(yīng)用靈活性。

4. 方法框架

圖片圖片

INTERMIMIC 采用 兩階段教師-學(xué)生蒸餾訓(xùn)練策略,核心流程如下:

1?? 教師策略訓(xùn)練(Teacher Policies):

? 針對(duì) 小規(guī)模數(shù)據(jù)子集 訓(xùn)練多個(gè)教師策略,優(yōu)化 MoCap 誤差,確保交互動(dòng)作物理可行。

? 采用 基于強(qiáng)化學(xué)習(xí)(RL)的模仿優(yōu)化,強(qiáng)化交互的真實(shí)性和穩(wěn)定性。

2?? 學(xué)生策略蒸餾(Student Policy Distillation):

? 通過 空間-時(shí)間權(quán)衡(Space-Time Trade-off) 機(jī)制,從多個(gè)教師策略學(xué)習(xí),形成單一的通用交互控制策略。

? 采用 聯(lián)合行為克?。˙C)和 RL 細(xì)化(RL Fine-Tuning),使學(xué)生策略不僅能模仿,還能生成更優(yōu)的交互方案。

?? 流程示意:

  •  MoCap 數(shù)據(jù)輸入 → 2. 教師策略優(yōu)化 MoCap 誤差 → 3. 學(xué)生策略融合多種技能 → 4. 生成物理真實(shí)的交互控制策略

5. 實(shí)驗(yàn)結(jié)果速覽

圖片

INTERMIMIC 在多個(gè) 動(dòng)態(tài)交互數(shù)據(jù)集(OMOMO、BEHAVE、HODome) 上驗(yàn)證了其 高效性和泛化能力。

?? 關(guān)鍵實(shí)驗(yàn)展示:

更高交互質(zhì)量:相比 SkillMimic,INTERMIMIC 顯著降低人體和物體的跟蹤誤差,增強(qiáng)模擬真實(shí)性。

更強(qiáng)泛化能力:無需額外訓(xùn)練,即可適用于未見過的物體和任務(wù)(如未來交互預(yù)測(cè)、文本驅(qū)動(dòng)交互生成)。

更穩(wěn)定的交互控制:能在長時(shí)間交互任務(wù)中維持穩(wěn)定的物理模擬,避免非自然行為(如物體穿透、接觸丟失)。

6. 實(shí)用價(jià)值與應(yīng)用

?? 計(jì)算機(jī)動(dòng)畫:高真實(shí)感的人體-物體交互動(dòng)畫,減少人工調(diào)整成本。?? 機(jī)器人學(xué)類人機(jī)器人交互訓(xùn)練,可直接用于機(jī)器人全身操控任務(wù)。?? 虛擬現(xiàn)實(shí)(VR)與游戲:提升虛擬人物的 自主交互能力,增強(qiáng)沉浸式體驗(yàn)。?? 運(yùn)動(dòng)預(yù)測(cè)與合成:結(jié)合 文本輸入 生成未來交互,應(yīng)用于智能助理、游戲 AI 等場(chǎng)景。

?? 獨(dú)特優(yōu)勢(shì):

無需全監(jiān)督訓(xùn)練,僅依賴 MoCap 數(shù)據(jù)即可實(shí)現(xiàn) 精準(zhǔn)交互控制。

跨任務(wù)泛化,可直接適配 不同形態(tài)物體、任務(wù)指令,無需額外訓(xùn)練。

低成本高質(zhì)量,結(jié)合強(qiáng)化學(xué)習(xí)與教師策略,自動(dòng)修正 MoCap 誤差。

7. 開放問題

?? 討論點(diǎn):

INTERMIMIC 如何應(yīng)對(duì)更加復(fù)雜的環(huán)境,如多主體交互?

教師策略如何適應(yīng)超出訓(xùn)練數(shù)據(jù)范圍的未知交互任務(wù)?

是否能結(jié)合 LLM 進(jìn)一步優(yōu)化交互生成,如 GPT 結(jié)合 HOI 任務(wù)?

?? 未來工作方向:

? 結(jié)合 對(duì)比學(xué)習(xí)、自監(jiān)督學(xué)習(xí),進(jìn)一步提升泛化能力。

將 INTERMIMIC 應(yīng)用于真實(shí)機(jī)器人訓(xùn)練,實(shí)現(xiàn)端到端的物理交互學(xué)習(xí)。

探索多主體交互擴(kuò)展,使其適用于群體運(yùn)動(dòng)、競(jìng)技場(chǎng)景等應(yīng)用。

責(zé)任編輯:武曉燕 來源: 萍哥學(xué)AI
相關(guān)推薦

2023-09-04 12:59:03

AI數(shù)據(jù)

2025-03-27 09:24:16

2022-05-25 10:28:35

模型AI

2024-09-26 17:07:23

2024-09-21 08:45:45

2023-12-06 13:39:00

模型訓(xùn)練

2025-02-12 10:17:12

2023-10-23 16:14:00

數(shù)據(jù)孤島數(shù)據(jù)管理

2025-04-29 09:43:28

2024-01-09 14:00:26

2024-04-18 12:16:37

MetaAIOpenEQA

2025-04-10 16:23:02

2021-07-02 09:12:39

數(shù)字化

2022-09-26 11:51:47

電信機(jī)房光纖連接

2015-08-03 09:39:46

數(shù)據(jù)

2025-04-28 02:55:00

2010-03-09 13:56:53

TD終端瓶頸

2023-10-29 22:25:23

模型AI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)