自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="rsx6m"></sub>

<style id="rsx6m"></style>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

論文解讀：Expressive Whole-Body 3D Gaussian Avatar

智能交互引擎

發(fā)布于 2024-12-2 14:10

瀏覽

0收藏

在數(shù)字娛樂、虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)等領(lǐng)域，創(chuàng)建真實(shí)感強(qiáng)、能夠表達(dá)豐富情感的3D虛擬人物一直是研究的熱點(diǎn)。最近，來自DGIST和Codec Avatars Lab, Meta的研究團(tuán)隊(duì)在這一領(lǐng)域取得了突破性進(jìn)展，他們提出了一種名為ExAvatar的技術(shù)，能夠從單目的視頻中學(xué)習(xí)并創(chuàng)建出具有豐富表情和手勢的全身3D人像。本文將對這項(xiàng)技術(shù)進(jìn)行詳細(xì)解讀。
一、研究背景
傳統(tǒng)的3D人像往往只能模擬身體動作，而無法表現(xiàn)面部表情和手部動作。這限制了虛擬人物在交互和表達(dá)上的能力。ExAvatar技術(shù)的出現(xiàn)，打破了這一局限，它不僅能夠模擬身體動作，還能通過短段視頻捕捉并再現(xiàn)人的面部表情和手部動作。
二、ExAvatar技術(shù)核心
ExAvatar技術(shù)的核心在于結(jié)合了全身參數(shù)化網(wǎng)格模型（SMPL-X）和3D高斯繪制（3DGS）。這種混合表示方法使得ExAvatar能夠在沒有3D掃描和RGBD圖像的情況下，僅通過視頻學(xué)習(xí)就能生成具有個(gè)性化的3D人像。

混合表示方法
ExAvatar將每個(gè)3D高斯視為表面上的一個(gè)頂點(diǎn)，并根據(jù)SMPL-X的網(wǎng)格拓?fù)涠x它們之間的連接信息（即三角形面）。這種設(shè)計(jì)使得ExAvatar能夠通過SMPL-X的面部表情空間進(jìn)行驅(qū)動，即使視頻本身包含的面部表情和姿勢多樣性有限，也能生成具有新穎面部表情的動畫。
減少偽影
由于訓(xùn)練集中姿勢多樣性的有限性，未在視頻中觀察到的人體部分可能會在新的姿勢下產(chǎn)生偽影。ExAvatar通過基于連接的正則化器顯著減少了新姿勢下的偽影，尤其是在面部表情和姿勢上。
二、實(shí)驗(yàn)結(jié)果
研究團(tuán)隊(duì)在NeuMan和X-Humans數(shù)據(jù)集上進(jìn)行了廣泛的實(shí)驗(yàn)，結(jié)果表明ExAvatar在各種基準(zhǔn)測試中均優(yōu)于以往的3D人像技術(shù)。無論是在包含背景像素的評估中，還是在不包含背景像素的評估中，ExAvatar都展現(xiàn)出了更高的PSNR、SSIM和更低的LPIPS值，這表明其在圖像質(zhì)量、結(jié)構(gòu)相似性和感知損失上的優(yōu)勢。
三、討論與局限性
盡管ExAvatar技術(shù)取得了顯著的成果，但它仍然存在一些局限性。例如，對于視頻中未觀察到的人體內(nèi)部部分，如口腔內(nèi)部和手掌，模型可能會產(chǎn)生合理的幾何和紋理假設(shè)。此外，ExAvatar在模擬動態(tài)衣物方面也存在挑戰(zhàn)，未來可能需要考慮衣物材質(zhì)的運(yùn)動信息。
四、結(jié)論
ExAvatar技術(shù)為我們提供了一種從單目視頻中創(chuàng)建出能夠表達(dá)豐富情感的全身3D人像的新方法。這項(xiàng)技術(shù)不僅推動了3D人像技術(shù)的發(fā)展，也為未來虛擬人物的交互和表達(dá)提供了新的可能性。隨著技術(shù)的不斷進(jìn)步，我們期待ExAvatar能夠在更多應(yīng)用場景中展現(xiàn)出其獨(dú)特的價(jià)值。更多交流歡迎來卡奧斯智能交互引擎https://datayi.cn/w/a9Byxyno

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

騰訊、上?？拼箝_源InstantMesh，圖片直接生成3D模型

Aceryt ? 3940瀏覽 ? 0回復(fù)
谷歌重磅發(fā)布CAT3D：一分鐘搞定任意數(shù)量視圖到3D場景重建

angel ? 4052瀏覽 ? 0回復(fù)
無需3D數(shù)據(jù)也能訓(xùn)練，港科&港中文聯(lián)手華為推出3D自動駕駛場景生成模型

Crystalcxt ? 2705瀏覽 ? 0回復(fù)
DreamTech聯(lián)合南大和牛津發(fā)布最強(qiáng)3D內(nèi)容生成大模型——Direct3D

angel ? 2819瀏覽 ? 0回復(fù)
僅需1分鐘，文本生成高質(zhì)量3D模型—Meta 3D-Gen

Aceryt ? 2917瀏覽 ? 0回復(fù)
3D版"裁縫"開源來襲！Tailor3D:自定義3D編輯和資產(chǎn)生成（港大&上海AI-Lab&港中文）

angel ? 2370瀏覽 ? 0回復(fù)
北航&谷歌&曠視等開源Chat-Edit-3D: 3D 場景編輯新范式！

angel ? 2246瀏覽 ? 0回復(fù)
開源視頻模型SV4D，一鍵創(chuàng)建8角度動態(tài)3D視頻

Aceryt ? 2740瀏覽 ? 0回復(fù)
可提示 3D 分割研究里程碑！SAM2Point：SAM2加持泛化任意3D場景、任意提示！

angel ? 2205瀏覽 ? 0回復(fù)
英偉達(dá)提出LATTE3D：大規(guī)模高質(zhì)量的Amortized文本到增強(qiáng)3D 合成

angel ? 2485瀏覽 ? 0回復(fù)
麻省理工創(chuàng)新模型：用2D視頻擴(kuò)散，生成 3D 視頻

Aceryt ? 2647瀏覽 ? 0回復(fù)
ECCV`24 | 新加坡國立&華為提出Vista3D: 實(shí)現(xiàn)快速且多視角一致的3D生成

angel ? 1957瀏覽 ? 0回復(fù)
3D生成基礎(chǔ)模型來了！只需5秒，高質(zhì)量3D資產(chǎn)規(guī)模化生成！南洋理工等重磅開源3DTopia-XL

angel ? 2284瀏覽 ? 0回復(fù)
生成任意3D和4D場景！GenXD：通用3D-4D聯(lián)合生成框架 | 新加坡國立&微軟

angel ? 1983瀏覽 ? 0回復(fù)
3D任意部位分割：FIND 3D模型實(shí)現(xiàn)零樣本開放世界文本查詢分割

AIGC最前線 ? 1874瀏覽 ? 0回復(fù)
革新3D材質(zhì)生成！Material Anything：端到端打造任意3D物體的高質(zhì)量材質(zhì)！

angel ? 2434瀏覽 ? 0回復(fù)
從2D到3D：北大等開源Lift3D，助力精準(zhǔn)具身智能操作！

angel ? 2389瀏覽 ? 0回復(fù)
清華、中南開源3D交互實(shí)體AI Agent LEGENT

Aceryt ? 1798瀏覽 ? 0回復(fù)
解讀DeepseekV3

熵減AI ? 1104瀏覽 ? 0回復(fù)

智能交互引擎

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

《解讀論文：A Simple Framework for Contrastive Learning of Visual Representations》 2024-11-08 17:27:06發(fā)布
《深度學(xué)習(xí) “魔法”：數(shù)據(jù)增強(qiáng)策略深度剖析》 2024-11-06 10:30:45發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：《解讀論文：A Simple Framework for Contrastive Learning of Visual Representations》

社區(qū)精華內(nèi)容

目錄

<thead id="koqia"></thead>