自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<u id="ahesi"><center id="ahesi"><tbody id="ahesi"></tbody></center></u>

<style id="ahesi"></style>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

史上最快3D數(shù)字人生成器：半小時(shí)完成訓(xùn)練，渲染僅需16毫秒，蘋果出品

作者：量子位 2023-12-23 23:18:38

人工智能新聞

這正是由蘋果聯(lián)合德國馬普所推出的，基于高斯函數(shù)的3D數(shù)字人合成工具HUGS。它可以從一段簡單的視頻當(dāng)中提取出人物骨骼，從而合成數(shù)字分身并驅(qū)動(dòng)它做出任意動(dòng)作。

之前要兩天才能訓(xùn)練好的數(shù)字人，現(xiàn)在只用半小時(shí)就能完成了！

到了推理階段，更是只要16毫秒，就能得到動(dòng)作流暢、細(xì)節(jié)到位的場景視頻。

而且無需復(fù)雜的采樣和建模，只要隨便拍一段50-100幀的視頻就足夠了，換算成時(shí)間不過幾秒鐘。

這正是由蘋果聯(lián)合德國馬普所推出的，基于高斯函數(shù)的3D數(shù)字人合成工具HUGS。

它可以從一段簡單的視頻當(dāng)中提取出人物骨骼，從而合成數(shù)字分身并驅(qū)動(dòng)它做出任意動(dòng)作。

這個(gè)數(shù)字人可以絲滑地融合到其他場景，甚至幀率還能超越原始素材，達(dá)到60FPS。

Hugging Face的“首席羊駝官”O(jiān)mar Sanseviero看到后，也給HUGS送上了hug。

那么，HUGS可以實(shí)現(xiàn)怎樣的效果呢？

100倍速生成60FPS視頻

從下面這張動(dòng)圖可以看出，新生成的數(shù)字人可以在不同于訓(xùn)練素材的場景中做出不同的動(dòng)作。

而新合成的畫面也比原始素材更加流暢——盡管原素材只有24FPS，但HUGS合成的視頻幀率達(dá)到了60FPS。

同時(shí)，HUGS也支持把多個(gè)人物融合進(jìn)同一個(gè)場景。

細(xì)節(jié)刻畫上，HUGS也比Neuman和Vid2Avatar這兩個(gè)前SOTA更清晰細(xì)膩，也更加真實(shí)。

如果放到規(guī)范空間中，Neuman和HUGS的細(xì)節(jié)對比將變得更加明顯。

測試數(shù)據(jù)上看，HUGS在NeuMan數(shù)據(jù)集的五個(gè)場景中的PSNR和SSIM評分都達(dá)到了SOTA水平，LPIPS誤差則處于最低位。

在ZJU Mocap數(shù)據(jù)集上，針對5個(gè)不同受試者，HUGS也都超越了NerualBody、HumanNeRF等Baseline方法。

速度方面，HUGS的訓(xùn)練只需半小時(shí)就能完成，而此前最快的VidAvtar也要48小時(shí)，速度提升了近百倍。

渲染速度也是如此，用Baseline方法進(jìn)行渲染需要2-4分鐘，但HUGS只用16.6毫秒就能完成，比人眨眼的速度還快。（下圖為對數(shù)坐標(biāo)系）

那么，HUGS是如何實(shí)現(xiàn)既迅速又細(xì)膩地生成3D數(shù)字人的呢？

像搭積木一樣渲染

HUGS首先將人物和場景分別轉(zhuǎn)化為3D高斯斑點(diǎn)。

其中，人物部分的高斯斑點(diǎn)由三個(gè)多層感知機(jī)（MLP）來預(yù)測，并通過SMPL（一種人體形狀模型）進(jìn)行初始化。

SMPL可以用極少的參數(shù)建立實(shí)體人物到三維網(wǎng)格的映射，只需要10個(gè)主要參數(shù)就可以表示99%的人體形狀變化。

同時(shí)，為了刻畫頭發(fā)和衣服等細(xì)節(jié)，HUGS也允許高斯函數(shù)在一定程度上偏離SMPL。

場景的高斯斑點(diǎn)通過特征三平面提供的位置編碼，由多個(gè)MLP預(yù)測得到。

得到人體和場景模型的高斯斑點(diǎn)后，研究者對它們進(jìn)行了聯(lián)合優(yōu)化。

得到的高斯斑點(diǎn)還會(huì)被進(jìn)行克隆和拆分，從而增大斑點(diǎn)密度，不斷接近真實(shí)的目標(biāo)幾何表面，這一過程稱為Densify。

此外，研究人員還引入了線性混合動(dòng)畫（LBS）技術(shù)，在運(yùn)動(dòng)過程中對高斯斑點(diǎn)進(jìn)行驅(qū)動(dòng)。

轉(zhuǎn)換為高斯斑點(diǎn)形式后，研究人員訓(xùn)練了神經(jīng)網(wǎng)絡(luò)對高斯函數(shù)的屬性進(jìn)行預(yù)測，形成真實(shí)的人體形狀。

同時(shí)，神經(jīng)網(wǎng)絡(luò)還定義了高斯函數(shù)與人體骨骼的綁定關(guān)系，從而實(shí)現(xiàn)人物的運(yùn)動(dòng)。

這樣，HUGS的渲染過程就像搭積木一樣，不需要重新調(diào)用神經(jīng)網(wǎng)絡(luò)，從而實(shí)現(xiàn)了高速渲染。

消融實(shí)驗(yàn)結(jié)果表明，LBS、Densify和三平面MLP都是HUGS中的重要環(huán)節(jié)，缺少任何一個(gè)都會(huì)對合成效果造成影響。

而人物與場景的聯(lián)合優(yōu)化，同樣是實(shí)現(xiàn)剛好融合效果的關(guān)鍵因素。

One More Thing

蘋果產(chǎn)生研究數(shù)字人的想法已經(jīng)有一段時(shí)間了。

在蘋果MR頭顯Apple Vision Pro中，就出現(xiàn)過高細(xì)節(jié)版本的數(shù)字分身概念——

在FaceTime通話時(shí)，頭顯可以創(chuàng)建一個(gè)“數(shù)字人”，并用它來代表用戶。

那么，對蘋果的這個(gè)“數(shù)字人生成器”，你怎么看呢？

論文地址：https://arxiv.org/abs/2311.17910

責(zé)任編輯：張燕妮來源：量子位

蘋果數(shù)字人 3D

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<cite id="n1bmg"></cite>

<ruby id="n1bmg"></ruby>