自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

一鍵實(shí)景轉(zhuǎn)動(dòng)畫(huà)，清華系初創(chuàng)公司全球首發(fā)4D骨骼動(dòng)畫(huà)框架，還能生成個(gè)性化角色

作者：機(jī)器之心 2024-01-19 16:35:00

人工智能新聞

清華系創(chuàng)業(yè)團(tuán)隊(duì)生數(shù)科技開(kāi)展了系列研究和產(chǎn)品研發(fā)，于近期聯(lián)合清華大學(xué)、同濟(jì)大學(xué)等高校推出全球首個(gè)基于「骨骼動(dòng)畫(huà)」的 4D 動(dòng)畫(huà)生成框架「AnimatableDreamer」，能夠直接將 2D 視頻素材一鍵轉(zhuǎn)成動(dòng)態(tài)立體模型。

前幾日，蘋(píng)果宣布首款虛擬頭顯設(shè)備 Vision Pro 將于 2 月 2 日正式發(fā)售，XR 設(shè)備作為下一代終端預(yù)計(jì)將迎來(lái)快速發(fā)展。未來(lái)隨著虛擬顯示設(shè)備的普及，數(shù)字交互將從平面走向立體，立體模型、立體動(dòng)畫(huà)將成為未來(lái)主流的內(nèi)容形態(tài)，虛實(shí)融合下的多維沉浸式交互也將成為潮流。

但從數(shù)據(jù)規(guī)?？矗F(xiàn)階段內(nèi)容產(chǎn)業(yè)的數(shù)據(jù)積累仍以 2D 圖像、平面視頻為主，3D 模型、4D 動(dòng)畫(huà)等數(shù)據(jù)基礎(chǔ)較為薄弱。其中，4D 動(dòng)畫(huà)是在傳統(tǒng) 3D 模型的基礎(chǔ)上引入時(shí)間序列，即隨時(shí)間變化的 3D 模型，可以呈現(xiàn)出動(dòng)態(tài)立體效果，在游戲動(dòng)畫(huà)、電影特效、虛擬現(xiàn)實(shí)等領(lǐng)域具有廣泛的應(yīng)用，但也是目前內(nèi)容生態(tài)開(kāi)發(fā)中最困難的環(huán)節(jié)。

因此，面向即將到來(lái)的多維沉浸式體驗(yàn)，構(gòu)建立體化的數(shù)字內(nèi)容將成為重要的基礎(chǔ)性工作。

面向該前沿領(lǐng)域，清華系創(chuàng)業(yè)團(tuán)隊(duì)生數(shù)科技開(kāi)展了系列研究和產(chǎn)品研發(fā)，于近期聯(lián)合清華大學(xué)、同濟(jì)大學(xué)等高校推出全球首個(gè)基于「骨骼動(dòng)畫(huà)」的 4D 動(dòng)畫(huà)生成框架「AnimatableDreamer」，能夠直接將 2D 視頻素材一鍵轉(zhuǎn)成動(dòng)態(tài)立體模型（即 4D 動(dòng)畫(huà)），支持自動(dòng)提取骨骼動(dòng)作、一鍵轉(zhuǎn)換動(dòng)畫(huà)效果并可通過(guò)文字輸入進(jìn)行個(gè)性化角色生成。

論文地址：https://arxiv.org/pdf/2312.03795.pdf
項(xiàng)目地址：https://animatabledreamer.github.io/
論文標(biāo)題：AnimatableDreamer: Text-Guided Non-rigid 3D Model Generation and Reconstruction with Canonical Score Distillation

大家可以看以下Demo視頻。

全新內(nèi)容生產(chǎn)方式

顛覆立體動(dòng)畫(huà)開(kāi)發(fā)流程

過(guò)往業(yè)界制作立體動(dòng)畫(huà)，需要經(jīng)過(guò) 3D 建模、貼圖渲染、骨骼綁定、動(dòng)畫(huà)制作等復(fù)雜流程，需要建模師、動(dòng)畫(huà)師等專業(yè)人員參與才能完成，效率低、成本高。據(jù)統(tǒng)計(jì)，單一個(gè)靜態(tài) 3D 模型建模的生產(chǎn)周期就在數(shù)小時(shí)到幾天時(shí)間，成本可高達(dá)上千美元，再進(jìn)行動(dòng)態(tài)化處理成本投入將更高。

從官方發(fā)布的 demo 視頻可以看到，上傳一段松鼠的 2D 實(shí)景視頻，通過(guò)輸入「A squirrel with red sweater」（穿紅色毛衣的松鼠）的文本描述，原本實(shí)景的松鼠一鍵轉(zhuǎn)成動(dòng)畫(huà)風(fēng)格，而且完美保留了動(dòng)作姿勢(shì)，同步還可生成 360 度視角下的立體動(dòng)態(tài)模型，通過(guò)切換文字描述，可以自定義角色，將松鼠任意切換為狐貍、杰尼龜?shù)炔煌目ㄍㄐ蜗蟆?/span>

「AnimatableDreamer」可自動(dòng)提取視頻中目標(biāo)對(duì)象（人物、動(dòng)物等）的骨骼動(dòng)作，再通過(guò)文本描述將該對(duì)象轉(zhuǎn)換為任意的帶骨骼動(dòng)畫(huà)模型。整個(gè)過(guò)程不受模版限制，支持任意視頻長(zhǎng)度和任意類型動(dòng)作，具備高度的時(shí)間一致性和多視角一致性，并且導(dǎo)出的動(dòng)態(tài)立體模型，能夠在任意 3D 環(huán)境中進(jìn)行渲染。

面向影視動(dòng)漫等領(lǐng)域的后期制作，通常需要針對(duì)動(dòng)畫(huà)做更多編輯，「AnimatableDreamer」也支持針對(duì)已經(jīng)完成骨骼綁定的模型進(jìn)行更換或編輯動(dòng)畫(huà)文件，實(shí)現(xiàn)更高的自由度。未來(lái)相關(guān)技術(shù)逐漸落地后，游戲開(kāi)發(fā)、影視動(dòng)畫(huà)等場(chǎng)景的 3D 建模、動(dòng)畫(huà)制作流程，有望變得更加高效。

面向未來(lái)

有望形成全新的內(nèi)容生態(tài)

在實(shí)現(xiàn)原理上，研究團(tuán)隊(duì)創(chuàng)新性地提出了規(guī)范得分蒸餾策略（Canonical Score Distillation，簡(jiǎn)稱 CSD），在隨時(shí)間變化的相機(jī)空間中對(duì)不同幀及不同視角的 3D 模型進(jìn)行渲染及降噪，并統(tǒng)一將梯度回傳至不同相機(jī)空間共享的規(guī)范空間中進(jìn)行蒸餾，將 4D 生成降維至 3D，即將 4D 生成問(wèn)題簡(jiǎn)化為 3D 空間上的生成。

「AnimatableDreamer」能直接從視頻中提取關(guān)節(jié)動(dòng)作，通過(guò)解耦物體的模型與運(yùn)動(dòng)，生成的模型具備高度的時(shí)間一致性和幾何合理性，不受視頻長(zhǎng)度限制，而且能有效地消除如形狀斷裂、閃爍和多視角不一致等問(wèn)題。

在有限視角和大幅度運(yùn)動(dòng)的場(chǎng)景中，由于引入了 Diffusion 模型的先驗(yàn)知識(shí)，即便輸入的視頻未覆蓋完整物體，「AnimatableDreamer」也能自動(dòng)補(bǔ)全畫(huà)面信息，實(shí)現(xiàn)較好的生成質(zhì)量。

可以說(shuō)，「AnimatableDreamer」的提出直接打通文本到 4D 骨骼動(dòng)畫(huà)的生成，建模、貼圖、骨骼綁定、動(dòng)作驅(qū)動(dòng)一氣呵成！輸入自然語(yǔ)言描述，自動(dòng)輸出立體動(dòng)畫(huà)視頻，無(wú)需專業(yè)知識(shí)，普通人也能直接上手，輕松定制動(dòng)畫(huà)內(nèi)容。

以「AnimatableDreamer」為基礎(chǔ)的工作將大大降低 3D、4D 數(shù)字內(nèi)容的生產(chǎn)難度，將交互體驗(yàn)豐富化，讓每個(gè)人都能進(jìn)行創(chuàng)意內(nèi)容的生成和編輯，將催生出 3D 時(shí)代下全新的內(nèi)容娛樂(lè)與內(nèi)容消費(fèi)模式。

暢想一下，在未來(lái)的虛擬世界中，用戶可以快速搭建自定義的數(shù)字空間，打造個(gè)性化的交互體驗(yàn)。例如：

數(shù)字空間下的每個(gè)人物形象可以任意個(gè)性化的生成，比如給小朋友穿上超人的衣服、萬(wàn)圣節(jié)隨意切換節(jié)日主題服裝等；
養(yǎng)寵物的用戶可以將自家寵物卡通化，例如將其生成虛擬的米老鼠形象。寵物日常就如卡通片一樣，主人跟寵物的日常互動(dòng)將變得趣味橫生；
人與人的互動(dòng)方式也變得更豐富，隨時(shí)隨地可以來(lái)上一場(chǎng)主題派對(duì)，實(shí)時(shí)生成想要的派對(duì)環(huán)境、人物裝扮等等。

作為一家成立不到一年的初創(chuàng)公司，生數(shù)科技團(tuán)隊(duì)長(zhǎng)期致力于圖像、3D、視頻等多模態(tài)大模型領(lǐng)域，在 9 月份發(fā)布了 3D 資產(chǎn)創(chuàng)建工具 VoxCraft，在 Discord 正式上線，支持文圖引導(dǎo)、分鐘級(jí)創(chuàng)建 3D 模型、3D 貼圖自定義更換等功能，賦能游戲開(kāi)發(fā)、影視動(dòng)畫(huà)等場(chǎng)景的 3D 建模流程。此次推出的 4D 骨骼動(dòng)畫(huà)生成是生數(shù)科技的又一項(xiàng)全新探索工作，未來(lái)將在 VoxCraft 的產(chǎn)品中進(jìn)行集成。

VoxCraft 工具地址：https://voxcraft.ai/

蘋(píng)果 Vision Pro 的來(lái)臨不僅僅是硬件設(shè)備層面的重要革新，同時(shí)也將開(kāi)啟一場(chǎng)內(nèi)容和體驗(yàn)革命的序幕。4D 動(dòng)畫(huà)生成等生成式 AI 的創(chuàng)新能力，除了帶來(lái)更好的視覺(jué)呈現(xiàn)，還將以全新方式打開(kāi)多維數(shù)字體驗(yàn)，為下一代人機(jī)交互帶來(lái)更多可能。

責(zé)任編輯：張燕妮來(lái)源：機(jī)器之心

模型動(dòng)畫(huà)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)