自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="ynyql"></cite>

<bdo id="ynyql"></bdo>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

騰訊、上?？拼箝_(kāi)源InstantMesh，圖片直接生成3D模型

發(fā)布于 2024-5-9 09:58

瀏覽

0收藏

騰訊PCG ARC實(shí)驗(yàn)室和上?？萍即髮W(xué)的研究人員聯(lián)合開(kāi)源了創(chuàng)新模型——InstantMesh。

用戶通過(guò)InstantMesh上傳一張圖片，只需要十秒的時(shí)間就能將圖片變成360度全視角的3D模型。并且可以下載模型將其放在3D Max、瑪雅等專業(yè)軟件中，以簡(jiǎn)化游戲、廣告、家居、虛擬現(xiàn)實(shí)等開(kāi)發(fā)流程。

研究人員在公開(kāi)數(shù)據(jù)集Google Scanned Objects、OmniObject3D等InstantMesh進(jìn)行了綜合測(cè)試。

結(jié)果顯示，其生成的3D模型在視覺(jué)質(zhì)量和幾何精度上都顯著優(yōu)于現(xiàn)有最新方法,如LGM、CRM等。在多視角的合成任務(wù)上,InstantMesh也明顯優(yōu)于SV3D等知名擴(kuò)散模型。

開(kāi)源地址：https://github.com/TencentARC/InstantMesh

在線demo：https://huggingface.co/spaces/TencentARC/InstantMesh

論文地址：https://arxiv.org/abs/2404.07191

騰訊、上?？拼箝_(kāi)源InstantMesh，圖片直接生成3D模型-AI.x社區(qū)

InstantMesh的技術(shù)創(chuàng)新在于，將多視圖擴(kuò)散模型和稀疏視圖重建模型相結(jié)合使用。

首先利用多視角擴(kuò)散模型生成一組一致的多視角圖像，然后利用稀疏視圖重建模型直接預(yù)測(cè)3D網(wǎng)格，整個(gè)過(guò)程只需要十幾秒甚至幾秒就能完成。

為了提高訓(xùn)練效率，并在3D網(wǎng)格表示上應(yīng)用幾何監(jiān)督信息，InstantMesh還引入了一個(gè)可微分的等值面提取模塊。這種方法能夠直接在網(wǎng)格表面上進(jìn)行優(yōu)化，從而提高訓(xùn)練效率和模型生成的質(zhì)量。

多視圖擴(kuò)散模型

?

多視圖擴(kuò)散模型的主要作用是將一張靜態(tài)的2D圖片中生成一系列新的視角圖像，這些圖像覆蓋了目標(biāo)物體的多個(gè)方向。

首先，接收用戶輸入的圖片，并利用Zero123++模型生成一系列的新視角圖像，包括了物體的正面、側(cè)面、上面、下面和背面等360度視角圖片。

這可以幫助InstantMesh捕捉到圖片的全方位信息，為后續(xù)的3D網(wǎng)格預(yù)測(cè)打下堅(jiān)實(shí)的基礎(chǔ)。

騰訊、上?？拼箝_(kāi)源InstantMesh，圖片直接生成3D模型-AI.x社區(qū)

簡(jiǎn)單來(lái)說(shuō)，整個(gè)過(guò)程就像玩拼圖游戲一樣，例如，需要從一張完整的圖片中找到所有可能的視角，然后將它們拼湊起來(lái)，形成一個(gè)完整的立體圖像。

所以，也可以把多視圖擴(kuò)散模型理解成InstantMesh的“眼睛”，幫助它深度剖析每一張上傳的圖片。

稀疏視圖重建模型

?

稀疏視圖重建模型則主要負(fù)責(zé)將，多視圖擴(kuò)散模型生成的視圖拼裝成3D模型。首先通過(guò)其內(nèi)部的神經(jīng)網(wǎng)絡(luò)架構(gòu)，提取輸入圖像的特征，并將其與先前的知識(shí)結(jié)合起來(lái)，以便更好地理解物體的結(jié)構(gòu)和外觀。

騰訊、上?？拼箝_(kāi)源InstantMesh，圖片直接生成3D模型-AI.x社區(qū)

利用提取到的特征和輔助知識(shí)，稀疏視圖重建模型能預(yù)測(cè)出一個(gè)初步的3D網(wǎng)格模型，包含了物體的基本形狀和結(jié)構(gòu)，但是在質(zhì)量和細(xì)節(jié)方面還差很多。

所以，研究人員使用了可微分的等值面提取模塊對(duì)網(wǎng)格表面進(jìn)行幾何監(jiān)督，大幅度優(yōu)化3D模型的細(xì)節(jié)和平滑度。

騰訊、上海科大開(kāi)源InstantMesh，圖片直接生成3D模型-AI.x社區(qū)

此外，這種直接在網(wǎng)格表面進(jìn)行監(jiān)督訓(xùn)練的優(yōu)化方法，避免了體素渲染的高計(jì)算消耗,同時(shí)能利用全分辨率的RGB圖像、深度圖和法線圖作為訓(xùn)練監(jiān)督,也使得生成的3D模型更加適合于后續(xù)的渲染、編輯和分析等應(yīng)用。

本文轉(zhuǎn)自 AIGC開(kāi)放社區(qū) ，作者：AIGC開(kāi)放社區(qū)

原文鏈接:??https://mp.weixin.qq.com/s/PtKWx6mWvWDH95ifa946dw??

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

文本直接生成2分鐘視頻，即將開(kāi)源模型StreamingT2V

Aceryt ? 4130瀏覽 ? 0回復(fù)
文本直接生成多視角3D圖像，Meta推出創(chuàng)新模型

Aceryt ? 2217瀏覽 ? 0回復(fù)
TELA: 最先進(jìn)文本描述生成3D穿衣人體方案！支持虛擬試衣，上海AI Lab&網(wǎng)易等聯(lián)合發(fā)布

angel ? 5059瀏覽 ? 0回復(fù)
無(wú)需3D數(shù)據(jù)也能訓(xùn)練，港科&港中文聯(lián)手華為推出3D自動(dòng)駕駛場(chǎng)景生成模型

Crystalcxt ? 2709瀏覽 ? 0回復(fù)
5秒完成3D生成，真香合成數(shù)據(jù)集已開(kāi)源，上交港中文新框架超越Instant3D

Crystalcxt ? 2506瀏覽 ? 0回復(fù)
上科大、影眸聯(lián)合提出DressCode：從文本生成3D服裝板片

輕薄滴假象 ? 3219瀏覽 ? 0回復(fù)
DreamTech聯(lián)合南大和牛津發(fā)布最強(qiáng)3D內(nèi)容生成大模型——Direct3D

angel ? 2820瀏覽 ? 0回復(fù)
僅需1分鐘，文本生成高質(zhì)量3D模型—Meta 3D-Gen

Aceryt ? 2921瀏覽 ? 0回復(fù)
3D版"裁縫"開(kāi)源來(lái)襲！Tailor3D:自定義3D編輯和資產(chǎn)生成（港大&上海AI-Lab&港中文）

angel ? 2371瀏覽 ? 0回復(fù)
Stability.ai開(kāi)源3D模型，僅需0.5秒就能快速生成

Aceryt ? 2925瀏覽 ? 0回復(fù)
隨意畫個(gè)草圖就能生成3D交互游戲場(chǎng)景！騰訊XR出品

angel ? 3271瀏覽 ? 0回復(fù)
3D人體重建新SOTA！清華&騰訊等重磅發(fā)布MagicMan：?jiǎn)我粓D像生成高質(zhì)量人體新突破

angel ? 2919瀏覽 ? 0回復(fù)
精準(zhǔn)可控新視角視頻生成+場(chǎng)景級(jí)3D生成！北大&港中文&騰訊等開(kāi)源ViewCrafter

angel ? 2440瀏覽 ? 0回復(fù)
麻省理工創(chuàng)新模型：用2D視頻擴(kuò)散，生成 3D 視頻

Aceryt ? 2652瀏覽 ? 0回復(fù)
3D生成基礎(chǔ)模型來(lái)了！只需5秒，高質(zhì)量3D資產(chǎn)規(guī)?；?em>生成！南洋理工等重磅開(kāi)源3DTopia-XL

angel ? 2285瀏覽 ? 0回復(fù)
生成任意3D和4D場(chǎng)景！GenXD：通用3D-4D聯(lián)合生成框架 | 新加坡國(guó)立&微軟

angel ? 1986瀏覽 ? 0回復(fù)
只需一張圖片！實(shí)現(xiàn)任意3D/4D場(chǎng)景生成！港科大&清華&生數(shù)發(fā)布DimensionX

angel ? 3911瀏覽 ? 0回復(fù)
革新3D材質(zhì)生成！Material Anything：端到端打造任意3D物體的高質(zhì)量材質(zhì)！

angel ? 2435瀏覽 ? 0回復(fù)
首篇2D/視頻/3D/4D統(tǒng)一生成框架全景綜述(港科大&中山等)

angel ? 1503瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

剛剛，OpenAI發(fā)布GPT-image-1模型，更強(qiáng)吉卜力版本來(lái)啦 6天前發(fā)布
字節(jié)跳動(dòng)開(kāi)源多模態(tài)AI Agent—UI-TARS-1.5 7天前發(fā)布

熱門推薦

微軟開(kāi)源DeepSeek-R1魔改版：響應(yīng)99%敏感提示，風(fēng)險(xiǎn)降50% 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開(kāi)發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開(kāi)源爬蟲神器 0回復(fù)

上一篇：麻省理工分享ChatGPT，在教育的5個(gè)實(shí)際應(yīng)用案例

下一篇：谷歌提出大規(guī)模ICL方法——強(qiáng)化和無(wú)監(jiān)督

社區(qū)精華內(nèi)容

目錄

<sup id="7tu9q"><rt id="7tu9q"></rt></sup>

<cite id="7tu9q"></cite>