自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

30秒生成建模師級(jí)Mesh！最大可生成面數(shù)提升至1600，GitHub攬星1.9k項(xiàng)目發(fā)布V2版本

發(fā)布于 2024-8-12 08:27

瀏覽

0收藏

只需30秒，AI就能像3D建模師一樣，在各種指示下生成高質(zhì)量人造Mesh。

NeRF、3D Gaussian Splatting生成的三維重建圖像Mesh效果如下：

30秒生成建模師級(jí)Mesh！最大可生成面數(shù)提升至1600，GitHub攬星1.9k項(xiàng)目發(fā)布V2版本-AI.x社區(qū)

點(diǎn)云造出精細(xì)Mesh：

30秒生成建模師級(jí)Mesh！最大可生成面數(shù)提升至1600，GitHub攬星1.9k項(xiàng)目發(fā)布V2版本-AI.x社區(qū)

Dense Mesh基礎(chǔ)上生成也可以：

30秒生成建模師級(jí)Mesh！最大可生成面數(shù)提升至1600，GitHub攬星1.9k項(xiàng)目發(fā)布V2版本-AI.x社區(qū)

一張圖，甚至文本描述就足夠了：

30秒生成建模師級(jí)Mesh！最大可生成面數(shù)提升至1600，GitHub攬星1.9k項(xiàng)目發(fā)布V2版本-AI.x社區(qū)

GitHub已攬星1.9k的MeshAnything項(xiàng)目上新了V2版本，由來自南洋理工大學(xué)、清華大學(xué)、帝國(guó)理工學(xué)院、西湖大學(xué)等研究人員完成。

30秒生成建模師級(jí)Mesh！最大可生成面數(shù)提升至1600，GitHub攬星1.9k項(xiàng)目發(fā)布V2版本-AI.x社區(qū)

MeshAnything V2相比V1，使用了最新提出的Adjacent Mesh Tokenization（AMT）算法，將最大可生成面數(shù)從800提升到了1600。

相比之前的Mesh tokenization方法，AMT平均只需要一半長(zhǎng)度的token sequence即可表達(dá)同一個(gè)Mesh。

這項(xiàng)研究一經(jīng)發(fā)布也迅速得到不少網(wǎng)友關(guān)注。

30秒生成建模師級(jí)Mesh！最大可生成面數(shù)提升至1600，GitHub攬星1.9k項(xiàng)目發(fā)布V2版本-AI.x社區(qū)

那么，MeshAnything究竟是一種怎樣的方法？MeshAnything V2做了哪些改進(jìn)？

高度可控的人造Mesh生成

值得注意的是，雖然AI很早就能夠生成Mesh了，但這與上面所展示的生成人造Mesh有著巨大區(qū)別。

團(tuán)隊(duì)表示，所有之前方法，例如Marching Cubes和Get3D，生成的Mesh都是面片非常稠密的Mesh，面片數(shù)往往是人造Mesh的數(shù)百倍，幾乎不可能應(yīng)用于游戲，電影等實(shí)際3D工業(yè)。

并且由于它們的面片結(jié)構(gòu)不符合人類直覺，3D建模師很難再對(duì)其進(jìn)行細(xì)致的加工。

如下圖所示，這一問題沒法簡(jiǎn)單地依靠remesh來解決，在不影響效果的前提下，remesh方法雖然僅僅能夠小幅度地減少面片：

30秒生成建模師級(jí)Mesh！最大可生成面數(shù)提升至1600，GitHub攬星1.9k項(xiàng)目發(fā)布V2版本-AI.x社區(qū)

而上述問題直接影響了3D研究應(yīng)用于工業(yè)界。

3D工業(yè)界的pipeline幾乎全以人造Mesh作為3D表征，即使3D研究領(lǐng)域能產(chǎn)出精度極高的NeRF或者3D Gaussian，但沒法將它們轉(zhuǎn)化為工業(yè)界能應(yīng)用的Mesh的話，應(yīng)用將十分受限。

因此，之前?研究團(tuán)隊(duì)提出了MeshAnything，旨在實(shí)現(xiàn)高度可控的人造Mesh生成。

30秒生成建模師級(jí)Mesh！最大可生成面數(shù)提升至1600，GitHub攬星1.9k項(xiàng)目發(fā)布V2版本-AI.x社區(qū)

MeshAnything是一個(gè)自回歸的transformer，其將Mesh的每個(gè)面片視作token，整個(gè)Mesh被視作token序列，接著像大語(yǔ)言模型一樣，一個(gè)token一個(gè)token地生成，最終生成出整個(gè)Mesh。

MeshAnything運(yùn)用精妙的condition設(shè)計(jì)，其將點(diǎn)云作為condition來實(shí)現(xiàn)高度可控的人造Mesh生成：

30秒生成建模師級(jí)Mesh！最大可生成面數(shù)提升至1600，GitHub攬星1.9k項(xiàng)目發(fā)布V2版本-AI.x社區(qū)

MeshAnything以點(diǎn)云為condition的設(shè)計(jì)讓其可以與諸多3D掃描，3D重建，3D生成的方法結(jié)合。

這些種類繁多的方法最終得到的3D表示雖然多樣，但總能從中采樣到點(diǎn)云，從而輸入到MeshAnything中轉(zhuǎn)為人造Mesh，幫助這些能輸出3D模型的工作運(yùn)用到實(shí)際3D工業(yè)中。

另外，這種設(shè)計(jì)還大大降低了MeshAnything的訓(xùn)練難度，提高了效果。因?yàn)辄c(diǎn)云提供了精細(xì)的3D形狀信息，MeshAnything不需要去學(xué)習(xí)復(fù)雜的3D形狀分布，只需要學(xué)習(xí)如何搭建出符合給定點(diǎn)云的人造Mesh。

MeshAnything V2有何提升？

MeshAnything V2在V1版本的基礎(chǔ)上大幅度提高了性能，并將最大可生成面數(shù)800提升到了1600。

其主要提升來源于其新提出的Adjacent Mesh Tokenization（AMT）算法。

相比之前的Mesh tokenization方法，AMT平均只需要一半長(zhǎng)度的token sequence即可表達(dá)同一個(gè)Mesh。

由于transformer的計(jì)算是n^2復(fù)雜度，一半長(zhǎng)度的token sequence意味著降低了4倍的attention計(jì)算量。并且AMT得到的token sequence更加緊湊，結(jié)構(gòu)更好，更有利于transformer的學(xué)習(xí)。

AMT是通過盡可能地僅僅用一個(gè)vertex來表達(dá)一個(gè)一個(gè)面片來實(shí)現(xiàn)上述進(jìn)步的：

30秒生成建模師級(jí)Mesh！最大可生成面數(shù)提升至1600，GitHub攬星1.9k項(xiàng)目發(fā)布V2版本-AI.x社區(qū)

上圖清晰地表達(dá)出了AMT的運(yùn)作過程，其通過優(yōu)先表達(dá)相鄰的面片來用1個(gè)vertex表達(dá)一個(gè)面片。當(dāng)不存在相鄰的沒表達(dá)過的面片，AMT添加一個(gè)特殊token “&”來標(biāo)識(shí)這一情況并重新開始。

在AMT的幫助下，V2在性能和效率上大幅超過之前的方法，實(shí)現(xiàn)了高質(zhì)量的人造Mesh生成。

在訓(xùn)練數(shù)據(jù)上，MeshAnything使用ShapeNet和Objaverse中的人造Mesh，將這些Mesh展開成token sequence之后使用cross-entropy loss監(jiān)督。

V1和V2都僅僅使用了350m的transformer架構(gòu)，100K的訓(xùn)練數(shù)據(jù)就得到了以上結(jié)果，表明該方向還有非常大scale up潛力。

更多結(jié)果如下：

30秒生成建模師級(jí)Mesh！最大可生成面數(shù)提升至1600，GitHub攬星1.9k項(xiàng)目發(fā)布V2版本-AI.x社區(qū)

V1項(xiàng)目主頁(yè):

???https://buaacyw.github.io/mesh-anything/???

V2項(xiàng)目主頁(yè):

https://buaacyw.github.io/meshanything-v2/

本文轉(zhuǎn)自量子位，作者：量子位

原文鏈接:??https://mp.weixin.qq.com/s/aXjfYdcu9hNsH1ulj7w-Bw??

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

文本直接生成2分鐘視頻，即將開源模型StreamingT2V

Aceryt ? 4128瀏覽 ? 0回復(fù)
1000行C語(yǔ)言搓出GPT-2！AI大神Karpathy新項(xiàng)目剛上線就狂攬2.5k星

duhorse ? 2762瀏覽 ? 0回復(fù)
從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火，大神Kapathy一鍵三連，GitHub狂攬2k+

Crystalcxt ? 2239瀏覽 ? 0回復(fù)
視頻版PS！0樣本視頻編輯模型，普通人秒變鋼鐵俠

Aceryt ? 2145瀏覽 ? 0回復(fù)
口型不出戲，五官姿態(tài)也自然，復(fù)旦百度等出品｜GitHub攬星1k+

Crystalcxt ? 2342瀏覽 ? 0回復(fù)
DeepSeek Coder V2開源發(fā)布，首超GPT4-Turbo代碼能力

Aceryt ? 6761瀏覽 ? 0回復(fù)
生成式AI成最大贏家

angel ? 5993瀏覽 ? 0回復(fù)
快手可靈團(tuán)隊(duì)最新開源項(xiàng)目火了：大叔實(shí)時(shí)變身少女，GitHub狂攬7.5K星

Crystalcxt ? 2527瀏覽 ? 0回復(fù)
Midjourney V6.1再進(jìn)化！人像逼真細(xì)節(jié)拉滿，攝影級(jí)畫面秒生成

duhorse ? 2364瀏覽 ? 0回復(fù)
實(shí)現(xiàn)任意3D/4D場(chǎng)景生成！港科大&清華&生數(shù)發(fā)布DimensionX

angel ? 3905瀏覽 ? 0回復(fù)
Jina CLIP v2：為多模態(tài)RAG設(shè)計(jì)的向量模型

kede96 ? 2984瀏覽 ? 0回復(fù)
10.1k高星 GitHub 庫(kù)：告別JSON錯(cuò)誤：Outlines如何提升大模型的結(jié)構(gòu)化輸出

凝固的雨_1 ? 3641瀏覽 ? 0回復(fù)
DeepSeek AI發(fā)布DeepSeek-V2.5-1210：DeepSeek-V2.5的更新版本，模型性能顯著提升

Halo咯咯 ? 1.4w瀏覽 ? 0回復(fù)
綜述：DeepSeek Infra/V1/MoE/V2/V3/R1 & 開源關(guān)鍵技術(shù)

amei2000go ? 3842瀏覽 ? 0回復(fù)
微軟LongRoPE v2：幾乎無損的上下文擴(kuò)展！

NLP前沿1 ? 1486瀏覽 ? 0回復(fù)
0.72秒生成3D世界！建模提速15倍！極佳&北大等的WonderTurbo強(qiáng)勢(shì)登場(chǎng)，可實(shí)時(shí)交互！

angel ? 1351瀏覽 ? 0回復(fù)
谷歌推出Veo 2，生成8秒超逼真視頻

Aceryt ? 1122瀏覽 ? 0回復(fù)
Seedream 3.0技術(shù)細(xì)節(jié)重磅發(fā)布！中文圖文生成再進(jìn)化,2K高清+爆改文字渲染,遠(yuǎn)超Canva！

angel ? 2059瀏覽 ? 0回復(fù)
Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器

穿越時(shí)空111 ? 1101瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

何愷明開辟分形圖像生成新范式！計(jì)算效率提高4000倍，首次實(shí)現(xiàn)高分辨率逐像素生成 2025-02-26 11:59:41發(fā)布
達(dá)摩院開源VideoLLaMA3：僅7B大小，視頻理解拿下SOTA | 在線可玩 2025-02-14 13:02:21發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：快手可靈團(tuán)隊(duì)最新開源項(xiàng)目火了：大叔實(shí)時(shí)變身少女，GitHub狂攬7.5K星

下一篇：最強(qiáng)AI程序員砸飯碗：84秒跑通代碼，像人一樣思考！團(tuán)隊(duì)僅5人

社區(qū)精華內(nèi)容

目錄

<legend id="dbaul"></legend>