自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<strong id="ahjdc"><ruby id="ahjdc"><span id="ahjdc"></span></ruby></strong>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

Stability.ai開源3D模型，僅需0.5秒就能快速生成

發(fā)布于 2024-8-5 10:07

瀏覽

0收藏

著名開源大模型平臺Stability.ai開源了3D生成模型——Stable Fast 3D（以下簡稱“SF3D”）。

用戶通過圖片僅需0.5秒就能快速生成高質(zhì)量3D模型，還包括UV展開網(wǎng)格、材質(zhì)參數(shù)、具有減少照明烘焙的反照率顏色，以及可選的四邊形或三角形重網(wǎng)格等，這也是目前最快的3D生成模型。

開源地址：https://github.com/Stability-AI/stable-fast-3d

huggingface：https://huggingface.co/stabilityai/stable-fast-3d

Stability.ai開源3D模型，僅需0.5秒就能快速生成-AI.x社區(qū)

在傳統(tǒng)的3D重建模型中，變換器通常輸出較低分辨率的Triplane表示，這會導(dǎo)致在高頻和高對比度紋理場景中出現(xiàn)明顯的混疊偽影，在實際應(yīng)用中效果較差需要頻繁的手動處理才能使用。

而SF3D是基于TripoSR架構(gòu)，通過引入多個新模塊來改進輸出質(zhì)量。增強的Transformer網(wǎng)絡(luò)預(yù)測更高分辨率的三平面，有助于減少混疊偽影。該網(wǎng)絡(luò)從DINO切換到改進的DINOv2以獲取圖像標記，低分辨率（64×64）的三平面會引入明顯偽影，而通過提高分辨率可以緩解這一問題。

Stability.ai開源3D模型，僅需0.5秒就能快速生成-AI.x社區(qū)

還受PointInfinity的啟發(fā)，增強的Transformer網(wǎng)絡(luò)輸出更高分辨率的三平面，例如，通過避免在更高分辨率三平面標記上的自注意力，使復(fù)雜度與輸入大小呈線性關(guān)系，從而產(chǎn)生96×96分辨率、1024通道的三平面，進一步通過打亂輸出特征的維度。

為了增強反射對象的輸出網(wǎng)格外觀，在渲染時生成更好的模型材質(zhì)，SF3D通過 “Material Net”的網(wǎng)絡(luò)來實現(xiàn)這一點，該網(wǎng)絡(luò)從輸入圖像中預(yù)測整個物體的單一金屬和粗糙度值。

為了穩(wěn)定訓(xùn)練并防止直接回歸時的網(wǎng)絡(luò)崩潰，SF3D采用了一種概率預(yù)測方法，預(yù)測Beta分布的參數(shù)，并通過最小化對數(shù)似然來訓(xùn)練網(wǎng)絡(luò)。

Stability.ai開源3D模型，僅需0.5秒就能快速生成-AI.x社區(qū)

SF3D還引入了“Light Net”的網(wǎng)絡(luò)來預(yù)測輸入圖像中的光照，從而解決因光照變化（如陰影）導(dǎo)致的問題。

Light Net通過使用從變換器得到的高分辨率Triplane來預(yù)測球形高斯照明圖。這種巧妙設(shè)計允許SF3D在渲染時考慮到3D空間關(guān)系和物體表面的照明變化，從而生成沒有混入光照效果的均勻物體。

SF3D使用了一種光照解耦損失函數(shù)，確保學(xué)習(xí)到的照明與訓(xùn)練數(shù)據(jù)中觀察到的照明條件一致，從而解決了外觀和陰影之間的歧義。

為了全面評估SF3D的性能，研究人員選擇了GSO和OmniObject3D作為主要的數(shù)據(jù)集。這些數(shù)據(jù)集包含了多種類型的3D對象，能夠充分測試SF3D在不同場景下的表現(xiàn)。為了確保測試的公正性和可比性，所有比較方法都在相同的硬件環(huán)境下運行。

Stability.ai開源3D模型，僅需0.5秒就能快速生成-AI.x社區(qū)

并將SF3D與OpenLRM、TripoSR、LGM、CRM、InstantMesh和ZeroShape知名3D模型進行了綜合對比。結(jié)果顯示，SF3D優(yōu)于當前主流3D模型，能夠重建準確的形狀產(chǎn)生更詳細的紋理，并且視覺質(zhì)量更高。

Stability.ai開源3D模型，僅需0.5秒就能快速生成-AI.x社區(qū)

本文轉(zhuǎn)自 AIGC開放社區(qū) ，作者：AIGC開放社區(qū)

原文鏈接:??https://mp.weixin.qq.com/s/bR2KI0k231ErvKS80JfKRA??

標簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

CVPR 2024 | 僅需文本或圖像提示，新框架CustomNeRF精準編輯3D場景

輕薄滴假象 ? 2000瀏覽 ? 0回復(fù)
僅需Llama3 1/17的訓(xùn)練成本，Snowflake開源128x3B MoE模型

輕薄滴假象 ? 2610瀏覽 ? 0回復(fù)
騰訊、上?？拼?em>開源InstantMesh，圖片直接生成3D模型

Aceryt ? 3940瀏覽 ? 0回復(fù)
無需3D數(shù)據(jù)也能訓(xùn)練，港科&港中文聯(lián)手華為推出3D自動駕駛場景生成模型

Crystalcxt ? 2705瀏覽 ? 0回復(fù)
Stability AI開源47秒音頻生成模型，蟲鳴鳥叫、搖滾、鼓點都能生成

輕薄滴假象 ? 2543瀏覽 ? 0回復(fù)
5秒完成3D生成，真香合成數(shù)據(jù)集已開源，上交港中文新框架超越Instant3D

Crystalcxt ? 2502瀏覽 ? 0回復(fù)
DreamTech聯(lián)合南大和牛津發(fā)布最強3D內(nèi)容生成大模型——Direct3D

angel ? 2819瀏覽 ? 0回復(fù)
僅需1分鐘，文本生成高質(zhì)量3D模型—Meta 3D-Gen

Aceryt ? 2917瀏覽 ? 0回復(fù)
快手開源圖生視頻模型LivePortrait，等待生成時間僅需10秒，棄擴散改用隱式關(guān)鍵點框架技術(shù)，網(wǎng)友：強得可怕

51CTO技術(shù)棧 ? 5512瀏覽 ? 0回復(fù)
3D版"裁縫"開源來襲！Tailor3D:自定義3D編輯和資產(chǎn)生成（港大&上海AI-Lab&港中文）

angel ? 2370瀏覽 ? 0回復(fù)
隨意畫個草圖就能生成3D交互游戲場景！騰訊XR出品

angel ? 3266瀏覽 ? 0回復(fù)
ECCV 2024 | 引入DiT的原生3D通用框架，適用任意神經(jīng)場、秒級生成

輕薄滴假象 ? 2232瀏覽 ? 0回復(fù)
港理工&OPPO&Stability AI聯(lián)合發(fā)布一致且高效的3D場景編輯方法——SyncNoise

angel ? 2096瀏覽 ? 0回復(fù)
ECCV`24 | 新加坡國立&華為提出Vista3D: 實現(xiàn)快速且多視角一致的3D生成

angel ? 1957瀏覽 ? 0回復(fù)
3D生成基礎(chǔ)模型來了！只需5秒，高質(zhì)量3D資產(chǎn)規(guī)?；?em>生成！南洋理工等重磅開源3DTopia-XL

angel ? 2284瀏覽 ? 0回復(fù)
港理工&OPPO&Stability AI聯(lián)合發(fā)布一致且高效的3D場景編輯方法——SyncNoise

angel ? 1957瀏覽 ? 0回復(fù)
生成任意3D和4D場景！GenXD：通用3D-4D聯(lián)合生成框架 | 新加坡國立&微軟

angel ? 1983瀏覽 ? 0回復(fù)
Unsloth：僅需7GB顯存就能訓(xùn)練自己的DeepSeek-R1！

PyTorch研習(xí)社 ? 3092瀏覽 ? 0回復(fù)
清華、中南開源3D交互實體AI Agent LEGENT

Aceryt ? 1798瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

剛剛，OpenAI發(fā)布GPT-image-1模型，更強吉卜力版本來啦 6天前發(fā)布
字節(jié)跳動開源多模態(tài)AI Agent—UI-TARS-1.5 7天前發(fā)布

熱門推薦

微軟開源DeepSeek-R1魔改版：響應(yīng)99%敏感提示，風(fēng)險降50% 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇：谷歌開源Gemma Scope，更好解釋大模型工作原理

下一篇：斯坦福、Salesforce等開源1萬億tokens多模態(tài)數(shù)據(jù)集

社區(qū)精華內(nèi)容

目錄