AI打造“魔法博物館”,五分鐘完成一件“3D展品”
注意看,這是一家“魔法博物館”,陳列的展品琳瑯滿目,甚至還有機(jī)甲套裝……
魔法鏡子、水晶法杖……也是一應(yīng)俱全,仿佛真的進(jìn)入了魔法世界。
沒錯(cuò),這個(gè)“博物館”里的“展品”全都是由AI打造的,而且一件只需要五分鐘。
來自南洋理工大學(xué)、上海AI實(shí)驗(yàn)室等機(jī)構(gòu)的研究人員,共同推出了新款文生3D基礎(chǔ)模型3DTopia。
只需要一組文本,它就可以在5分鐘內(nèi)生成出多樣化、高精度的3D模型。
除了“魔法博物館”里的展品之外,日常的物品3DTopia更是可以精準(zhǔn)合成。
比如老板心血來潮想要布置一下辦公室,它就能建立出桌椅擺件的樣子,甚至桌子上的咖啡也一起“準(zhǔn)備”好了。
就算天馬行空一些也沒關(guān)系,只要人能想到,它可以建立出一套月球的“沙盤”。
那么,該怎么用3DTopia來創(chuàng)建3D模型呢?
推理分兩階段進(jìn)行
3DTopia的推理過程是分為兩個(gè)階段進(jìn)行的,第一個(gè)階段會根據(jù)提示詞生成點(diǎn)云格式的粗糙模型。
比如當(dāng)我們讓它生成一個(gè)機(jī)器人模型時(shí),第一階段得到的模型是長這樣的:
第二階段就是用該團(tuán)隊(duì)推出的theeefiner對這個(gè)粗糙的點(diǎn)云進(jìn)行細(xì)化,并完成上色等操作。
經(jīng)過優(yōu)化theeefiner的之后,這個(gè)機(jī)器人模型終于變成了人類熟悉的樣子。
所以,實(shí)際操作過程也需要對這兩部分用到的工具分別進(jìn)行部署。
首先拉取3DTopia的文件,然后用conda創(chuàng)建虛擬環(huán)境并完成安裝,接著還要安裝另一份教程部署第二階段要用到的threefiner。
部署完成之后,還得到HuggingFace上下載一個(gè)checkpoint文件并放到指定目錄。
整個(gè)過程難度倒也不算大,但是對于小白來說操作起來可能也得費(fèi)一番功夫。
所以,如果這個(gè)部署過程看上去過于繁瑣,這里還有一份大神改編的Colab筆記。
利用這份筆記,只需要修改其中的提示詞和文件名,部署過程則是一鍵完成,不過實(shí)測需要選擇A100才能完美運(yùn)行。
這份筆記將第二階段拆分成了兩個(gè)子步驟,所以部署完之后一共需要運(yùn)行三段代碼,修改提示詞的方式如下圖。
其中stage1生成的文件名可以點(diǎn)擊左側(cè)的文件夾圖標(biāo),就可以在3DTopia - results目錄下找到,stage1目錄下同時(shí)還會生成初稿的預(yù)覽視頻。
最終的成品模型,則是默認(rèn)存在了stage2目錄中。
不過需要注意的是,目前筆記的第2-2步存在一處小錯(cuò)誤,運(yùn)行之前需要在threefiner前加上一個(gè)英文感嘆號,否則無法正常運(yùn)行。
GitHub:https://github.com/3DTopia/3DTopia
Colab筆記:https://colab.research.google.com/github/camenduru/3DTopia-jupyter/blob/main/3DTopia_jupyter.ipynb