出品 | 51CTO技術(shù)棧(微信號:blog51cto)
騰訊開源日第二天!在Hunyuan3D-2.0基礎(chǔ)上打造的5款模型終于全部現(xiàn)身!
昨天介紹了,多視圖版本模型Hunyuan3D-2-mv,以及輕量級 mini 模型Hunyuan3D-2-mini。
而今天宣布開源的模型則是Turbo系列模型。即Hunyuan3D-2 Turbo、Hunyuan3D-2-mv Turbo和Hunyuan3D-2-mini Turbo。(這樣看著有點(diǎn)繞,大家可以翻到第二張圖,原模型與Turbo版是上下是對應(yīng)關(guān)系,很清晰~)
?Turbo版的特點(diǎn)就一個字:快!非??欤∫?yàn)锳I建模涉及到渲染問題,跑起來還是需要耐心的,Turbo這波直接把時長從半分鐘干到了1秒鐘、甚至是0.5秒!
?當(dāng)然,這樣Hunyuan3D-2.0家族就有6款模型了,我們簡單說說官方給的“選型指南”:
Hunyuan3D-2:需要生成高質(zhì)量三維模型的用戶,參數(shù)量高達(dá)11B,適合GPU性能較好的設(shè)備
Hunyuan3D-2-mini:設(shè)備性能受限或需要快速反饋的用戶
Hunyuan3D-2-mv:需要多視圖控制或手繪多視圖的用戶,尤其適合原畫師、設(shè)計師等等
Turbo系列:需要快速生成模型的用戶,適合實(shí)時場景or快速迭代
??Turbo系列為啥能做到這么快?背后的殺器就是Flash VDM。今天官方花了很大篇幅去講背后的實(shí)現(xiàn)原理,我們簡單總結(jié)下,先看第3張圖,F(xiàn)lash VDM的核心技術(shù)點(diǎn)即DiT 加速和VAE 加速:
Flash VDM通過減少采樣數(shù)量和優(yōu)化采樣計算過程,將生成模型的迭代步數(shù)從50步減少到5步。
并大大降低了VAE解碼的時間占比——要知道VAE 解碼占據(jù)了整個建模75.88%的時間!
經(jīng)過這個黑科技的加持,Turbo最小顯存占用可降低到5GB以下,生成時間縮短到1秒以內(nèi),支持4050等顯卡,還可以在Mac的M芯片上部署。
最后,團(tuán)隊小哥也上了把價值,這么牛的技術(shù),之所以大方開源,就是為了推動生態(tài)的繁榮,讓中國AI技術(shù)更進(jìn)一步!
他們還引了一句詩“一枝獨(dú)秀不是春,百花齊放春滿園”。
?最后附上鏈接,大家玩起來吧:
官網(wǎng):https://3d.hunyuan.tencent.com/
Github:https://github.com/Tencent/Hunyuan3D-2