老黃預(yù)言成真!Roblox官宣AI秒生3D物體模型,引爆10億玩家游戲新世界
老黃曾預(yù)言,未來(lái)5-8年,每個(gè)像素都將是生成的,并非渲染的。
沒錯(cuò),我們離AI視頻游戲?qū)崟r(shí)生成的未來(lái),近在咫尺。
幾周前,谷歌曾發(fā)布了首個(gè)神經(jīng)引擎驅(qū)動(dòng)的AI——GameNGen,能以每秒20幀的速度,預(yù)測(cè)下一幀。
當(dāng)時(shí)就有網(wǎng)友驚嘆道,用不了幾年,我們就會(huì)擁有AI實(shí)時(shí)生成3A游戲的大作。
恰在一年一度的開發(fā)者大會(huì)上,世界最大在線游戲開發(fā)平臺(tái)Roblox,宣布計(jì)劃推出一款3D基礎(chǔ)模型。
創(chuàng)建者僅需文本提示,就可以完成游戲3D場(chǎng)景的制作。
從文本、圖像、聲音生成,到視頻、3D資產(chǎn)、場(chǎng)景生成,AI正在重塑游戲的創(chuàng)作方式。
目前,Roblox擁有7950萬(wàn)總用戶、超過100萬(wàn)日活用戶,未來(lái)目標(biāo)要實(shí)現(xiàn)「覆蓋10億用戶」。
也就是說(shuō),未來(lái)10億玩家都將用上AI游戲,千億美金游戲產(chǎn)業(yè)或被顛覆。
AI游戲生成未來(lái),竟是這樣的
開發(fā)者大會(huì)上,CEO David Baszucki表示,AI已經(jīng)成為了Roblox的一部分。
代碼助手、紋理和材質(zhì)生成器、用戶頭像設(shè)置等多個(gè)功能都已經(jīng)集成了GenAI。
3個(gè)月前,他們?cè)诠緝?nèi)部組織了一個(gè)40人團(tuán)隊(duì),計(jì)劃打造一個(gè)多模態(tài)3D基礎(chǔ)模型,目的是「通過文本、視頻和3D提示推動(dòng)3D生成?!?/span>
更讓人振奮的是,Roblox計(jì)劃開源這個(gè)模型。副總裁Anuam Singh表示,任何人,包括競(jìng)爭(zhēng)對(duì)手,都可以使用這個(gè)模型。
GenAI工具的介入將為游戲開發(fā)人員賦予更大程度上的創(chuàng)作自由。
無(wú)論他們喜歡什么風(fēng)格——逼真、動(dòng)漫、蒸汽朋克,AI模型都可以幫助生成匹配的對(duì)象和場(chǎng)景。
開發(fā)人員甚至可以讓人工智能創(chuàng)建一個(gè)完整的世界,并向人工智能提供反饋,根據(jù)自己的喜好來(lái)調(diào)整生成結(jié)果。
這個(gè)新工具將成為Roblox推動(dòng)AI集成到所有流程的其中一環(huán)。他們現(xiàn)在擁有的AI模型,數(shù)量已經(jīng)達(dá)到了250個(gè)。
除了AI,Roblox的很多更新似乎也和「元宇宙」有密切聯(lián)系。
還記得小扎之前的「元宇宙」夢(mèng)想嗎?他希望每個(gè)用戶在其中都有一個(gè)自己的「數(shù)字化身」。
但Roblox已經(jīng)走得更遠(yuǎn)、更加接近。
平臺(tái)上的3D頭像已然成為了用戶身份的象征,2022年,超過1000萬(wàn)的日活用戶會(huì)每天更新頭像。
然而即使是經(jīng)驗(yàn)豐富的創(chuàng)作者,也需要幾天甚至一周的時(shí)間來(lái)創(chuàng)建新頭像。
通過即將啟用的GenAI模型,這個(gè)過程將會(huì)更加容易。
不需要繁瑣的建模、渲染等操作,可以通過圖像和文本提示,在短短幾分鐘內(nèi),無(wú)縫創(chuàng)建或修改3D頭像。
不久的將來(lái),在機(jī)器學(xué)習(xí)的加持下,3D化身還會(huì)更加逼真、更加栩栩如生。
從面部表情,擴(kuò)展到手勢(shì)和上半身動(dòng)作,甚至眨眼頻率也會(huì)和用戶相同。
甚至,不僅是3D化身,Roblox暢想的用戶交流方式也很「元宇宙」
去年推出的Roblox Connect中,語(yǔ)音通話的兩名用戶就已經(jīng)能將「數(shù)字化身」上傳到一個(gè)虛擬的共享空間。
你的「數(shù)字化身」甚至能傳達(dá)細(xì)微的面部表情和肢體語(yǔ)言。
這背后的技術(shù)和好萊塢動(dòng)畫電影的動(dòng)作捕捉技術(shù)類似,但Roblox將其壓縮、打包成了能在手機(jī)或筆記本上運(yùn)行的程序,而且不需要運(yùn)動(dòng)跟蹤點(diǎn)等額外設(shè)備,攝像頭即可進(jìn)行捕捉和實(shí)時(shí)轉(zhuǎn)換。
預(yù)測(cè)下一個(gè)3D塊
據(jù)介紹,這個(gè)3D新模型的工作原理是,對(duì)數(shù)百萬(wàn)游戲世界中的3D物體,進(jìn)行「分詞」(tokenizing)。
Roblox將3D塊視為獨(dú)立的單位,并根據(jù)它們?cè)诃h(huán)境中出現(xiàn)的可能性,賦予數(shù)值。
這類似于LLM處理詞、句段的方式,比如,GPT-4會(huì)根據(jù)上下文預(yù)測(cè)下一個(gè)輸出的token。
那么,Roblox AI系統(tǒng)同樣以相似的方式處理3D塊,通過最有可能出現(xiàn)的下一個(gè)塊來(lái)創(chuàng)建環(huán)境。
不過,想要實(shí)現(xiàn)這件事,一直很困難。
首先,3D環(huán)境的數(shù)據(jù)遠(yuǎn)少于文本數(shù)據(jù)。
為了訓(xùn)練模型,Roblox不得不依賴創(chuàng)作者生成的用戶數(shù)據(jù),以及外部數(shù)據(jù)集。
Roblox副總裁Anupam Singh表示,「找到高質(zhì)量的3D信息是困難的」。
而且,預(yù)測(cè)3D環(huán)境中的下一個(gè)方塊比預(yù)測(cè)文本中的下一個(gè)單詞更復(fù)雜,因?yàn)樗婕叭齻€(gè)空間維度(X、Y、Z),而不僅僅是線性序列。
其次,盡管AI可以生成基本的3D環(huán)境,但人類設(shè)計(jì)師的創(chuàng)造力、以及對(duì)玩家需求的理解,仍然是不可或缺的。
肯特州立大學(xué)動(dòng)畫游戲設(shè)計(jì)項(xiàng)目的副教授Chris Totten表示,Roblox游戲設(shè)計(jì)師仍然需要參與為平臺(tái)數(shù)百萬(wàn)玩家打造有趣的游戲環(huán)境。
有時(shí)候,AI生成的關(guān)卡可能缺乏創(chuàng)意和深度,更加需要人為的引導(dǎo),就像學(xué)生們用ChatGPT寫課程論文。
最后,這項(xiàng)技術(shù)還使用了,2D模型評(píng)估3D模型的過程。
基本上,當(dāng)一個(gè)AI在創(chuàng)建3D環(huán)境時(shí),2D模型會(huì)將新環(huán)境轉(zhuǎn)換為2D,并評(píng)估圖像是否在邏輯上一致。
如果圖像生成不合理,比如說(shuō)出現(xiàn)一只有12只腳的貓?jiān)陂_賽車,AI就會(huì)一次又一次地生成新的3D塊,直到2D模型「批準(zhǔn)」為止。
據(jù)介紹,還要計(jì)劃將3D基礎(chǔ)模型開源,以便開發(fā)者們對(duì)其進(jìn)行修改,對(duì)此再次創(chuàng)新。
另外,會(huì)上還預(yù)告了,正在開發(fā)的文本到形狀、紋理的模型,以及語(yǔ)音翻譯。
多年布局
在AI游戲生成上的布局,Roblox早就開始了。
而且,還在2021年元宇宙爆火時(shí)期,Roblox曾向玩家們展示了,AI在虛擬世界中的樣子。
23年2月,Roblox曾對(duì)外透露,正在內(nèi)部開發(fā)測(cè)試AI工具,幫助游戲開發(fā)者們輕松地創(chuàng)建3D資產(chǎn)。
一個(gè)是用文本提示生成AI資產(chǎn)工具,另一個(gè)是用AI完成代碼工具。
比如,為汽車換不同的車衣。
或者,AI生成代碼讓車燈亮起、關(guān)閉。
又或是,讓虛擬場(chǎng)景中下雨,汽車漂移等等,通過簡(jiǎn)單的語(yǔ)言指令,AI即可幫你生成代碼。
直到9月,Roblox還官宣了一款A(yù)I聊天機(jī)器人工具——Roblox Assistant,向2億玩家全面推出。
顧名思義,聊天的同時(shí),就可以讓玩家創(chuàng)作出虛擬的世界。
比如,你想要一堆篝火,周圍環(huán)繞樹木,任何場(chǎng)景一句話就實(shí)現(xiàn)了。
想要一只熊、一只多樣紋理、顏色、科幻的熊,任憑想象。
有網(wǎng)友表示,43%的Roblox的用戶年齡低于13歲,也就是說(shuō),下一代的創(chuàng)作者們將在很小的年紀(jì)就學(xué)會(huì)與AI對(duì)談。
我們正在邁向一個(gè)新時(shí)代。
Roblox CEO:小扎同路人
在最新的發(fā)布會(huì)上,Roblox CEO開始時(shí)就提出了一個(gè)自己都承認(rèn)「有些大膽」的目標(biāo):
在未來(lái)幾年內(nèi),將Roblox在全球游戲市場(chǎng)的內(nèi)容收入份額提高到10%,最終達(dá)到覆蓋10億用戶。
相比之下,目前這家公司大概占到全球游戲市場(chǎng)的2%,總用戶數(shù)量為7950萬(wàn)。
即便和目標(biāo)比起來(lái),Roblox還有很長(zhǎng)的路要走,但他們目前的成就已經(jīng)非常驚人。
除了25種游戲體驗(yàn)、100萬(wàn)日活用戶,其月度用戶數(shù)量甚至可能超過整個(gè)AAA游戲生態(tài)系統(tǒng)的總和。
在The Verge最新的一篇采訪中,CEO David Baszucki談到了這個(gè)增長(zhǎng)計(jì)劃,以及公司在AI方面的努力。
在Baszucki看來(lái),Roblox不僅僅是一個(gè)游戲平臺(tái),還肩負(fù)著社交功用,這一點(diǎn)可以從他們對(duì)3D頭像與用戶交互方式的革新中看出蛛絲馬跡。
之所以定下10億用戶的目標(biāo),不僅是因?yàn)榭吹搅?×以上增長(zhǎng)的道路,而且還有更多的社交意義、更多的娛樂消費(fèi)和實(shí)際的用途,單純的游戲用戶可能還不到這10億人的80%。
他透露,公司內(nèi)部正在構(gòu)建一個(gè)關(guān)于3億日活用戶的內(nèi)容主題,打造相應(yīng)規(guī)模的社交體驗(yàn)。
至于為什么要開發(fā)一個(gè)開源的3D多模態(tài)AI模型,而且開放模型在平臺(tái)外的使用?Baszucki的想法和小扎類似,都是以「開源」帶動(dòng)行業(yè)的發(fā)展 。
3D創(chuàng)作涵蓋了很多東西,比如網(wǎng)格、紋理,但要讓視頻游戲真正做到「沉浸式體驗(yàn)」,讓人身臨其境,3D創(chuàng)作卻并不是必需的。
通過開源和社區(qū)內(nèi)的合作,除了Roblox平臺(tái)上已有的訓(xùn)練數(shù)據(jù),他們還將共同開發(fā),甚至能發(fā)展出將3D信息轉(zhuǎn)換為功能性4D信息的能力。
因此,開源還將使3D創(chuàng)作變得更加廣泛。
未來(lái)的前景是,可以在你能想象到的任何游戲中提供3D體驗(yàn),成為一種動(dòng)態(tài)功能,而不僅僅局限于工作室中的開發(fā)者工具。
比如,時(shí)尚領(lǐng)域的游戲可以讓用戶用文本prompt設(shè)計(jì)、制作自己的服裝;或者用生成模型創(chuàng)建一個(gè)模擬的喬治·華盛頓。
最終,Roblox上的許多游戲體驗(yàn)都將在AI云上運(yùn)行。
可以注意到,Roblox上的很多資產(chǎn)都是優(yōu)質(zhì)數(shù)據(jù),包含材料屬性、嵌入的代碼,以及可以直接放到游戲中的物理屬性。
將核心的實(shí)用程序——3D創(chuàng)建開源后,這些資產(chǎn)可以很快被放到游戲中,更能讓Roblox成為模擬現(xiàn)實(shí)世界的平臺(tái)。
不僅是業(yè)務(wù)前景,Baszucki表示,在公司內(nèi)部的工作中,他也看到了使用AI的優(yōu)勢(shì)和潛力。
「AI正在變得越來(lái)越好,越來(lái)越多地成為人們的補(bǔ)充,它允許我們的很多員工執(zhí)行更高級(jí)別的職能,或者更深入研究例外情況等等?!?/span>