3D特效師可以下班了丨Science
本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
是否還記得前陣子爆火的SM娛樂公司電子屏海浪?

人工制作那樣的特效,可能需要花費(fèi)……嗯,畢竟被稱為「每滴水都是粉絲貢獻(xiàn)的錢」。
但現(xiàn)在,DeepMind和斯坦福等一眾科學(xué)家研究出了一款圖網(wǎng)絡(luò)模擬器——GNS框架,AI只需要“看著”場(chǎng)景中的流體,就能將它模擬出來(lái)。
無(wú)論是流體、剛性固體還是可變形材料,GNS都能模擬的惟妙惟肖。研究人員還稱:
GNS框架是迄今為止最精確的通用學(xué)習(xí)物理模擬器。
并且,這項(xiàng)研究最近還被頂刊 Science 收錄。

這也不禁讓人聯(lián)想起,清華姚班畢業(yè)生胡淵鳴開發(fā)的太極 (Taichi),不僅大幅降低了CG特效門檻,效果還是十分逼真。
而在 DeepMind 和斯坦福大學(xué)的這項(xiàng)工作中,胡淵鳴的太極,依然發(fā)揮了作用。
他們正是利用胡同學(xué)的太極,來(lái)生成2D和3D的挑戰(zhàn)場(chǎng)景,作為基線效果之一。
效果好到什么程度?Science在社交網(wǎng)絡(luò)評(píng)價(jià)說(shuō):

「好萊塢或許會(huì)投資這款模擬器吧」。
是你印象中的畫面了
我們?nèi)祟愅ㄟ^(guò)「經(jīng)驗(yàn)」,說(shuō)到一個(gè)場(chǎng)景時(shí),能很快腦補(bǔ)出那種動(dòng)態(tài)畫面。
那么AI「腦補(bǔ)」出來(lái)的畫面效果,是否和你想象的一樣呢?
首先,是水落入玻璃容器中的3D效果。

和我們想象中的物理效果一模一樣,有木有!
左側(cè)的基線方法叫做SPH (smoothed particle hydrodynamics),這是1992年提出的一種基于顆粒的模擬流體的方法。
而右側(cè),AI通過(guò)「看」而預(yù)測(cè)得到的結(jié)果,就是研究人員提出來(lái)的GNS方法。
來(lái)看下二者在慢動(dòng)作下的細(xì)節(jié)差異。

不難看出,GNS方法在細(xì)節(jié)處理上,例如濺起的水花,更加細(xì)粒度,也更逼近我們印象中的樣子。
當(dāng)然,GNS不僅能夠處理液體,還能夠模擬其他狀態(tài)的物體。
例如,顆粒狀的沙子。

還有粘性的物體。

上面兩個(gè)效果中的基線方法是MPM (material point method),1995年提出,適用于相互作用的可變形材料。
同樣,在顆粒散落在玻璃容器壁上的細(xì)節(jié)上,GNS的預(yù)測(cè)結(jié)果更加符合現(xiàn)實(shí)物理世界的效果。
那么,如此逼真的效果是如何做到的呢?
圖網(wǎng)絡(luò)模擬器模擬流體
傳統(tǒng)特效計(jì)算方法
此前,對(duì)于真實(shí)物體的模擬,需要通過(guò)大量計(jì)算來(lái)實(shí)現(xiàn),上文中提到的MPM就是其中的一種。
這種方法被稱為物質(zhì)點(diǎn)法(Material Point Method),將一塊材料離散成非常多的顆粒,并計(jì)算空間導(dǎo)數(shù)和求解動(dòng)量方程。
經(jīng)過(guò)胡淵鳴等人改進(jìn)的MLS-MPM,模擬物體的速度有了很大的提升,相比于原來(lái)的MPM快了兩倍左右。

除此之外,一種名為PBD的方法,可以計(jì)算模擬出一個(gè)方塊漂浮在水上的動(dòng)態(tài)效果;

而這兩種方法之外,還有一種被叫做SPH的~~古老~~經(jīng)典方法,用于計(jì)算生成水的3D特效。

相比于這些采用大量計(jì)算模擬出來(lái)的真實(shí)場(chǎng)景,如果用神經(jīng)網(wǎng)絡(luò)對(duì)它們進(jìn)行訓(xùn)練,是不是能模擬出物體在真實(shí)場(chǎng)景中受到撞擊的效果,而且和用這些方法生成的效果非常相似?
網(wǎng)友對(duì)這樣的想法感到驚奇,畢竟,人腦對(duì)于流體或是物體撞擊效果的模擬,并非通過(guò)大量力學(xué)計(jì)算得出,而是通過(guò)神經(jīng)網(wǎng)絡(luò)模擬的。
DeepMind在這樣的想法上,采用了GNS對(duì)生成的這些模型進(jìn)行訓(xùn)練,用于模擬物體在真實(shí)場(chǎng)景下的特效。
圖網(wǎng)絡(luò)預(yù)測(cè)物體特效
GNS模擬物體最根本的原理,是將一塊體積不變的物體模型X,分散成許多顆粒,并通過(guò)一個(gè)模擬器sθ,轉(zhuǎn)變成它受到撞擊后的形態(tài)。
從下圖可見,模擬器sθ的用處,是將這塊流體輸入到一個(gè)動(dòng)力學(xué)模型dθ中,并將產(chǎn)生的一幀幀結(jié)果用于更新物體變形的過(guò)程。

只要模擬器更新的時(shí)間夠快,我們看見的就是這塊物體在玻璃盒中受到撞擊、不斷變形的樣子。

△ 圖右為模擬器生成的效果
關(guān)鍵來(lái)了,動(dòng)力學(xué)模型dθ要怎么實(shí)現(xiàn)?
團(tuán)隊(duì)采用了“三步走”的方法,將模型分為編碼器、處理器和解碼器三部分。

一塊物體經(jīng)過(guò)編碼器后,編碼器會(huì)將物體中原本分散的各顆粒架構(gòu)起來(lái),組成一個(gè)“看不見的”圖。

而在處理器中,圖中各顆粒的關(guān)系會(huì)不斷發(fā)生變化,圖網(wǎng)絡(luò)學(xué)習(xí)得到的傳遞信息將會(huì)在圖上迭代M次。

最后,解碼器會(huì)將迭代好的動(dòng)力學(xué)信息Y,從最后一次迭代出的圖中提取出來(lái)。

反饋回物體X上后,物體中的顆粒便能一進(jìn)行一幀幀改變,連續(xù)起來(lái)就是模擬出的液體形態(tài)。

可以看見,無(wú)論是哪種物體形態(tài),GNS預(yù)測(cè)的效果都與真值非常相近。
創(chuàng)新點(diǎn)
與之前一些模擬液體的神經(jīng)網(wǎng)絡(luò)相比,GNS最大的改進(jìn)在于,它將不同的物體類型,轉(zhuǎn)變成了輸入向量的一個(gè)特征。
只需要將不同的物體類型(例如沙子、水、膠質(zhì)物等)用不同特征區(qū)分,就能表現(xiàn)出它們的狀態(tài)。
相比之下,此前一個(gè)名為DLP的、基于神經(jīng)網(wǎng)絡(luò)的液體模擬器,與GNS相比就過(guò)于復(fù)雜。
同樣是模擬各種流體模型,DLP則需要不斷地保存顆粒之間的相對(duì)位移,甚至需要修改模型來(lái)滿足不同的流體類型——所需要的運(yùn)算量過(guò)于龐大。
不僅如此,GNS的模擬效果竟然還比基于DLP的模擬器更好。
細(xì)節(jié)更出眾
下面是GNS與一款基于DLP原理的增強(qiáng)版CConv模擬器的效果對(duì)比。
與CConv相比,GNS在不同物體類型的模擬表現(xiàn)上依舊非常優(yōu)秀,下圖是二者共同模擬一個(gè)漂浮在水上的方塊時(shí),所生成的效果。

可以看見,GNS生成的方塊和真值一樣,在水中漂浮自如;相比之下,CConv生成的方塊直接在水的沖擊下變了形(被生活擊垮)。
如果采用與真實(shí)值相比的均方誤差(MSE)進(jìn)行對(duì)比的話,在各種物體形態(tài)下,GNS都要比CConv效果更佳。

除此之外,下圖展示了GNS分別采用強(qiáng)化學(xué)習(xí)中Rollout和One-step兩種算法策略的均方誤差效果。(以及迭代次數(shù)、是否共享GN參數(shù)、連接半徑、訓(xùn)練噪聲量、關(guān)聯(lián)/獨(dú)立編碼器等)
可見,采取Rollout的效果(下半部分)在各方面都要比采取One-step的效果好得多。

不僅如此,紅色部分是GNS模型最終采用的策略,可見,所有策略都將均方誤差降到了最低。
四位共同一作
這項(xiàng)研究主要由DeepMind和斯坦福大學(xué)合作。
論文的共同一作共四位。
△ Alvaro Sanchez-Gonzalez
Alvaro Sanchez-Gonzalez 本科和碩士攻讀的專業(yè)分別是物理和計(jì)算機(jī),基于這樣的背景,在博士期間,他主要專注于使用計(jì)算機(jī)方法來(lái)解決物理研究中的一些挑戰(zhàn)。
2017年加入谷歌DeepMind團(tuán)隊(duì),研究主要集中在結(jié)構(gòu)化方法、強(qiáng)化學(xué)習(xí)等。
△ Jonathan Godwin
Jonathan Godwin在2018年3月加入DeepMind,并于2019年11月晉升為高級(jí)研究工程師。
此前,他也有過(guò)自己創(chuàng)業(yè)的經(jīng)歷,分別是信息科技服務(wù)公司Bit by Bit Computer Consulting和金融公司Community Capital的CEO。
在創(chuàng)業(yè)后和加入DeepMind之前,他還在計(jì)算機(jī)軟件公司Bloomsbury AI做了一年多的機(jī)器學(xué)習(xí)工程師。
△Tobias Pfaff
Tobias Pfaff 是DeepMind的一名研究科學(xué)家,從事物理模擬和機(jī)器學(xué)習(xí)的交叉研究。
分別在蘇黎世聯(lián)邦理工學(xué)院和加州伯克利分校,完成博士和博士后的學(xué)習(xí)任務(wù)。
△Rex Ying
第四位共同一作是Rex Ying,目前在斯坦福大學(xué)攻讀博士學(xué)位,研究主要集中在開發(fā)應(yīng)用于圖形結(jié)構(gòu)數(shù)據(jù)的機(jī)器學(xué)習(xí)算法。
2016年以最高榮譽(yù)畢業(yè)于杜克大學(xué),主修計(jì)算機(jī)科學(xué)和數(shù)學(xué)兩個(gè)專業(yè)。
……
最后,對(duì)于AI通過(guò)「看」來(lái)模擬如此復(fù)雜的流體運(yùn)動(dòng),網(wǎng)友認(rèn)為:
腦能模擬各種復(fù)雜運(yùn)動(dòng),靠的就是神經(jīng)網(wǎng)絡(luò),而不是復(fù)雜的力學(xué)公式。

不僅如此,這項(xiàng)技術(shù)或許還大幅降低影視、游戲行業(yè)特效成本。
那么,這樣的技術(shù),你看好嗎?