Gen-3開(kāi)放內(nèi)測(cè),網(wǎng)友實(shí)測(cè)demo驚人!魔都時(shí)裝秀一絕,卻依舊不懂物理世界
眾人翹首以盼的Gen-3 Alpha,終于向部分超級(jí)創(chuàng)意合作者開(kāi)放了。
拿到內(nèi)測(cè)資格的網(wǎng)友,可是爽了一把。
比起上一代,Gen-3 Alpha在細(xì)節(jié)、一致性和運(yùn)動(dòng)表現(xiàn)方面,又有了史詩(shī)級(jí)改進(jìn)!
還有人表示,Gen-3讓我們看到了一個(gè)令人興奮的未來(lái)——用不了多久,我們就能看到完全由AI生成的電影了。
不過(guò),不可否認(rèn)的是,Gen-3 Alpha在理解物理世界上,還是有一定的差距。
就拿網(wǎng)友測(cè)試Gen-3和Sora對(duì)比的一個(gè)demo中,越野車在陡峭的山坡中快速行駛,輪胎塵土飛揚(yáng)。
明顯可以看出,Gen-3生成了塵土僅在車前方出現(xiàn)的情景。
就連此前的Sora也是,生成了只有四條腿的螞蟻,被網(wǎng)友吵得不可開(kāi)交。
不僅如此,這幾天比較火的另一個(gè)AI視頻模型Dream Machine,硬是把體操運(yùn)動(dòng)員高空表演,拍成了恐怖片。
所有表演者的四肢,在做空中翻轉(zhuǎn)等技能時(shí),不是分散變形,就是合二為一。
另有網(wǎng)友測(cè)試Gen-3后,發(fā)現(xiàn)也是存在同樣的問(wèn)題。
下面這位直接站在假象的體操桿上表演。
這種時(shí)刻,當(dāng)然少不了LeCun的嘲諷,他激動(dòng)地再次重述,「視頻生成模型根本不理解基本的物理,更不用說(shuō)人體了」。
他肯定了AI視頻模型會(huì)隨著時(shí)間推移,變得越來(lái)越好。
「不過(guò),真正理解物理的學(xué)習(xí)系統(tǒng)將不是生成式的。所有的鳥類和哺乳動(dòng)物,比任何視頻生成系統(tǒng)更了解物理學(xué)。然而,他們都無(wú)法生成詳細(xì)的視頻」。
各種演示demo,網(wǎng)友玩瘋
開(kāi)放2天后,Gen-3 Alpha的實(shí)測(cè)demo已經(jīng)鋪屏全網(wǎng),接下來(lái),讓我們一睹為快。
看看如今敢叫板Sora的AI視頻模型究竟強(qiáng)在哪?差距又在哪?
人物細(xì)節(jié)精準(zhǔn)刻畫,表現(xiàn)更有張力
水中物理學(xué),Gen-3做的還是很驚艷的。
在人物的刻畫,表現(xiàn)張力,不得不說(shuō)Gen-3真的很強(qiáng)。
這雙彈鋼琴的手,是那么地完美。
在Gen-3筆下,還可以畫出靈動(dòng)的長(zhǎng)著兔耳朵的小女孩。
作者表示,其實(shí)自己的提示中寫錯(cuò)了(長(zhǎng)著兔毛的女孩),不過(guò)Gen-3很好地理解她的意圖,畫出了兔耳朵。
AI生成時(shí)裝秀,堪比世界四大時(shí)裝周
還有AI生成的時(shí)裝秀表演,完全打破了美學(xué)的想象力,可以引領(lǐng)時(shí)尚前沿了。
精靈、怪獸未來(lái)科幻,Gen-3想象力太強(qiáng)
Gen-3生成的「全息」精靈,看著有些神奇。
倫敦泰晤士河中,一只隱藏的怪物從水中逐漸浮現(xiàn)。
這一畫面,讓人不禁想起哥斯拉電影中的場(chǎng)景。
另一位網(wǎng)友用Gen-3做了一個(gè)科幻短片,名為《2030——?dú)W羅巴任務(wù)》,還為其配上了音樂(lè)。
還有太空電梯,看著像那么回事兒。
多場(chǎng)景轉(zhuǎn)換,把控到位
網(wǎng)友用Gen-3生成的一個(gè)人一生不同階段的飛速閃過(guò)的經(jīng)歷。
從幼年時(shí)期,到小學(xué)、中學(xué),再到大學(xué),結(jié)婚,都呈現(xiàn)出來(lái)了。
下面這個(gè)場(chǎng)景轉(zhuǎn)換,Gen-3把控得非常到位。
從愛(ài)爾蘭的一座城堡,飛越到一座摩天大樓林立的未來(lái)賽博朋克城市。
還有這種像素風(fēng)格的AI視頻生成,完全是原生的。
視頻游戲,一鍵生成
黃仁勛曾說(shuō)過(guò),未來(lái)5-10年內(nèi)會(huì)看到完全由AI生成的游戲!
不過(guò),Gen-3生成的AI視頻游戲,也足以令人驚嘆了。
網(wǎng)友用Gen-3去生成16位的復(fù)古視頻游戲1776。
多樣字體
另外,Gen-3 Alpha在標(biāo)題動(dòng)畫的生成效果上,簡(jiǎn)直令人驚嘆。
網(wǎng)友收集了9個(gè)最經(jīng)典的案例。
海浪拍打沙灘后,留下了Ruway的字樣。
電影院大屏出現(xiàn)了Ruway字樣,給人一種漫威風(fēng)格的趕腳。
煙花在天空中綻放出Ruway字樣。
還有海洋里氣泡、流體、樹(shù)葉等各種各樣的元素,生成的驚艷字體。
失敗案例
除了開(kāi)篇所給出的Gen-3不懂物理世界案例之外,網(wǎng)友也收集了一些其他的失敗case。
比如,下面這把刀切肉,切一片變成許多片。網(wǎng)友驚嘆道,多么厲害的一把刀。
Gen-3、Sora,誰(shuí)更強(qiáng)?
Gen-3和Sora相比,誰(shuí)更勝一籌?
網(wǎng)友Proper使用了9個(gè)相同提示,分別去測(cè)試這兩個(gè)模型。
提示一:一名潛水員發(fā)現(xiàn)了一艘隱藏的來(lái)自未來(lái)的沉船,船上有生化海洋生物和先進(jìn)的外星科技。
就生成效果來(lái)看,Gen-3未來(lái)科技感更強(qiáng),Sora只是著重突出了沉船的外觀。
提示二:24歲女子眨眼的超特寫鏡頭,站在馬拉喀什的魔幻時(shí)刻,電影膠片,70mm拍攝,景深,色彩鮮艷,電影效果
在這個(gè)提示下,Gen-3和Sora真實(shí)度各有千秋,Gen-3的瞳孔中貌似更能看出馬拉喀什這座魔幻之城。
不過(guò),Gen-3的視頻沒(méi)有眨一下眼,缺少了真實(shí)性。
提示三:一個(gè)外星人與紐約市自然融合,偏執(zhí)驚悚風(fēng)格,35毫米膠片。
就外星人形象來(lái)說(shuō),不得不說(shuō)Sora更好一些,更能讓人接受,Gen-3生成的外星人就像一個(gè)恐怖片一樣。
提示四:一位時(shí)尚的女性走在東京的一條街道上,街道上到處是溫暖的霓虹燈和生動(dòng)的城市標(biāo)志。她穿著黑色皮夾克、紅色連衣裙和黑色靴子,手提一個(gè)黑色手提包。她戴著太陽(yáng)鏡,涂著紅色口紅。她走路自信而隨意。街道潮濕且具有反光效果,形成了彩色燈光的鏡面效果。街上有許多行人在走動(dòng)。
還有Sora生成的這張經(jīng)典的圖像——打扮時(shí)髦的女人走在東京街道,Gen-3也不輸分毫。不過(guò),在表現(xiàn)鏡面效果這點(diǎn)上,Gen-3沒(méi)有完全遵循指令。
提示五:加州淘金熱時(shí)期的歷史鏡頭。
Gen-3更加真實(shí)地體現(xiàn)了加州淘金熱,人們沉浸在淘金的喜悅中,而且背景顏色凸顯出的歷史感更加濃厚。
也就是說(shuō),沒(méi)有對(duì)比,就沒(méi)有傷害。
提示六:一位年輕的專業(yè)產(chǎn)品評(píng)論員坐在一臺(tái)有兩個(gè)顯示屏的電腦前,在一個(gè)光線充足的視頻工作室里,周圍環(huán)繞著各種小工具和科技設(shè)備。他手持一臺(tái)電影攝影機(jī),正在思考下一個(gè)要制作的視頻內(nèi)容。他對(duì)準(zhǔn)了焦距、 背景略微模糊,以達(dá)到電影效果。
Gen-3在人物的表現(xiàn)上,更加豐富。Sora只是男子的頭從一邊轉(zhuǎn)到另一邊,也沒(méi)有體現(xiàn)出對(duì)焦的這個(gè)動(dòng)作。
提示七:攝像機(jī)圍繞著一大堆老式電視機(jī)旋轉(zhuǎn),這些電視機(jī)都在播放不同的節(jié)目:1950年代的科幻電影、恐怖電影、新聞、雪花屏、1970年代的情景喜劇等,這一場(chǎng)景設(shè)置在紐約一個(gè)大型博物館展廳內(nèi)。
旋轉(zhuǎn)這一點(diǎn)Gen-3倒是很好地體現(xiàn),不過(guò)電視有點(diǎn)「穿?!沟母杏X(jué)。還有雪花屏幕,Gen-3漏掉了。
但是,對(duì)于Sora,卻沒(méi)有旋轉(zhuǎn)起來(lái)。
不管咋說(shuō),都沒(méi)有最完美的AI視頻模型。
還有額外一個(gè)對(duì)比的案例,大家可以自己感受下。