一個(gè)月蹦出4個(gè)國產(chǎn)Sora:“拍個(gè)手”集體陣亡 | 全方位評測
家人們,咱就說這個(gè)國產(chǎn)Sora啊,就在七月這一個(gè)月時(shí)間里,那“增速”簡直就是霸屏模式——
可靈、PixVerse V2、清影、Vidu……
面對眼前一水兒的AI視頻生成軟件,相信大家也和我一樣:
感慨過后,一個(gè)想法立即浮上心頭:
能不能把它們拉到一起,搞個(gè)橫評,看看誰家的國產(chǎn)Sora更勝一籌?
說干就干,我們先來簡單介紹一下此次參賽的幾位選手:
- ①號選手:可靈,快手AI團(tuán)隊(duì)出品,7月6日網(wǎng)頁端正式上線。
- ②號選手:PixVerse V2,由愛詩科技于7月24日正式發(fā)布。
- ③號選手:清影,由智譜AI打造,7月26日在網(wǎng)頁、APP和小程序端上線。
- ④號選手:Vidu,清華系初創(chuàng)生數(shù)科技在7月30日發(fā)布。
我們這次的battle將圍繞圖生視頻和文生視頻兩個(gè)大賽道展開,其中還會(huì)包含風(fēng)景、動(dòng)物、人物甚至梗圖等多項(xiàng)生成能力測試。
對于各個(gè)選手來說,不僅要考驗(yàn)的是它們最終生成的質(zhì)量,更關(guān)鍵的是畫面一致性、是否符合給定prompt等更為細(xì)節(jié)的內(nèi)容。
接下來,量子位一手實(shí)測這就奉上。
Round 1:圖生視頻
這第一關(guān),咱就先來試試諸位選手的“圖生視頻”能力。
老規(guī)矩,開局只給一張圖和一段prompt,不進(jìn)行任何其他操作,以保證原汁原味兒~
經(jīng)典梗圖
提到梗,那就不得不搬出《甄嬛傳》了~
我們先給每位選手“喂”下面這張圖:
然后簡單的給一句prompt:
甄嬛慢慢戴上了墨鏡。
首先從戴墨鏡這個(gè)細(xì)節(jié)來看,只有可靈算是把墨鏡這個(gè)實(shí)體完完整整地給生成出來了。
而清影和Vidu生成的墨鏡還是透明的,并非我們印象中的那種墨鏡。
至于PixVerse V2……則直接生成了個(gè)寂寞。
其次,從自然度來看,可靈的甄嬛低頭戴墨鏡也是比較符合生活中的邏輯,屬于最自然的那個(gè)。
而在清影和Vidu里,甄嬛佩戴墨鏡的位置略顯高了一些;以及,清影生成的手指出現(xiàn)了6個(gè)。
因此在梗圖的較量中,可靈明顯勝出!
腦洞大開的科幻大片
接下來,我們來測試一下AI們的想象力如何。
操作同樣是先“喂”一張末日場景圖:
這次的prompt涉及的“劇情”會(huì)稍微復(fù)雜一點(diǎn),例如:
最后一艘人類飛船逃離,透過舷窗,一只彩虹色的氣球慢鏡頭飄過。
我們來看下四位選手的生成效果:
這次battle的結(jié)果就比較明顯了。
最符合prompt的便是PixVerse V2,不僅模式爆炸場景還在延續(xù),也有一個(gè)彩虹氣球飄過。
其次是可靈,但氣球出現(xiàn)的較為突然和詭異,并且顏色只是單一的紫色。
清影方面則是莫名其妙的出現(xiàn)了一個(gè)彩虹團(tuán),并沒有生成氣球的樣子。
但最慘的還是Vidu,直接什么都沒有,但隱約似乎是把遠(yuǎn)處爆炸的云朵里帶了點(diǎn)彩虹的顏色。
此局,PixVerse V2,Win!
老照片動(dòng)起來
最后一個(gè)圖生視頻的測試,我們玩兒復(fù)活老照片:
prompt是這樣的:
小朋友邊轉(zhuǎn)過身來邊拍手。
我們來看下效果:
嗯,集體陣亡。
不拍手的不拍手,拍手的手基本上全鬼畜。
但相比來看,Vidu的效果會(huì)稍微強(qiáng)一些,不僅完成了關(guān)鍵“拍手”動(dòng)作(雖然有幾幀還是出錯(cuò)了),還自帶降雨效果,活脫脫一場“兒童雨中嬉戲”~
看來AI處理手還是非常困難的。
本輪,Vidu的表現(xiàn)相對出眾一些!
至此,先來一個(gè)小總結(jié):
Round 2:文生視頻
在圖生視頻之后,我們進(jìn)入下一個(gè)大賽道——文生視頻。
同樣的,在這個(gè)環(huán)節(jié)中我們還設(shè)置了多個(gè)細(xì)分項(xiàng)目,從多個(gè)不同維度來測試各個(gè)AI選手的實(shí)力。
Sora同款prompt
首先就是跟文生視頻“鼻祖”Sora,用官網(wǎng)呈現(xiàn)的同款prompt來對比看下效果。
例如最為經(jīng)典的“Sora女郎”:
A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
所有的效果均不如Sora那般逼真,但可以說是各有風(fēng)格特色。
例如可靈和Vidu的人物在走路姿態(tài)上更自然一些;PixVerse V2的人物在面部的一致性上較好;而清影則是整體畫面的色彩更為豐富。
一鏡到底
接下來,為了測試AI選手們生成畫面一致性的能力,我們來一段一鏡到底的復(fù)雜prompt:
生成一段主題為《城市公園的早晨》視頻。請使用一鏡到底的拍攝技巧,從公園入口開始,緩慢推進(jìn)鏡頭,捕捉清晨陽光下公園的景象。鏡頭應(yīng)平穩(wěn)移動(dòng),依次展現(xiàn)以下元素:
1、公園入口的標(biāo)識(shí)牌,陽光透過樹葉間隙,形成斑駁的光影。
2、晨跑的人群,他們臉上洋溢著活力和朝氣。
3、兒童游樂區(qū),孩子們在秋千和滑梯上玩耍,笑聲充滿整個(gè)場景。
4、最后,鏡頭回到公園的另一側(cè)出口,結(jié)束視頻。
從結(jié)果來看,所有選手在大場景的表現(xiàn)均不錯(cuò),可以把公園、樹木生成的栩栩如生。
But!
所有選手在人物上全部出現(xiàn)錯(cuò)誤:畸變的、消失的、魔幻的……
大特寫
在一致性之后,我們繼續(xù)測試一下特寫鏡頭,AI們是否能夠hold?。?/p>
動(dòng)畫場景,展示一個(gè)粉色的毛絨絨的小怪物抱著一塊很大的芝士在吃,3d風(fēng)格,需要注重畫面的細(xì)節(jié),小怪物的神情充滿喜悅,表現(xiàn)出頑皮天真的樣子。溫暖的顏色和氛圍的燈光。
這一輪的測試,除了PixVerse V2出現(xiàn)的畸變之外,其它三位選手不論是一致性還是畫面豐富度,均表現(xiàn)出眾。
多主體
最后,我們試一下選手們能否在一個(gè)視頻里一口氣hold住多個(gè)主體,例如:
冬天,一家三口,爸爸,媽媽,還有女兒坐在沙發(fā)上,旁邊有只貓咪趴著睡覺,火爐取暖,溫馨畫面。
在畫風(fēng)方面,只有可靈將“溫馨”解讀成了黑白風(fēng)格,其它三位選手的畫風(fēng)均比較契合prompt。
Vidu還是唯一一個(gè)生成了中國家庭的那個(gè)。
但所有玩家都沒能完整生成prompt中的4個(gè)主體,即三個(gè)人類和一只貓,都或多或少的出現(xiàn)了缺失的情況。
同樣的,到這里我們再來一個(gè)小總結(jié):
以上就是這次AI視頻生成的全部評測內(nèi)容了。
那么接下來的一個(gè)問題是:
國產(chǎn)AI生成視頻,哪家強(qiáng)?
除了上述效果之外,我們先再來看另一個(gè)維度的較量——生成速度:
我們針對圖生視頻和文生視頻兩個(gè)大賽道,分別對每個(gè)選手、每個(gè)案例統(tǒng)計(jì)了生成時(shí)間:
令人比較意外的,新秀Vidu不論是在哪個(gè)賽道,都只需要1分鐘不到的時(shí)間,是唯一一個(gè)進(jìn)到“秒生成俱樂部”的玩家。
剩下的三位,整體來看,清影的生成速度高于其他二位。而且需要說明的一點(diǎn)是,清影的視頻時(shí)長為6秒,其他兩位是5秒。
至于可靈和PixVerse V2,整體而言PixVerse V2更快。
小結(jié)一下,整體生成速度排列如下:
Vidu > 清影 > PixVerse V2 > 可靈
不過在功能方面,還有一些細(xì)節(jié)內(nèi)容值得說道說道。
例如PixVerse V2是支持免費(fèi)把視頻長度擴(kuò)展到8s;可靈是可以擴(kuò)展到10s,但不支持高性能模式;清影和Vidu則是固定時(shí)長。
在生成數(shù)量限制方面,清影是相當(dāng)?shù)陌詺猓?strong>完全不限次!
而其它三位玩家均采用積分制:
- 可靈:每日登錄免費(fèi)獲66靈感值,生成單次5秒視頻需消耗10靈感值
- PixVerse V2:注冊即獲得100 Credits,每天還能免費(fèi)得50 Credits,單次5秒視頻需消耗15 Credits
- Vidu:注冊即獲得80積分,更多積分需訂閱
……
最后,從視頻的生成效果、生成速度和功能等全方面來看,目前并不能判定哪家國產(chǎn)Sora屬于最強(qiáng),只能說是各有千秋。
若是小伙伴們想要更深入地去體驗(yàn)和評測,四位選手的體驗(yàn)地址放在下面了;測試完后歡迎回來留言討論哦~
可靈體驗(yàn)地址:https://klingai.kuaishou.com/text-to-video/new
PixVerse V2體驗(yàn)地址:https://app.pixverse.ai/home
清影體驗(yàn)地址:https://chatglm.cn/video
Vidu體驗(yàn)地址:https://www.vidu.studio/