自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

一個(gè)月蹦出4個(gè)國產(chǎn)Sora:“拍個(gè)手”集體陣亡 | 全方位評測

人工智能 新聞
對于各個(gè)選手來說,不僅要考驗(yàn)的是它們最終生成的質(zhì)量,更關(guān)鍵的是畫面一致性、是否符合給定prompt等更為細(xì)節(jié)的內(nèi)容。

家人們,咱就說這個(gè)國產(chǎn)Sora啊,就在七月這一個(gè)月時(shí)間里,那“增速”簡直就是霸屏模式——

可靈、PixVerse V2、清影、Vidu……

面對眼前一水兒的AI視頻生成軟件,相信大家也和我一樣:

感慨過后,一個(gè)想法立即浮上心頭:

能不能把它們拉到一起,搞個(gè)橫評,看看誰家的國產(chǎn)Sora更勝一籌?

說干就干,我們先來簡單介紹一下此次參賽的幾位選手:

  • ①號選手:可靈,快手AI團(tuán)隊(duì)出品,7月6日網(wǎng)頁端正式上線。
  • ②號選手:PixVerse V2,由愛詩科技于7月24日正式發(fā)布。
  • ③號選手:清影,由智譜AI打造,7月26日在網(wǎng)頁、APP和小程序端上線。
  • ④號選手:Vidu,清華系初創(chuàng)生數(shù)科技在7月30日發(fā)布。

圖片

我們這次的battle將圍繞圖生視頻文生視頻兩個(gè)大賽道展開,其中還會(huì)包含風(fēng)景、動(dòng)物、人物甚至梗圖等多項(xiàng)生成能力測試。

對于各個(gè)選手來說,不僅要考驗(yàn)的是它們最終生成的質(zhì)量,更關(guān)鍵的是畫面一致性、是否符合給定prompt等更為細(xì)節(jié)的內(nèi)容。

接下來,量子位一手實(shí)測這就奉上。

Round 1:圖生視頻

這第一關(guān),咱就先來試試諸位選手的“圖生視頻”能力。

老規(guī)矩,開局只給一張圖和一段prompt,不進(jìn)行任何其他操作,以保證原汁原味兒~

經(jīng)典梗圖

提到梗,那就不得不搬出《甄嬛傳》了~

我們先給每位選手“喂”下面這張圖:

圖片

然后簡單的給一句prompt:

甄嬛慢慢戴上了墨鏡。

首先從戴墨鏡這個(gè)細(xì)節(jié)來看,只有可靈算是把墨鏡這個(gè)實(shí)體完完整整地給生成出來了。

而清影和Vidu生成的墨鏡還是透明的,并非我們印象中的那種墨鏡。

至于PixVerse V2……則直接生成了個(gè)寂寞。

其次,從自然度來看,可靈的甄嬛低頭戴墨鏡也是比較符合生活中的邏輯,屬于最自然的那個(gè)。

而在清影和Vidu里,甄嬛佩戴墨鏡的位置略顯高了一些;以及,清影生成的手指出現(xiàn)了6個(gè)。

因此在梗圖的較量中,可靈明顯勝出!

腦洞大開的科幻大片

接下來,我們來測試一下AI們的想象力如何。

操作同樣是先“喂”一張末日場景圖:

圖片

這次的prompt涉及的“劇情”會(huì)稍微復(fù)雜一點(diǎn),例如:

最后一艘人類飛船逃離,透過舷窗,一只彩虹色的氣球慢鏡頭飄過。

我們來看下四位選手的生成效果:

這次battle的結(jié)果就比較明顯了。

最符合prompt的便是PixVerse V2,不僅模式爆炸場景還在延續(xù),也有一個(gè)彩虹氣球飄過。

其次是可靈,但氣球出現(xiàn)的較為突然和詭異,并且顏色只是單一的紫色。

清影方面則是莫名其妙的出現(xiàn)了一個(gè)彩虹團(tuán),并沒有生成氣球的樣子。

但最慘的還是Vidu,直接什么都沒有,但隱約似乎是把遠(yuǎn)處爆炸的云朵里帶了點(diǎn)彩虹的顏色。

此局,PixVerse V2,Win!

老照片動(dòng)起來

最后一個(gè)圖生視頻的測試,我們玩兒復(fù)活老照片

圖片

prompt是這樣的:

小朋友邊轉(zhuǎn)過身來邊拍手。

我們來看下效果:

嗯,集體陣亡。

不拍手的不拍手,拍手的手基本上全鬼畜。

但相比來看,Vidu的效果會(huì)稍微強(qiáng)一些,不僅完成了關(guān)鍵“拍手”動(dòng)作(雖然有幾幀還是出錯(cuò)了),還自帶降雨效果,活脫脫一場“兒童雨中嬉戲”~

看來AI處理手還是非常困難的。

本輪,Vidu的表現(xiàn)相對出眾一些!

至此,先來一個(gè)小總結(jié):

圖片

Round 2:文生視頻

在圖生視頻之后,我們進(jìn)入下一個(gè)大賽道——文生視頻。

同樣的,在這個(gè)環(huán)節(jié)中我們還設(shè)置了多個(gè)細(xì)分項(xiàng)目,從多個(gè)不同維度來測試各個(gè)AI選手的實(shí)力。

Sora同款prompt

首先就是跟文生視頻“鼻祖”Sora,用官網(wǎng)呈現(xiàn)的同款prompt來對比看下效果。

例如最為經(jīng)典的“Sora女郎”

A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

所有的效果均不如Sora那般逼真,但可以說是各有風(fēng)格特色。

例如可靈和Vidu的人物在走路姿態(tài)上更自然一些;PixVerse V2的人物在面部的一致性上較好;而清影則是整體畫面的色彩更為豐富。

一鏡到底

接下來,為了測試AI選手們生成畫面一致性的能力,我們來一段一鏡到底的復(fù)雜prompt:

生成一段主題為《城市公園的早晨》視頻。請使用一鏡到底的拍攝技巧,從公園入口開始,緩慢推進(jìn)鏡頭,捕捉清晨陽光下公園的景象。鏡頭應(yīng)平穩(wěn)移動(dòng),依次展現(xiàn)以下元素:
1、公園入口的標(biāo)識(shí)牌,陽光透過樹葉間隙,形成斑駁的光影。
2、晨跑的人群,他們臉上洋溢著活力和朝氣。
3、兒童游樂區(qū),孩子們在秋千和滑梯上玩耍,笑聲充滿整個(gè)場景。
4、最后,鏡頭回到公園的另一側(cè)出口,結(jié)束視頻。

從結(jié)果來看,所有選手在大場景的表現(xiàn)均不錯(cuò),可以把公園、樹木生成的栩栩如生。

But!

所有選手在人物上全部出現(xiàn)錯(cuò)誤:畸變的、消失的、魔幻的……

大特寫

在一致性之后,我們繼續(xù)測試一下特寫鏡頭,AI們是否能夠hold?。?/p>

動(dòng)畫場景,展示一個(gè)粉色的毛絨絨的小怪物抱著一塊很大的芝士在吃,3d風(fēng)格,需要注重畫面的細(xì)節(jié),小怪物的神情充滿喜悅,表現(xiàn)出頑皮天真的樣子。溫暖的顏色和氛圍的燈光。

這一輪的測試,除了PixVerse V2出現(xiàn)的畸變之外,其它三位選手不論是一致性還是畫面豐富度,均表現(xiàn)出眾。

多主體

最后,我們試一下選手們能否在一個(gè)視頻里一口氣hold住多個(gè)主體,例如:

冬天,一家三口,爸爸,媽媽,還有女兒坐在沙發(fā)上,旁邊有只貓咪趴著睡覺,火爐取暖,溫馨畫面。

在畫風(fēng)方面,只有可靈將“溫馨”解讀成了黑白風(fēng)格,其它三位選手的畫風(fēng)均比較契合prompt。

Vidu還是唯一一個(gè)生成了中國家庭的那個(gè)。

但所有玩家都沒能完整生成prompt中的4個(gè)主體,即三個(gè)人類和一只貓,都或多或少的出現(xiàn)了缺失的情況。

同樣的,到這里我們再來一個(gè)小總結(jié):

圖片

以上就是這次AI視頻生成的全部評測內(nèi)容了。

那么接下來的一個(gè)問題是:

國產(chǎn)AI生成視頻,哪家強(qiáng)?

除了上述效果之外,我們先再來看另一個(gè)維度的較量——生成速度

我們針對圖生視頻和文生視頻兩個(gè)大賽道,分別對每個(gè)選手、每個(gè)案例統(tǒng)計(jì)了生成時(shí)間:

圖片

令人比較意外的,新秀Vidu不論是在哪個(gè)賽道,都只需要1分鐘不到的時(shí)間,是唯一一個(gè)進(jìn)到“秒生成俱樂部”的玩家。

剩下的三位,整體來看,清影的生成速度高于其他二位。而且需要說明的一點(diǎn)是,清影的視頻時(shí)長為6秒,其他兩位是5秒。

至于可靈和PixVerse V2,整體而言PixVerse V2更快。

小結(jié)一下,整體生成速度排列如下:

Vidu > 清影 > PixVerse V2 > 可靈

不過在功能方面,還有一些細(xì)節(jié)內(nèi)容值得說道說道。

例如PixVerse V2是支持免費(fèi)把視頻長度擴(kuò)展到8s;可靈是可以擴(kuò)展到10s,但不支持高性能模式;清影和Vidu則是固定時(shí)長。

在生成數(shù)量限制方面,清影是相當(dāng)?shù)陌詺猓?strong>完全不限次!

而其它三位玩家均采用積分制

  • 可靈:每日登錄免費(fèi)獲66靈感值,生成單次5秒視頻需消耗10靈感值
  • PixVerse V2:注冊即獲得100 Credits,每天還能免費(fèi)得50 Credits,單次5秒視頻需消耗15 Credits
  • Vidu:注冊即獲得80積分,更多積分需訂閱

……

最后,從視頻的生成效果、生成速度和功能等全方面來看,目前并不能判定哪家國產(chǎn)Sora屬于最強(qiáng),只能說是各有千秋。

若是小伙伴們想要更深入地去體驗(yàn)和評測,四位選手的體驗(yàn)地址放在下面了;測試完后歡迎回來留言討論哦~

可靈體驗(yàn)地址:https://klingai.kuaishou.com/text-to-video/new

PixVerse V2體驗(yàn)地址:https://app.pixverse.ai/home

清影體驗(yàn)地址:https://chatglm.cn/video

Vidu體驗(yàn)地址:https://www.vidu.studio/

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2018-01-10 12:09:12

Android開發(fā)程序員

2019-10-08 11:07:55

Python 開發(fā)編程語言

2009-11-23 08:52:02

Windows 7首月銷量

2013-05-27 09:47:33

Java開發(fā)Java跨平臺(tái)

2021-10-28 05:39:14

Windows 10操作系統(tǒng)微軟

2012-08-31 16:40:24

Mac操作系統(tǒng)

2016-01-11 19:38:51

七牛

2019-03-11 08:36:00

Office 應(yīng)用微軟

2009-02-16 09:15:49

蘋果喬布斯CEO

2012-12-20 10:18:10

Windows 8

2013-08-12 16:35:22

2013-03-08 09:40:00

數(shù)據(jù)百度360

2021-07-20 08:57:26

滴滴上市網(wǎng)絡(luò)安全審查

2019-04-01 14:17:36

kotlin開發(fā)Java

2010-09-07 10:45:05

富士康

2017-12-13 16:21:51

內(nèi)存價(jià)格崩盤

2013-08-11 20:55:29

2010-09-14 16:09:49

sql日期函數(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號