哭笑不得!GPT 官網(wǎng)發(fā)布 Sora,體驗(yàn)了一次“神奇的 AI 視頻生成”
Hello,大家好,我是 Sunday。
這兩天在 GPT 的官網(wǎng)上看到了一個(gè)新的選項(xiàng)卡 Sora。
圖片
說起 Sora 可能很多同學(xué)不是很了解,但是這個(gè)東西在當(dāng)年第一次露面時(shí),也是震驚了一大批人的!
那么,這一次它的“公開”亮相,也是讓我想要趕緊“嘗嘗鮮”,不過最終體驗(yàn)的結(jié)果卻是有點(diǎn)“哭笑不得” ??
什么是 Sora?
Sora 是 OpenAI 推出的 文本生成視頻模型。顧名思義就是 可以通過文字的描述來直接生成視頻內(nèi)容的工具
它第一次公開露相是在 24年2月份,當(dāng)時(shí)我還寫了對(duì)應(yīng)的文章 太炸了!OpenAI深夜發(fā)布【文字直接生成視頻!】含 Sora 技術(shù)報(bào)告分析~ 。當(dāng)時(shí)的 Sora 還是傾向于各種演示場景,類似于一個(gè)“概念車”。
那么這一次 OpenAI 針對(duì) Sora 的“正式”發(fā)布,可以理解為 Sora 終于“量產(chǎn)了”!
Sora 的核心能力
量產(chǎn)的 Sora 主要具備以下三類功能:
- 文本生成視頻:根據(jù)用戶輸入文本的描述,可生成相應(yīng)的視頻片段,Pro 用戶可生成長度可達(dá) 20 秒,分辨率最高支持 1080p。Plus 用戶可生成長度為 5 秒,分辨率為 720P 的視頻
- 圖像動(dòng)畫:將靜態(tài)圖像轉(zhuǎn)換為動(dòng)態(tài)視頻。
- 視頻混合與編輯:用戶上傳自己的視頻素材,使用 Sora 進(jìn)行增強(qiáng)、混合或重新編輯。
如何使用 Sora
目前,Sora 已集成到 ChatGPT Plus 和 Pro 訂閱中,我們無需額外付費(fèi)即可使用!
以我訂閱的 ChatGPT Plus 為例,可以直接生成 清晰度為 720P,長度為 5 秒的視頻
圖片
有點(diǎn)迫不及待了!
那么接下來就讓咱們一起來試試看 Sora 是不是有傳說中的那么神奇。
現(xiàn)在,我在輸入框中輸入:生成一段與海賊王大戰(zhàn)超人的視頻,雙方對(duì)戰(zhàn)非常激烈!(注意:目前并不支持上傳照片生成視頻)
圖片
等待一會(huì),咱們來看看它生成的視頻質(zhì)量如何...
圖片
大約 20 秒的等待之后,視頻即可生成,咱們來看看,這個(gè)視頻是不是我們想要的 0.0
圖片
哈哈哈,這是什么?
這兩個(gè)人,我不說大家應(yīng)該認(rèn)不出來這是海賊王和超人吧,并且他們的打斗也毫無打斗的激烈感可言。
我本來期待著 Sora 能帶給我們一段震撼的戰(zhàn)斗場景,畢竟這是一個(gè)宣傳的那么牛逼的文字生成視頻的模型,怎么說也得“有模有樣”吧?
然而,實(shí)際生成的視頻卻有點(diǎn)令人哭笑不得了……
目前 Sora 的局限性
Sora 確實(shí)是一個(gè)極具潛力的工具。但是僅從這次的體驗(yàn)來看,它目前的局限性還是非常明顯的。
像我們剛剛輸入的復(fù)雜場景描述,Sora 似乎難以理解或精準(zhǔn)還原。目前生成的視頻 更適合簡單的場景,比如“清晨的海灘”或“天空中飛翔的鳥兒”。
同時(shí),針對(duì) GPT Puls 用戶而言,生成的最長視頻只有 5秒,分辨率也是有 720P。對(duì)于需要長時(shí)間敘事的場景,這顯然還不夠。
并且,Sora 對(duì)多角色、復(fù)雜情節(jié)的處理能力還有待提高。比如我們的“海賊王大戰(zhàn)超人”,目前生成的視頻甚至無法表現(xiàn)出明確的對(duì)應(yīng)的人物特征。
寫在最后
Sora 的“正式發(fā)布”,算是 AI 在內(nèi)容生成領(lǐng)域邁出了重要的一步。雖然目前它還無法完全滿足我們的期望。
如果你和我一樣對(duì) Sora 充滿好奇,不妨去 GPT 官網(wǎng)親自體驗(yàn)一番!
同時(shí),我也想知道,假如 Sora 已經(jīng)非常強(qiáng)大,可以生成任意你想要的視頻了,那么 你最想生成怎樣的視頻呢?