了解Sora,OpenAI的令人印象深刻的新興視頻生成軟件
譯文OpenAI在2021年掀起了波瀾,當(dāng)時(shí)他們宣布了DALL-E,這是一款文本到圖像的生成式人工智能工具,讓測(cè)試版參與者能夠?qū)崟r(shí)生成圖像。最終生成的視頻并不是很理想,當(dāng)然生成近乎真實(shí)的視頻畫(huà)面,需要更多的時(shí)間。但是,盡管圖像質(zhì)量很高,人們依然希望對(duì)模型進(jìn)行改進(jìn)。對(duì)許多人來(lái)說(shuō),第一代DALL-E就像一個(gè)初學(xué)走路的孩子第一次制作人形。沒(méi)有人期待完美,但能夠如此清晰地看到完全由計(jì)算機(jī)生成的預(yù)期主體的輪廓非常令人鼓舞。
就在2月16日,OpenAI發(fā)布了他們稱(chēng)為“Sora”的新模型,該模型能夠通過(guò)輸入文本來(lái)生成視頻。目前,只有一小部分測(cè)試人員可以訪問(wèn)Sora,同時(shí)他們可以確定安全限制范圍。從OpenAI分享的例子來(lái)看,其中一些視頻已經(jīng)可以作為真實(shí)鏡頭傳播。特別是主題是地點(diǎn)、動(dòng)物或物體的鏡頭。讓我們一起來(lái)看看下面的例子:
生成這段20秒視頻的提示是“一窩金毛小狗在雪地里玩耍。他們的頭從雪中伸出來(lái),被雪覆蓋”。如果你以前使用過(guò)生成式人工智能創(chuàng)建圖像,你會(huì)明白較短的提示往往會(huì)產(chǎn)生奇怪的結(jié)果,而帶有特定圖像的冗長(zhǎng)提示往往更接近你腦海中的畫(huà)面。盡管這個(gè)視頻令人印象深刻,但該工具的第一次迭代仍有一些信息。雪的物理性質(zhì)仍然有一種不真實(shí)的感覺(jué),因?yàn)樵谀承┣闆r下它看起來(lái)會(huì)自己移動(dòng)。
然而,我并沒(méi)有以日常觀看的狀態(tài)觀看這些視頻,我觀看這些視頻的目的是為了找出它們展示中的缺陷,因?yàn)槲掖蜷_(kāi)它們時(shí)完全知道這些是人工智能生成的視頻。我認(rèn)為,一旦該工具完全發(fā)布,并且這些剪輯僅作為庫(kù)存視頻使用,大多數(shù)人將很難確定它是否是人工智能生成的。即使現(xiàn)在ChatGPT剛剛發(fā)布一年多,人們也很難確定文本是否是人工智能生成的,可用的檢測(cè)工具也不夠可靠。
雖然早期人工智能生成的內(nèi)容對(duì)偶然發(fā)現(xiàn)它們的普通觀眾來(lái)說(shuō)更顯而易見(jiàn),但我認(rèn)為未來(lái)人工智能會(huì)具有顛覆性影響。今年是美國(guó)的選舉年,隨著人工智能產(chǎn)生的政治錯(cuò)誤信息,在向公眾發(fā)布此工具之前,OpenAI需要考慮人工智能生成視頻的道德使用問(wèn)題。因?yàn)橐呀?jīng)有利用人工智能操縱選舉的先例。但是人工智能監(jiān)管能夠控制它嗎?或者任何立法都太輕、太晚了嗎?
原文標(biāo)題:Meet Sora, OpenAI’s impressive new video generation tool
原文作者:Scott Thompson