OpenAI推出新款大模型Sora,可根據(jù)文本生成視頻
2月18日消息,據(jù)外媒報(bào)道,OpenAI推出一款名為Sora的新款A(yù)I模型,據(jù)稱該模型可以通過快速文本提示創(chuàng)建“逼真”和“富有想象力”的60秒視頻。
OpenAI在一篇博客文章中表示,Sora能夠根據(jù)文本指令生成長達(dá)60秒的視頻,并能夠提供包含多個(gè)角色、特定類型的動作和詳細(xì)背景細(xì)節(jié)的場景。
“這個(gè)模型不僅能理解用戶在提示中要求什么,還能理解這些東西在現(xiàn)實(shí)世界中是如何存在的?!辈┛臀恼抡f。
OpenAI表示,計(jì)劃訓(xùn)練AI模型,使其能夠“幫助人們解決需要現(xiàn)實(shí)世界互動的問題”。
市場研究公司ABI?research的高級分析師Reece?Hayden表示,盡管“多模態(tài)模型”并不新鮮,而且文本到視頻的模型已經(jīng)存在,但OpenAI聲稱Sora具有的長度和準(zhǔn)確性使其與眾不同。
Hayden表示,這些類型的人工智能模型可能會對數(shù)字娛樂市場產(chǎn)生重大影響,因?yàn)樾碌膫€(gè)性化內(nèi)容將在各個(gè)渠道上傳播。
“一個(gè)明顯的用例是電視,創(chuàng)造簡短的場景來支持?jǐn)⑹?,”Hayden說,“雖然這種模式仍有局限性,但它顯示了市場的方向?!?/p>
與此同時(shí),OpenAI表示,Sora仍在開發(fā)中,存在明顯的“弱點(diǎn)”,特別是在提示的空間細(xì)節(jié)方面。例如制作了一個(gè)視頻,視頻中有人咬了一口餅干,但之后沒有咬痕。
目前,OpenAI的信息仍然集中在安全上。該公司表示,計(jì)劃與一個(gè)專家團(tuán)隊(duì)合作測試最新模型,并密切關(guān)注包括錯誤信息、仇恨內(nèi)容和偏見在內(nèi)的各個(gè)領(lǐng)域。該公司表示,它還在開發(fā)幫助檢測誤導(dǎo)性信息的工具。
Sora將首先提供給被稱為“紅隊(duì)”的網(wǎng)絡(luò)安全教授,他們可以評估產(chǎn)品的危害或風(fēng)險(xiǎn)。它還向一些視覺藝術(shù)家、設(shè)計(jì)師和電影制作人提供訪問權(quán)限,以收集關(guān)于創(chuàng)意專業(yè)人士如何使用它的反饋。