自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

效果炸裂!OpenAI首個視頻生成模型發(fā)布,1分鐘流暢高清,網(wǎng)友:整個行業(yè)RIP

人工智能 新聞
OpenAI表示,正在教AI理解和模擬運動中的物理世界,目標是訓練模型來幫助人們解決需要現(xiàn)實世界交互的問題。

剛剛,奧特曼發(fā)布OpenAI首個視頻生成模型Sora。

完美繼承DALL·E 3的畫質(zhì)和遵循指令能力,能生成長達1分鐘的高清視頻。

圖片

AI想象中的龍年春節(jié),紅旗招展人山人海。

有緊跟舞龍隊伍抬頭好奇觀望的兒童,還有不少人掏出手機邊跟邊拍,海量人物角色各有各的行為。

圖片

雨后東京街頭,潮濕地面反射霓虹燈光影效果堪比RTX ON。

圖片

行駛中的列車窗外偶遇遮擋,車內(nèi)人物倒影短暫出現(xiàn)非常驚艷。

圖片

也可以來一段好萊塢大片質(zhì)感的電影預告片:

圖片

豎屏超近景視角下,這只蜥蜴細節(jié)拉滿:

圖片

網(wǎng)友直呼game over,工作要丟了:

圖片

甚至有人已經(jīng)開始“悼念”一整個行業(yè):

圖片

AI理解運動中的物理世界

OpenAI表示,正在教AI理解和模擬運動中的物理世界,目標是訓練模型來幫助人們解決需要現(xiàn)實世界交互的問題

根據(jù)文本提示生成視頻,僅僅是整個計劃其中的一步。

圖片

目前Sora已經(jīng)能生成具有多個角色、包含特定運動的復雜場景,不僅能理解用戶在提示中提出的要求,還了解這些物體在物理世界中的存在方式。

Sora還可以在單個視頻中創(chuàng)建多個鏡頭,并依靠對語言的深入理解準確地解釋提示詞,保留角色和視覺風格。

美麗、白雪皚皚的東京熙熙攘攘。鏡頭穿過熙熙攘攘的城市街道,跟隨幾個人享受美麗的雪天并在附近的攤位購物。絢麗的櫻花花瓣隨著雪花隨風飄揚。

對于Sora當前存在的弱點,OpenAI也不避諱,指出它可能難以準確模擬復雜場景的物理原理,并且可能無法理解因果關(guān)系。

例如“五只灰狼幼崽在一條偏僻的碎石路上互相嬉戲、追逐”,狼的數(shù)量會變化,一些憑空出現(xiàn)或消失。

圖片

該模型還可能混淆提示的空間細節(jié),例如混淆左右,并且可能難以精確描述隨著時間推移發(fā)生的事件,例如遵循特定的相機軌跡。

如提示詞“籃球穿過籃筐然后爆炸”中,籃球沒有正確被籃筐阻擋。

圖片

技術(shù)方面,目前OpenAI透露的不多,簡單介紹如下:

Sora是一種擴散模型,從噪聲開始,能夠一次生成整個視頻或擴展視頻的長度,

關(guān)鍵之處在于一次生成多幀的預測,確保畫面主體即使暫時離開視野也能保持不變。

與GPT模型類似,Sora使用了Transformer架構(gòu),有很強的擴展性。

在數(shù)據(jù)方面,OpenAI將視頻和圖像表示為patch,類似于GPT中的token。

通過這種統(tǒng)一的數(shù)據(jù)表示方式,可以在比以前更廣泛的視覺數(shù)據(jù)上訓練模型,涵蓋不同的持續(xù)時間、分辨率和縱橫比。

Sora建立在過去對DALL·E和GPT模型的研究之上。它使用DALL·E 3的重述提示詞技術(shù),為視覺訓練數(shù)據(jù)生成高度描述性的標注,因此能夠更忠實地遵循用戶的文本指令。

除了能夠僅根據(jù)文本指令生成視頻之外,該模型還能夠獲取現(xiàn)有的靜態(tài)圖像并從中生成視頻,準確地讓圖像內(nèi)容動起來并關(guān)注小細節(jié)。

該模型還可以獲取現(xiàn)有視頻并對其進行擴展或填充缺失的幀,請參閱技術(shù)論文了解更多信息(晚些時候發(fā)布)。

Sora 是能夠理解和模擬現(xiàn)實世界的模型的基礎(chǔ),OpenAI相信這一功能將成為實現(xiàn)AGI的重要里程碑。

奧特曼在線接單

目前已有一些視覺藝術(shù)家、設(shè)計師和電影制作人(以及OpenAI員工)獲得了Sora訪問權(quán)限。

他們開始不斷po出新的作品,奧特曼也開始了在線接單模式。

帶上你的提示詞@sama,就有可能收到生成好的視頻回復。

圖片


責任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2024-02-19 07:58:01

OpenAI模型GPT

2024-09-12 15:46:40

2025-02-11 09:00:00

2022-12-21 17:12:24

模型3D

2017-02-22 14:46:04

Leader-Foll線程

2023-02-06 09:31:07

視頻圖像

2024-02-19 08:31:10

SoraAIOpenAI

2018-08-29 14:52:53

無人車

2023-12-20 15:26:13

AI谷歌

2024-10-22 09:40:00

模型生成

2025-02-24 10:03:21

2022-12-16 09:55:50

網(wǎng)絡(luò)架構(gòu)OSI

2015-11-23 17:34:33

秒借

2018-03-12 21:31:24

區(qū)塊鏈

2017-03-16 08:46:57

延時消息環(huán)形隊列數(shù)據(jù)結(jié)構(gòu)

2024-09-24 15:51:02

2024-12-10 07:29:58

2025-04-18 08:47:22

點贊
收藏

51CTO技術(shù)棧公眾號