自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

OpenAI 推出 Sora:重新定義現(xiàn)實的突破性視頻生成模型

人工智能
就在幾天前,當(dāng)大伊萬瞥了一眼手機(jī)快速查看社交媒體時,他被一條新聞驚呆了,差點讓他難以置信地吐出飲料!OpenAI 是去年發(fā)布的開創(chuàng)性 ChatGPT 背后的著名美國 AI 初創(chuàng)公司,剛剛公布了他們最新的奇跡:Vincent 視頻模型 Sora。

概述:就在幾天前,當(dāng)大伊萬瞥了一眼手機(jī)快速查看社交媒體時,他被一條新聞驚呆了,差點讓他難以置信地吐出飲料!OpenAI 是去年發(fā)布的開創(chuàng)性 ChatGPT 背后的著名美國 AI 初創(chuàng)公司,剛剛公布了他們最新的奇跡:Vincent 視頻模型 Sora。他們不僅介紹了 Sora,而且還發(fā)布了一些令人瞠目結(jié)舌的 AI 生成視頻供全世界觀看。根據(jù) OpenAI 的說法,這些視頻擁有三個顯著的特點:它們長達(dá) 60 秒,在單個視頻中提供多角度拍攝,并包含世界模型。從本質(zhì)上講,OpenAI 在視頻生成效果方面實現(xiàn)了質(zhì)的飛躍,使 Sora 有別于其前輩。那么,為ChatGPT做出貢獻(xiàn)的OpenAI這次是如何

就在幾天前,當(dāng)大伊萬瞥了一眼手機(jī)快速查看社交媒體時,他被一條新聞驚呆了,差點讓他難以置信地吐出飲料!OpenAI 是去年發(fā)布的開創(chuàng)性 ChatGPT 背后的著名美國 AI 初創(chuàng)公司,剛剛公布了他們最新的奇跡:Vincent 視頻模型 Sora。

他們不僅介紹了 Sora,而且還發(fā)布了一些令人瞠目結(jié)舌的 AI 生成視頻供全世界觀看。根據(jù) OpenAI 的說法,這些視頻擁有三個顯著的特點:它們長達(dá) 60 秒,在單個視頻中提供多角度拍攝,并包含世界模型。

從本質(zhì)上講,OpenAI 在視頻生成效果方面實現(xiàn)了質(zhì)的飛躍,使 Sora 有別于其前輩。

那么,為ChatGPT做出貢獻(xiàn)的OpenAI這次是如何實現(xiàn)AI視頻生成,并且?guī)缀鯇崿F(xiàn)實物的呢?這種AI視頻生成的技術(shù)優(yōu)勢是什么,它可能對我們的生活甚至人類社會產(chǎn)生什么影響?

Sora的技術(shù)

讓我們先解決第一個問題。目前,OpenAI 對其大型 AI 連續(xù)視頻模型的內(nèi)部工作原理和算法仍然相當(dāng)保密。

他們只是在社交媒體上暗示,OpenAI在“為模型提供多幀預(yù)測”方面取得了突破。

根據(jù)大伊萬的個人解釋,這似乎意味著空已經(jīng)獲得了通過自學(xué)深入和情感理解和構(gòu)建人類發(fā)出的通用命令語言的能力。

當(dāng)然,這是一個修訂版本,其中包含所需的單詞和表情符號,以及為清楚起見而重新格式化:

“通用語言”:在 OpenAI 的演示模式下,Sora 生成視頻的方法非常簡單。它所需要的只是英語(或其他語言)來描述所需的場景,完全繞過了傳統(tǒng) 3D 視頻生成的復(fù)雜性。

“深刻”:Sora理解人類語言并基于這種理解構(gòu)建視頻的能力確實很深遠(yuǎn)。視頻生成所需的細(xì)節(jié)和深度遠(yuǎn)遠(yuǎn)超過文本描述。如果ChatGPT可以通過文字實現(xiàn)某些細(xì)節(jié),那么這些描述就必須在視頻中充分體現(xiàn)出來,展示出指數(shù)級的復(fù)雜性和深度。

“情感”:人工智能生成的圖像和視頻歷來難以傳達(dá)人類情感。例如,目前人工智能生成的肖像往往缺乏情感深度,只有程式化的微笑,導(dǎo)致一些評論家將它們貼上“死氣沉沉”的標(biāo)簽。然而,Sora 模型呈現(xiàn)的角色表現(xiàn)出令人難以置信的自然、合乎邏輯和微妙的情感,可以無縫地適應(yīng)周圍的環(huán)境。

借用《普羅米修斯》中的一句臺詞,他們就像“這些視頻中的演員......有靈魂“,比真實的人更像真實的個人。

當(dāng)然,在這些功能中,Big Ivan 認(rèn)為“構(gòu)建”是最關(guān)鍵的方面,正如 OpenAI 的“世界模型”概念所強(qiáng)調(diào)的那樣。

我們都認(rèn)識到,現(xiàn)實世界是按照特定的物理定律運(yùn)作的:物體服從重力,風(fēng)吹亂頭發(fā),易碎物品在掉落時可以預(yù)見地破碎。

傳統(tǒng)的 3D 建模和 AI 模型在這一領(lǐng)域步維艱,在嘗試忠實地復(fù)制現(xiàn)實世界的物理時經(jīng)常會遇到問題。構(gòu)建我們的現(xiàn)實帶來了重大挑戰(zhàn),在這個領(lǐng)域?qū)崿F(xiàn)準(zhǔn)確性仍然是一項艱巨的任務(wù)。?

在這方面,空表現(xiàn)出了幾乎與現(xiàn)實相提并論的非凡能力。???

例如,它發(fā)布了人工智能視頻,展示了一只在雪地里嬉戲的金毛小狗,一個玩蠟燭的異想天開的生物,以及人們在日本櫻花盛開的季節(jié)悠閑漫步。這些視頻嚴(yán)格遵循物理定律,展示了與因果關(guān)系完全一致的無縫過渡和邏輯序列。

此外,根據(jù) OpenAI 的說法,Sora 的“構(gòu)建”能力可以實現(xiàn)類似于現(xiàn)實世界的無限細(xì)節(jié)。與受幀數(shù)限制的傳統(tǒng) 3D 建模不同,Sora 可以無休止地復(fù)制細(xì)節(jié)。再加上其近乎真實的感知和聽覺能力,這種構(gòu)建世界的能力確實令人敬畏。

索拉的影響

因此,像ChatGPT一樣,Sora無疑會對我們的日常生活產(chǎn)生重大影響。前者對我們?nèi)粘I畹挠绊戇h(yuǎn)遠(yuǎn)超出了僅僅產(chǎn)生文本輸出或進(jìn)行隨意對話。一些公司已經(jīng)開始利用ChatGPT來制定計劃,從而節(jié)省了大量時間并提高了運(yùn)營效率。

與 Sora 相比,ChatGPT 對社會的影響可以忽略不計。Sora的出現(xiàn)將導(dǎo)致廣泛采用,成本將隨著時間的推移迅速下降。短視頻創(chuàng)作者將感受到最初的影響,因為 Sora 無需真人即可實現(xiàn)幾乎免費(fèi)的視頻創(chuàng)作。

Sora的功能將得到改善,可能會影響中長視頻創(chuàng)作者。如果它的功能擴(kuò)展到一個多小時,甚至可以使用Sora制作電影和電視劇。?

許多人可能會懷疑 Sora 的能力,認(rèn)為它只會創(chuàng)造虛擬世界和角色。然而,這與事實相去甚遠(yuǎn)。Sora 在視頻制作中無縫地連接了現(xiàn)實和虛擬。即使是 AI 視頻平臺,雖然仍處于起步階段,但也可以攝取真人的數(shù)據(jù)來生成 AI 渲染的圖像。Sora作為數(shù)據(jù)黑匣子,毫不費(fèi)力地處理了這項任務(wù)。

例如,您可以將偶像的圖像輸入到 Sora 中進(jìn)行自學(xué)迭代。您提供的數(shù)據(jù)越多,與您的偶像相似的虛擬角色就越接近。然后,您可以描述動作,見證您的偶像在屏幕上栩栩如生。

例如,當(dāng)前的技術(shù)可以準(zhǔn)確地捕獲身體數(shù)據(jù)以實現(xiàn)精致的特征,當(dāng)這些特征輸入到 Sora 中并進(jìn)行自我迭代時,可以讓您的偶像無縫地表演。

從這個角度來看,Sora 將比 ChatGPT 更快、更深刻地催化我們生活的變革,重塑人類社會。此外,最重大的轉(zhuǎn)變尚未展開。

想象一下,在圖形表示中見證您的計劃快速發(fā)展,直觀地設(shè)想城市和道路建設(shè)、機(jī)場航站樓和其他大型基礎(chǔ)設(shè)施項目。對于軍事戰(zhàn)略家來說,借助人工智能將作戰(zhàn)計劃可視化不是無價的嗎?

有了 Sora,這變得毫不費(fèi)力。只需輸入數(shù)據(jù),Sora 就會直觀地表現(xiàn)出來。您提供的數(shù)據(jù)越多,表示就越復(fù)雜和詳細(xì)。??

當(dāng)然,這種進(jìn)步在很大程度上依賴于計算能力和存儲容量。憑借強(qiáng)大的計算能力,我們最終可能會目睹一個非凡的奇觀:整個人類社會以Sora的形式在我們面前的超級計算機(jī)上以圖形方式顯示。

這就引出了一個問題:現(xiàn)實世界與虛擬世界的區(qū)別是什么?這些領(lǐng)域中哪些是真實的,哪些是模擬的?此外,我們的現(xiàn)實可能只是另一個文明精心制作的模擬嗎?

在Sora的領(lǐng)域中,我們的認(rèn)知是自主的,還是我們只是一系列從屬于Sora的算法和電信號?這些問題既令人敬畏又令人恐懼,引發(fā)了深深的思考。

但是,現(xiàn)在,讓我們退后一步。預(yù)計到 2024 年,將出現(xiàn)眾多類似于 Sora 的 AI 視頻生成工具,邀請大家進(jìn)行觀察和推測。?

責(zé)任編輯:姜華 來源: 今日頭條
相關(guān)推薦

2024-02-19 07:58:01

OpenAI模型GPT

2024-02-26 16:55:51

Sora人工智能

2024-02-19 09:19:54

OpenAIAI模型人工智能

2024-02-23 15:53:13

OpenAISora人工智能

2009-10-28 18:10:47

TippingPoin突破性網(wǎng)絡(luò)安全平臺

2024-03-19 10:59:45

OpenAI人工智能

2024-02-19 00:05:00

視頻AI

2025-03-17 11:35:36

LLaDALLM大型語言模型

2024-02-19 08:56:00

AI模型

2024-03-26 09:58:52

模型技術(shù)

2023-07-05 15:48:07

虛擬現(xiàn)實VR

2014-10-29 19:45:10

Teradata

2024-04-07 14:56:22

技術(shù)應(yīng)用

2024-04-15 12:50:00

大型語言模型ReFT

2024-12-12 08:35:58

2025-03-05 11:23:44

2023-06-13 09:33:37

視頻阿里巴巴

2017-03-22 10:54:37

AR技術(shù)旅游業(yè)
點贊
收藏

51CTO技術(shù)棧公眾號