自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="fdhpb"></sub>

<s id="fdhpb"><li id="fdhpb"><menuitem id="fdhpb"></menuitem></li></s>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

OpenAI 推出 Sora：重新定義現(xiàn)實的突破性視頻生成模型

作者：架構(gòu)師老盧 2024-02-19 08:31:10

就在幾天前，當(dāng)大伊萬瞥了一眼手機(jī)快速查看社交媒體時，他被一條新聞驚呆了，差點讓他難以置信地吐出飲料！OpenAI 是去年發(fā)布的開創(chuàng)性 ChatGPT 背后的著名美國 AI 初創(chuàng)公司，剛剛公布了他們最新的奇跡：Vincent 視頻模型 Sora。

概述：就在幾天前，當(dāng)大伊萬瞥了一眼手機(jī)快速查看社交媒體時，他被一條新聞驚呆了，差點讓他難以置信地吐出飲料！OpenAI 是去年發(fā)布的開創(chuàng)性 ChatGPT 背后的著名美國 AI 初創(chuàng)公司，剛剛公布了他們最新的奇跡：Vincent 視頻模型 Sora。他們不僅介紹了 Sora，而且還發(fā)布了一些令人瞠目結(jié)舌的 AI 生成視頻供全世界觀看。根據(jù) OpenAI 的說法，這些視頻擁有三個顯著的特點：它們長達(dá) 60 秒，在單個視頻中提供多角度拍攝，并包含世界模型。從本質(zhì)上講，OpenAI 在視頻生成效果方面實現(xiàn)了質(zhì)的飛躍，使 Sora 有別于其前輩。那么，為ChatGPT做出貢獻(xiàn)的OpenAI這次是如何

就在幾天前，當(dāng)大伊萬瞥了一眼手機(jī)快速查看社交媒體時，他被一條新聞驚呆了，差點讓他難以置信地吐出飲料！OpenAI 是去年發(fā)布的開創(chuàng)性 ChatGPT 背后的著名美國 AI 初創(chuàng)公司，剛剛公布了他們最新的奇跡：Vincent 視頻模型 Sora。

他們不僅介紹了 Sora，而且還發(fā)布了一些令人瞠目結(jié)舌的 AI 生成視頻供全世界觀看。根據(jù) OpenAI 的說法，這些視頻擁有三個顯著的特點：它們長達(dá) 60 秒，在單個視頻中提供多角度拍攝，并包含世界模型。

從本質(zhì)上講，OpenAI 在視頻生成效果方面實現(xiàn)了質(zhì)的飛躍，使 Sora 有別于其前輩。

那么，為ChatGPT做出貢獻(xiàn)的OpenAI這次是如何實現(xiàn)AI視頻生成，并且?guī)缀鯇崿F(xiàn)實物的呢？這種AI視頻生成的技術(shù)優(yōu)勢是什么，它可能對我們的生活甚至人類社會產(chǎn)生什么影響？

Sora的技術(shù)

讓我們先解決第一個問題。目前，OpenAI 對其大型 AI 連續(xù)視頻模型的內(nèi)部工作原理和算法仍然相當(dāng)保密。

他們只是在社交媒體上暗示，OpenAI在“為模型提供多幀預(yù)測”方面取得了突破。

根據(jù)大伊萬的個人解釋，這似乎意味著空已經(jīng)獲得了通過自學(xué)深入和情感理解和構(gòu)建人類發(fā)出的通用命令語言的能力。

當(dāng)然，這是一個修訂版本，其中包含所需的單詞和表情符號，以及為清楚起見而重新格式化：

“通用語言”：在 OpenAI 的演示模式下，Sora 生成視頻的方法非常簡單。它所需要的只是英語（或其他語言）來描述所需的場景，完全繞過了傳統(tǒng) 3D 視頻生成的復(fù)雜性。

“深刻”：Sora理解人類語言并基于這種理解構(gòu)建視頻的能力確實很深遠(yuǎn)。視頻生成所需的細(xì)節(jié)和深度遠(yuǎn)遠(yuǎn)超過文本描述。如果ChatGPT可以通過文字實現(xiàn)某些細(xì)節(jié)，那么這些描述就必須在視頻中充分體現(xiàn)出來，展示出指數(shù)級的復(fù)雜性和深度。

“情感”：人工智能生成的圖像和視頻歷來難以傳達(dá)人類情感。例如，目前人工智能生成的肖像往往缺乏情感深度，只有程式化的微笑，導(dǎo)致一些評論家將它們貼上“死氣沉沉”的標(biāo)簽。然而，Sora 模型呈現(xiàn)的角色表現(xiàn)出令人難以置信的自然、合乎邏輯和微妙的情感，可以無縫地適應(yīng)周圍的環(huán)境。

借用《普羅米修斯》中的一句臺詞，他們就像“這些視頻中的演員......有靈魂“，比真實的人更像真實的個人。

當(dāng)然，在這些功能中，Big Ivan 認(rèn)為“構(gòu)建”是最關(guān)鍵的方面，正如 OpenAI 的“世界模型”概念所強(qiáng)調(diào)的那樣。

我們都認(rèn)識到，現(xiàn)實世界是按照特定的物理定律運(yùn)作的：物體服從重力，風(fēng)吹亂頭發(fā)，易碎物品在掉落時可以預(yù)見地破碎。

傳統(tǒng)的 3D 建模和 AI 模型在這一領(lǐng)域步維艱，在嘗試忠實地復(fù)制現(xiàn)實世界的物理時經(jīng)常會遇到問題。構(gòu)建我們的現(xiàn)實帶來了重大挑戰(zhàn)，在這個領(lǐng)域?qū)崿F(xiàn)準(zhǔn)確性仍然是一項艱巨的任務(wù)。?

在這方面，空表現(xiàn)出了幾乎與現(xiàn)實相提并論的非凡能力。???

例如，它發(fā)布了人工智能視頻，展示了一只在雪地里嬉戲的金毛小狗，一個玩蠟燭的異想天開的生物，以及人們在日本櫻花盛開的季節(jié)悠閑漫步。這些視頻嚴(yán)格遵循物理定律，展示了與因果關(guān)系完全一致的無縫過渡和邏輯序列。

此外，根據(jù) OpenAI 的說法，Sora 的“構(gòu)建”能力可以實現(xiàn)類似于現(xiàn)實世界的無限細(xì)節(jié)。與受幀數(shù)限制的傳統(tǒng) 3D 建模不同，Sora 可以無休止地復(fù)制細(xì)節(jié)。再加上其近乎真實的感知和聽覺能力，這種構(gòu)建世界的能力確實令人敬畏。

索拉的影響

因此，像ChatGPT一樣，Sora無疑會對我們的日常生活產(chǎn)生重大影響。前者對我們?nèi)粘Ｉ畹挠绊戇h(yuǎn)遠(yuǎn)超出了僅僅產(chǎn)生文本輸出或進(jìn)行隨意對話。一些公司已經(jīng)開始利用ChatGPT來制定計劃，從而節(jié)省了大量時間并提高了運(yùn)營效率。

與 Sora 相比，ChatGPT 對社會的影響可以忽略不計。Sora的出現(xiàn)將導(dǎo)致廣泛采用，成本將隨著時間的推移迅速下降。短視頻創(chuàng)作者將感受到最初的影響，因為 Sora 無需真人即可實現(xiàn)幾乎免費(fèi)的視頻創(chuàng)作。

Sora的功能將得到改善，可能會影響中長視頻創(chuàng)作者。如果它的功能擴(kuò)展到一個多小時，甚至可以使用Sora制作電影和電視劇。?

許多人可能會懷疑 Sora 的能力，認(rèn)為它只會創(chuàng)造虛擬世界和角色。然而，這與事實相去甚遠(yuǎn)。Sora 在視頻制作中無縫地連接了現(xiàn)實和虛擬。即使是 AI 視頻平臺，雖然仍處于起步階段，但也可以攝取真人的數(shù)據(jù)來生成 AI 渲染的圖像。Sora作為數(shù)據(jù)黑匣子，毫不費(fèi)力地處理了這項任務(wù)。

例如，您可以將偶像的圖像輸入到 Sora 中進(jìn)行自學(xué)迭代。您提供的數(shù)據(jù)越多，與您的偶像相似的虛擬角色就越接近。然后，您可以描述動作，見證您的偶像在屏幕上栩栩如生。

例如，當(dāng)前的技術(shù)可以準(zhǔn)確地捕獲身體數(shù)據(jù)以實現(xiàn)精致的特征，當(dāng)這些特征輸入到 Sora 中并進(jìn)行自我迭代時，可以讓您的偶像無縫地表演。

從這個角度來看，Sora 將比 ChatGPT 更快、更深刻地催化我們生活的變革，重塑人類社會。此外，最重大的轉(zhuǎn)變尚未展開。

想象一下，在圖形表示中見證您的計劃快速發(fā)展，直觀地設(shè)想城市和道路建設(shè)、機(jī)場航站樓和其他大型基礎(chǔ)設(shè)施項目。對于軍事戰(zhàn)略家來說，借助人工智能將作戰(zhàn)計劃可視化不是無價的嗎？

有了 Sora，這變得毫不費(fèi)力。只需輸入數(shù)據(jù)，Sora 就會直觀地表現(xiàn)出來。您提供的數(shù)據(jù)越多，表示就越復(fù)雜和詳細(xì)。??

當(dāng)然，這種進(jìn)步在很大程度上依賴于計算能力和存儲容量。憑借強(qiáng)大的計算能力，我們最終可能會目睹一個非凡的奇觀：整個人類社會以Sora的形式在我們面前的超級計算機(jī)上以圖形方式顯示。

這就引出了一個問題：現(xiàn)實世界與虛擬世界的區(qū)別是什么？這些領(lǐng)域中哪些是真實的，哪些是模擬的？此外，我們的現(xiàn)實可能只是另一個文明精心制作的模擬嗎？

在Sora的領(lǐng)域中，我們的認(rèn)知是自主的，還是我們只是一系列從屬于Sora的算法和電信號？這些問題既令人敬畏又令人恐懼，引發(fā)了深深的思考。

但是，現(xiàn)在，讓我們退后一步。預(yù)計到 2024 年，將出現(xiàn)眾多類似于 Sora 的 AI 視頻生成工具，邀請大家進(jìn)行觀察和推測。?

責(zé)任編輯：姜華來源：今日頭條

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

^{<blockquote id="3dcpd"></blockquote>}