自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sup id="0rifh"><rt id="0rifh"></rt></sup>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

被Luma刷屏了！零成本上手做大片的時(shí)代已至！驚奇發(fā)現(xiàn)：背后的技術(shù)與Sora大有不同！原創(chuàng)

51CTO技術(shù)棧

發(fā)布于 2024-6-13 16:48

瀏覽

0收藏

出品 | 51CTO技術(shù)棧（微信號(hào)：blog51cto）

短視頻賽道的戰(zhàn)火已經(jīng)徹底卷起來了，今天，一款讓全球網(wǎng)友興奮到刷屏的視頻生成器上線了！

Dream Machine，這款可以根據(jù)文本和圖像生成AI視頻的工具向公眾開放，免費(fèi)，免費(fèi)，免費(fèi)！關(guān)鍵還在于，跟傳說中的Sora技術(shù)路線大不相同，2分鐘內(nèi)就能生成！

話不多說，在解讀技術(shù)之前，先看效果（什么才是真正的饕餮盛宴）！

1.大片預(yù)告—Justin

有人搶先體驗(yàn)了DreamMachine的人甚至生成了非常震撼預(yù)告片，戰(zhàn)爭、歌唱家、魔法師、騎士、海盜船長、騎手被處理的渾然天成。

這位體驗(yàn)者Justin贊嘆道：你以為LumaLabsAI只是關(guān)于酷炫的3D物體。錯(cuò)了！事實(shí)證明，數(shù)千個(gè)高斯條紋可以輕松變成強(qiáng)大的視頻生成模型。

被Luma刷屏了！零成本上手做大片的時(shí)代已至！驚奇發(fā)現(xiàn)：背后的技術(shù)與Sora大有不同！-AI.x社區(qū)

2.新世紀(jì)渴望——Kaku Drop

被Luma刷屏了！零成本上手做大片的時(shí)代已至！驚奇發(fā)現(xiàn)：背后的技術(shù)與Sora大有不同！-AI.x社區(qū)

“一個(gè)新世代已經(jīng)開始。我們?cè)诳萍祭顺敝兄厣l(fā)展。我們展望未來，不耽念過去，并不斷向前。”不同衣著風(fēng)格的女生四處透露出福音戰(zhàn)士的日系動(dòng)畫風(fēng)格，面容卻出奇得保持一致，場景構(gòu)思十分前瞻新奇。網(wǎng)友驚呼：創(chuàng)作的進(jìn)入門檻正在被徹底打破！

3. U WREE MINE —Next on Now

被Luma刷屏了！零成本上手做大片的時(shí)代已至！驚奇發(fā)現(xiàn)：背后的技術(shù)與Sora大有不同！-AI.x社區(qū)

這里就不得不驚嘆Luma最新模型太厲害了！電視機(jī)屏幕里的畫面一致性做得非常棒，而且鏡頭拉伸、角度的變換、人物動(dòng)作的處理幾乎處理得堪稱完美。

4.奇幻生物—Curious Reuge

被Luma刷屏了！零成本上手做大片的時(shí)代已至！驚奇發(fā)現(xiàn)：背后的技術(shù)與Sora大有不同！-AI.x社區(qū)

再體驗(yàn)之后，創(chuàng)作者Curious大吃一驚，這個(gè)視頻主要是通過圖像轉(zhuǎn)視頻的功能聲生成的。海底的白鯨、雨林的變色龍、非洲草原上獵豹……似乎到了這里全都披上了一層夢(mèng)幻的籠紗，讓人誤以為進(jìn)入到了堪比“猛獸俠”的火種時(shí)代。

以上更多是圖生視頻，文生視頻的能力如何？

小編也第一時(shí)間進(jìn)行了測試。

被Luma刷屏了！零成本上手做大片的時(shí)代已至！驚奇發(fā)現(xiàn)：背后的技術(shù)與Sora大有不同！-AI.x社區(qū)

提示詞：小米汽車，行駛在跨江大橋上。

被Luma刷屏了！零成本上手做大片的時(shí)代已至！驚奇發(fā)現(xiàn)：背后的技術(shù)與Sora大有不同！-AI.x社區(qū)

提示詞：牛頓坐在蘋果樹下，一顆紅蘋果砸到了他的頭。

被Luma刷屏了！零成本上手做大片的時(shí)代已至！驚奇發(fā)現(xiàn)：背后的技術(shù)與Sora大有不同！-AI.x社區(qū)

提示詞：Newton was sitting under an apple tree when a red apple hit him on the head.

小編看到牛頓竟然會(huì)被蘋果這樣“砸”，實(shí)在是懷疑自己的提示詞出了問題，哭笑不得，這一顆接一顆的蘋果掉下來，即便沒有砸到頭，砸到手，不也得砸出事情來！

一、怎么做到的？

根據(jù)圖像生成的短片為什么這么逼真？

相信大家都知道《珍珠耳環(huán)的少女》這幅畫作，Dream Machine可以做到分鐘內(nèi)生成3D版并按照提示生成相應(yīng)的動(dòng)作和鏡頭切換，大家可以看下面的視頻，非常驚艷。

被Luma刷屏了！零成本上手做大片的時(shí)代已至！驚奇發(fā)現(xiàn)：背后的技術(shù)與Sora大有不同！-AI.x社區(qū)

對(duì)比之前的鬼畜gif，是不是瞬間高大上了起來，相信之后的動(dòng)態(tài)表情包有了更加無敵的生成器了！

想到這里，小編果斷想到能不能讓齊白石老先生的“蝦”活過來！效果非常絲滑，鏡頭感也是拉滿了，蝦腿游弋的動(dòng)作清晰可見！

被Luma刷屏了！零成本上手做大片的時(shí)代已至！驚奇發(fā)現(xiàn)：背后的技術(shù)與Sora大有不同！-AI.x社區(qū)

二、不同于Sora的技術(shù)：三維重建術(shù)

小編從技術(shù)交流群中了解到，一位技術(shù)專家跟Luma的技術(shù)團(tuán)隊(duì)做了交流，Dream Machine的實(shí)現(xiàn)原理跟類Sora技術(shù)并不相同，很多工作都是從一項(xiàng)名叫NeRF的技術(shù)做的，即：先根據(jù)提示詞生成3D場景，然后在渲染。

所以對(duì)于3D場景，效果就會(huì)不錯(cuò)，而對(duì)于較難3D重建的場景，比如“吃面”，效果就不一定好。

被Luma刷屏了！零成本上手做大片的時(shí)代已至！驚奇發(fā)現(xiàn)：背后的技術(shù)與Sora大有不同！-AI.x社區(qū) 圖片

NeRF技術(shù)，全稱Neural Radiance Fields，即神經(jīng)輻射場，是一種使用神經(jīng)網(wǎng)絡(luò)來隱式表達(dá)3D場景的技術(shù)，是Luma AI構(gòu)建3D內(nèi)容的核心。這一套最初由UC Berkeley和Google發(fā)布的深度學(xué)習(xí)系統(tǒng)，可以基于少量的2D圖像，對(duì)3D場景的幾何形狀和外觀進(jìn)行建模。

這項(xiàng)技術(shù)應(yīng)用非常廣泛，包括但不限于3D建模、自動(dòng)駕駛、導(dǎo)航系統(tǒng)等領(lǐng)域。

除此之外，Luma AI增長負(fù)責(zé)人Barkley Dai還表示，基于NeRF和Gaussian Splatting 3D重建技術(shù)，Luma AI可以基于2D圖像數(shù)據(jù)快速構(gòu)建高質(zhì)量3D數(shù)據(jù)，用于機(jī)器學(xué)習(xí)和算法訓(xùn)練。

減少生成高質(zhì)量3D內(nèi)容所需的算力資源和時(shí)間，則是AI 3D生成技術(shù)落地的關(guān)鍵。自今年以來，Text to 3D所耗時(shí)長已經(jīng)從小時(shí)級(jí)，縮減到了分鐘級(jí)。

值得注意的是，去年11月，Luma AI在Discord上發(fā)布了了Text to 3D工具Genie，則將Text to 3D所耗時(shí)長縮減到秒級(jí)?；诖罅?D形狀、結(jié)構(gòu)和場景數(shù)據(jù)進(jìn)行深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練，Genie建立了對(duì)語義和3D空間幾何對(duì)應(yīng)關(guān)系的理解能力。

三、Luma核心團(tuán)隊(duì)

成立于2021年，Luma AI是美國加州舊金山灣區(qū)的初創(chuàng)企業(yè)，該公司聚焦于3D內(nèi)容生成技術(shù)，提供3D內(nèi)容生成和3D內(nèi)容重建技術(shù)解決方案。

Luma AI的核心團(tuán)隊(duì)，擁有海外頭部大廠和高校的履歷。創(chuàng)始人兼CEO Amit Jain出身蘋果 AR/VR 部門，在3D計(jì)算機(jī)視覺、深度技術(shù)產(chǎn)品等方面有豐富經(jīng)驗(yàn)。

被Luma刷屏了！零成本上手做大片的時(shí)代已至！驚奇發(fā)現(xiàn)：背后的技術(shù)與Sora大有不同！-AI.x社區(qū) 圖片

創(chuàng)始人兼CTO Alex Yu畢業(yè)于UC Berkeley，曾與人工智能研究實(shí)驗(yàn)室教授Angjoo Kanazawa共同進(jìn)行NeRF（Neural Radiance Fields，神經(jīng)輻射場）相關(guān)的3D計(jì)算機(jī)視覺研究。

被Luma刷屏了！零成本上手做大片的時(shí)代已至！驚奇發(fā)現(xiàn)：背后的技術(shù)與Sora大有不同！-AI.x社區(qū) 圖片

首席科學(xué)家Jiaming Song，曾就讀于清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系，獲得了斯坦福大學(xué)博士學(xué)位，在 Stefano Ermon 教授的指導(dǎo)下學(xué)習(xí)機(jī)器學(xué)習(xí)和生成模型。在加入 Luma 之前，他曾參與 NVIDIA AI Foundations 的圖像/視頻/3D 生成模型的開發(fā)。

Jiaming目前正在研究生成 3D 內(nèi)容的基礎(chǔ)模型。他參與了 DDIM（第一個(gè)快速擴(kuò)散模型采樣器）和 SDEdit（擴(kuò)散模型中第一個(gè)圖像到圖像的轉(zhuǎn)換方法）的開發(fā)。

被Luma刷屏了！零成本上手做大片的時(shí)代已至！驚奇發(fā)現(xiàn)：背后的技術(shù)與Sora大有不同！-AI.x社區(qū) 圖片

首席科學(xué)顧問金澤安珠（Angjoo Kanazawa）是加州大學(xué)伯克利分校 EECS 系的助理教授。她的研究領(lǐng)域是計(jì)算機(jī)視覺、計(jì)算機(jī)圖形學(xué)和機(jī)器學(xué)習(xí)的交叉領(lǐng)域，專注于日常照片和視頻背后的動(dòng)態(tài) 3D 世界的視覺感知。她對(duì)重建世界上的一切感到興奮！她是斯隆研究員 (2023)，熱衷于創(chuàng)造有用的事物。她在馬里蘭大學(xué)帕克分校獲得博士學(xué)位。

被Luma刷屏了！零成本上手做大片的時(shí)代已至！驚奇發(fā)現(xiàn)：背后的技術(shù)與Sora大有不同！-AI.x社區(qū) 圖片

這里，給大家一個(gè)傳送門：

??https://lumalabs.ai/dream-machine/??

趕緊開啟自己的大片之旅吧！

對(duì)了，據(jù)隔壁桌愛玩文生視頻的同事反映，她最愛的還是國產(chǎn)快手的“可靈”，吸引她的有三點(diǎn)：國產(chǎn)自研的，中國人更懂中國人；第二點(diǎn)是，大幅度的合理運(yùn)動(dòng)也可以生成；第三點(diǎn)就是時(shí)長可以高達(dá)2分鐘，而且支持自由的寬高比。當(dāng)然，據(jù)悉，可靈也采用了類Sora的技術(shù)架構(gòu)?！緦?duì)話OpenAI，Sora你還不對(duì)外開放？】

話說回來，大家更喜歡哪款？

本文轉(zhuǎn)載自??51CTO技術(shù)棧??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

基于知識(shí)圖譜的少樣本和零樣本學(xué)習(xí)綜述

mb5f8eba9bdb0af ? 2974瀏覽 ? 0回復(fù)
今日arXiv最熱NLP大模型論文：逆向解析Sora背后的秘密，談AI視頻的機(jī)遇與挑戰(zhàn)

pangguiyu ? 2820瀏覽 ? 0回復(fù)
“企業(yè)級(jí)AI元年”已至，AI如何更好賦能企業(yè)發(fā)展？

liutao988 ? 2816瀏覽 ? 0回復(fù)
Sora大片真相：人工特效參與，被指誤導(dǎo)大眾

Crystalcxt ? 2397瀏覽 ? 0回復(fù)
媲美Sora的國產(chǎn)視頻生成器背后技術(shù)探秘

angel ? 8643瀏覽 ? 0回復(fù)
GPT-4o背后可能的語音技術(shù)

魚蟲子 ? 2820瀏覽 ? 0回復(fù)
AI 視頻戰(zhàn)火：從 Sora 到快手可靈和 Luma 的新時(shí)代

wsp_ping ? 3416瀏覽 ? 0回復(fù)
少或零樣本異常檢測最新研究跟蹤

angel ? 3954瀏覽 ? 0回復(fù)
手寫Sora中的Diffusion Transformer(DiT)——探索最先進(jìn)視頻生成器背后的秘密

angel ? 2372瀏覽 ? 0回復(fù)
OpenAI 的 ?Sora 技術(shù)報(bào)告詳解

wsp_ping ? 2006瀏覽 ? 0回復(fù)
刷屏了！Genie 2開啟文生游戲時(shí)代，可交互的世界模型震撼登場！背后團(tuán)隊(duì)曝光；12天直播能否截胡老對(duì)手

51CTO技術(shù)棧 ? 2064瀏覽 ? 0回復(fù)
?探索Sora背后秘密：結(jié)合OpenAI Sora技術(shù)報(bào)告來看其能力和技術(shù)點(diǎn)

arnoldzhw ? 2308瀏覽 ? 0回復(fù)
LazyGrapgRAG：與GraphRAG完全不同的方法

PyTorch研習(xí)社 ? 2442瀏覽 ? 0回復(fù)
2025年大模型與Transformer架構(gòu)：技術(shù)前沿與未來趨勢報(bào)告

歐米伽未來研究所 ? 6064瀏覽 ? 0回復(fù)
DeepSeek 驚艷背后的技術(shù)架構(gòu)創(chuàng)新剖析

玄姐聊AGI ? 8231瀏覽 ? 0回復(fù)
大模型在零樣本面部情緒標(biāo)注中的突破與應(yīng)用

xuxiangda ? 2156瀏覽 ? 0回復(fù)
AI/ML 熱潮驅(qū)動(dòng)的過度工程：流行語狂熱背后的隱形成本

丟翅膀的魚 ? 1444瀏覽 ? 0回復(fù)
不同神經(jīng)網(wǎng)絡(luò)之間的區(qū)別，僅僅只是網(wǎng)絡(luò)結(jié)構(gòu)的不同，明白了這個(gè)你才能知道應(yīng)該怎么學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

AI探索時(shí)代 ? 1592瀏覽 ? 0回復(fù)
OWL Agent 實(shí)戰(zhàn)指南：零成本打造你的全能開源 AI 打工人

墨風(fēng)如雪小站 ? 944瀏覽 ? 0回復(fù)

51CTO技術(shù)棧

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

微軟突然封鎖Cursor，全面禁用C、C++、C#擴(kuò)展，網(wǎng)友：理解微軟，Cursor白嫖VSCode 0回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇：蘋果Siri將迎來AI時(shí)代最強(qiáng)“大修”！虛擬助手將幫助用戶操控每個(gè)APP，網(wǎng)友：我愿稱之為AGI

下一篇：市值再登頂！蘋果為何放下身段提“AI”？庫克回應(yīng)質(zhì)疑：我們?cè)谒接性朴?jì)算上煞費(fèi)苦心，蘋果智能不太可能制造

社區(qū)精華內(nèi)容

目錄