自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<kbd id="b9dws"></kbd>

<ruby id="b9dws"><samp id="b9dws"><form id="b9dws"></form></samp></ruby>

<sub id="b9dws"></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

AI恐怖體操視頻腿腳亂飛、大變活人，LeCun：視頻生成模型根本不懂物理

2024-07-01 13:02:53

前段時間SD 3翻車，同樣對人體生成效果不好，網(wǎng)友也討論過這一問題，過于嚴(yán)格的數(shù)據(jù)審核，可能誤刪了一些無害的成人圖像，影響了模型對人體結(jié)構(gòu)的理解。

一段AI生成的體操視頻，引發(fā)近百萬網(wǎng)友圍觀，LeCun等一眾大佬還因為它吵起來了。

體操表演，emmmm怎么不算呢？

通過視頻右上角的水印，此段視頻正是由那個一度被認(rèn)為是“下一代”文生視頻的Dream Machine（來自Luma AI）生成的。

大伙兒看后紛紛坐不住，圍繞此討論的，是AI視頻領(lǐng)域的一個熟悉的話題：AI是否理解物理規(guī)律。

LeCun直接開麥：

視頻生成模型不理解基本物理知識。更不用說人體了。

圖片

華盛頓大學(xué)計算機科學(xué)教授Pedro Domingos看后也“搖了搖頭”：

AGI可能并不會像一些人預(yù)期的那樣即將到來。

圖片

畸變?nèi)甘畴x譜

自Sora問世以來，“AI是否理解物理規(guī)律”這個話題就被越來越多人關(guān)注。

下面這段Sora生成的“寄居蟹用燈泡當(dāng)外殼的夜間場面”是個經(jīng)典的例子，海浪與沙灘的互動非常細(xì)膩，寄居蟹腿上的纖毛也活靈活現(xiàn)。

圖片

對比真實拍攝的類似場景照片，也就燈泡沒有電源不應(yīng)該亮這一個明顯破綻了。

圖片

最近Luma AI的Dream Machine也一樣，生成的第一視角探廢棄房子真實感拉滿：

圖片

由此，不少人認(rèn)為Sora、LUMA等的視頻生成模型已經(jīng)理解了簡單的物理規(guī)律。

然鵝，這次被放出的視頻著實有點太離譜。

不僅腿腳亂飛，頻頻上演大變活人：

圖片

就這高難度的空中懸浮翻跟頭，也是牛頓都要被氣活了的節(jié)奏：

圖片

以至于網(wǎng)友看后還表示，說恐怖大可不必，說搞笑還差不多。

圖片

如此抽象，LeCun直接評論視頻生成模型不會懂物理。

他還進(jìn)一步解釋，Sora或者其它視頻生成模型都有類似的問題，視頻生成技術(shù)無疑也肯定會隨時間推移而進(jìn)步。

但：

真正理解物理的學(xué)習(xí)系統(tǒng)并不會具有生成性。就像鳥類、哺乳動物等比任何視頻生成系統(tǒng)更了解物理。然而，它們都不能生成詳細(xì)的視頻。

圖片

類似還有另一種思考：

即使AI視頻生成模型之后會進(jìn)化的很好，生成的視頻質(zhì)量“完美”，那么就意味著它理解物理了？

圖片

LeCun等的觀點，立馬引起網(wǎng)友的質(zhì)疑：

鳥和哺乳動物也會生成詳細(xì)的視頻，只不過是在大腦中生成無法將其具像化。

圖片

然鵝，這種反駁并未說服LeCun。

圖片

此外，還有不少人持反對意見。

例如，谷歌DeepMind/Brain團隊研究員Lucas Beyer就指出：

這就像是展示一個由幾年前的Dall·E mini生成的圖像，然后稱當(dāng)前的圖像生成方式注定失敗一樣。

畢竟，之前生圖模型生成的圖像be like：

圖片

至于模型會生成如此離譜的視頻？

有網(wǎng)友認(rèn)為是缺乏體操表演數(shù)據(jù)，還有網(wǎng)友認(rèn)為是身體部位的模糊處理，使得模型無法理解人體結(jié)構(gòu)，繼而不能保證肢體動作的連貫性。

圖片

視頻生成在計算上更為復(fù)雜，并且具有高度的上下文相關(guān)性，對詳細(xì)標(biāo)注的訓(xùn)練數(shù)據(jù)有更大的需求，這些需求現(xiàn)在還未得到充分滿足。

圖片

前段時間SD 3翻車，同樣對人體生成效果不好，網(wǎng)友也討論過這一問題，過于嚴(yán)格的數(shù)據(jù)審核，可能誤刪了一些無害的成人圖像，影響了模型對人體結(jié)構(gòu)的理解。

圖片

One More Thing

除了Luma AI的Dream Machine生成體操視頻大翻車，Runway的Gen-3也……

圖片

同款三頭六臂：

圖片

同款空中懸浮絕活：

圖片

參考鏈接：
[1]https://x.com/ylecun/status/1807497091964449266
[2]https://x.com/giffmana/status/1807511985807908926
[3]https://x.com/EricDai_BioE/status/1807540558216454281
[4]https://x.com/Grady_Booch/status/1807556807982010451

責(zé)任編輯：武曉燕來源：量子位

人體生成 AI 圖像

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營