自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<kbd id="htc0f"><font id="htc0f"><meter id="htc0f"></meter></font></kbd>

<sub id="htc0f"></sub>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

OpenAI上新sCM！生成速度提升50倍，Scaling Law 再創(chuàng)奇跡：兩步采樣就出圖，實(shí)時(shí)視頻時(shí)代或?qū)㈤_啟！原創(chuàng)

51CTO技術(shù)棧

發(fā)布于 2024-10-25 13:48

瀏覽

0收藏

傳統(tǒng)擴(kuò)散模型要過(guò)時(shí)了？OpenAI找到一種新方法，直接把生成速度提高50倍！

擴(kuò)散模型在生成式 AI 領(lǐng)域的重要性不言而喻，把生成逼真的圖像、3D 模型、音頻和視頻變?yōu)榱爽F(xiàn)實(shí)。

但是，擴(kuò)散模型依然有個(gè)致命bug——采樣速度太慢。

OpenAI研究的新方法，被稱為 sCM（連續(xù)時(shí)間一致性模型）。

sCM 在僅使用兩個(gè)采樣步驟的情況下，實(shí)現(xiàn)了與領(lǐng)先擴(kuò)散模型相當(dāng)?shù)臉颖举|(zhì)量。

來(lái)感受下 sCM 的速度：

OpenAI上新sCM！生成速度提升50倍，Scaling Law 再創(chuàng)奇跡：兩步采樣就出圖，實(shí)時(shí)視頻時(shí)代或?qū)㈤_啟！-AI.x社區(qū)

那么sCM為什么這么快呢，我們一起看看。

1.提速50倍：Scaling Law 再次出奇跡

在剛才的實(shí)例里，右側(cè)蝴蝶逐步清晰，展示了當(dāng)前擴(kuò)散模型的能力。

該方法的采樣通常需要數(shù)十到數(shù)百個(gè)連續(xù)步驟來(lái)生成單個(gè)樣本，這限制了它們?cè)趯?shí)時(shí)應(yīng)用中的效率和可擴(kuò)展性。

雖然，此前已經(jīng)開發(fā)了各種蒸餾技術(shù)來(lái)加速采樣，但它們往往伴隨著一些限制，例如高計(jì)算成本、復(fù)雜的訓(xùn)練過(guò)程和降低的樣本質(zhì)量。

而sCM則不同，在此前一致性模型的研究基礎(chǔ)上，OpenAI簡(jiǎn)化了公式，并進(jìn)一步穩(wěn)定了連續(xù)時(shí)間一致性模型的訓(xùn)練過(guò)程。

不得不說(shuō)，Scaling Law 還是大力出奇跡。

這個(gè)方法一下使得OpenAI研究人員能將連續(xù)時(shí)間一致性模型的訓(xùn)練擴(kuò)展到前所未有的規(guī)模！

具體有多大呢？——在 ImageNet 數(shù)據(jù)集上以 512×512 分辨率處理 15 億參數(shù)的模型。

sCM 僅使用兩個(gè)采樣步驟就能生成與擴(kuò)散模型相當(dāng)?shù)臉颖举|(zhì)量，實(shí)現(xiàn)了大約 50 倍的時(shí)間加速。例如，OpenAI的最大模型（15 億參數(shù)）在一塊 A100 GPU 上只需 0.11 秒即可生成一個(gè)樣本，而無(wú)需任何推理優(yōu)化。

OpenAI這波太牛了，通過(guò)系統(tǒng)優(yōu)化，這個(gè)提速來(lái)得迅猛又輕松，感覺再升級(jí)的DALL-E 4已經(jīng)不遠(yuǎn)了！

報(bào)告還提到，為了進(jìn)行嚴(yán)格的評(píng)估，OpenAI研究者通過(guò)比較樣本質(zhì)量（使用標(biāo)準(zhǔn)的 FID 得分，分?jǐn)?shù)越低越好）和有效采樣計(jì)算（估算生成每個(gè)樣本所需的總計(jì)算成本）來(lái)對(duì) sCM 與其他最先進(jìn)的生成模型進(jìn)行了基準(zhǔn)測(cè)試。

結(jié)果如下所示，兩步 sCM 生成的樣本質(zhì)量可與最佳的先前方法相媲美，而其有效采樣計(jì)算成本不到 10%，大大加快了采樣過(guò)程。

OpenAI上新sCM！生成速度提升50倍，Scaling Law 再創(chuàng)奇跡：兩步采樣就出圖，實(shí)時(shí)視頻時(shí)代或?qū)㈤_啟！-AI.x社區(qū) 圖片

2.工作原理揭秘：為什么一致性模型能提速？

一致性模型與擴(kuò)散模型不同：擴(kuò)散模型需要通過(guò)大量去噪步驟逐步生成樣本；而一致性模型的目標(biāo)是在一步中將噪聲直接轉(zhuǎn)換為無(wú)噪聲的樣本。

看圖表會(huì)更加直觀，下圖中：藍(lán)線代表擴(kuò)散模型逐步采樣的過(guò)程，而紅線則展示了一致性模型更直接、加速的采樣路徑。

通過(guò)使用一致性訓(xùn)練或一致性蒸餾等技術(shù)，一致性模型可以被訓(xùn)練成在顯著減少步驟的情況下生成高質(zhì)量樣本，這使它們?cè)谛枰焖偕傻膶?shí)際應(yīng)用中極具吸引力。

OpenAI上新sCM！生成速度提升50倍，Scaling Law 再創(chuàng)奇跡：兩步采樣就出圖，實(shí)時(shí)視頻時(shí)代或?qū)㈤_啟！-AI.x社區(qū) 圖片

在研究中，OpenAI團(tuán)隊(duì)在ImageNet 512x512上訓(xùn)練了一個(gè)具有15億參數(shù)的連續(xù)時(shí)間一致性模型，以下是一些兩步采樣結(jié)果。

OpenAI上新sCM！生成速度提升50倍，Scaling Law 再創(chuàng)奇跡：兩步采樣就出圖，實(shí)時(shí)視頻時(shí)代或?qū)㈤_啟！-AI.x社區(qū) 圖片

sCM的訓(xùn)練方式也很有趣，——偷師擴(kuò)散模型，即通過(guò)從一個(gè)預(yù)訓(xùn)練的擴(kuò)散模型中提取知識(shí)得以訓(xùn)練。

一個(gè)重要的發(fā)現(xiàn)是，隨著sCM和教師擴(kuò)散模型的共同擴(kuò)展，sCM的性能按比例提高。具體來(lái)說(shuō)，樣本質(zhì)量的相對(duì)差異（通過(guò)FID分?jǐn)?shù)比率來(lái)衡量）在不同規(guī)模的模型中保持一致，這導(dǎo)致樣本質(zhì)量的絕對(duì)差異在模型擴(kuò)展時(shí)逐漸減小。此外，增加sCM的采樣步驟進(jìn)一步縮小了質(zhì)量差距。值得注意的是，sCM的兩步采樣已經(jīng)與教師擴(kuò)散模型的采樣質(zhì)量相當(dāng)（相對(duì)差異不到10%），而教師擴(kuò)散模型需要數(shù)百步才能生成樣本。

OpenAI上新sCM！生成速度提升50倍，Scaling Law 再創(chuàng)奇跡：兩步采樣就出圖，實(shí)時(shí)視頻時(shí)代或?qū)㈤_啟！-AI.x社區(qū) 圖片

3.寫在最后：仍有缺陷，仍需探索

從上圖也可以看出，目前最好的sCM仍然依賴于預(yù)訓(xùn)練的擴(kuò)散模型進(jìn)行初始化和蒸餾，因此與教師擴(kuò)散模型相比，樣本質(zhì)量仍存在小而持續(xù)的差距。

此外，報(bào)告中寫道，F(xiàn)ID作為衡量樣本質(zhì)量的指標(biāo)本身也有局限性；接近的FID分?jǐn)?shù)并不總是反映實(shí)際的樣本質(zhì)量，反之亦然。因此，sCM的質(zhì)量可能需要根據(jù)特定應(yīng)用的需求以不同方式進(jìn)行評(píng)估。

OpenAI表示，將繼續(xù)致力于開發(fā)具有更快推理速度和更高樣本質(zhì)量的生成模型，相信這些進(jìn)展將為實(shí)時(shí)、高質(zhì)量生成式AI在廣泛領(lǐng)域中的應(yīng)用開啟新的可能性。

本文轉(zhuǎn)載自??51CTO技術(shù)棧??????

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

Scaling Law被證偽，谷歌研究人員實(shí)錘研究力挺小模型更高效，不局限于特定采樣技術(shù)！

51CTO技術(shù)棧 ? 3096瀏覽 ? 0回復(fù)
GPT超越擴(kuò)散、視覺生成Scaling Law時(shí)刻！北大&字節(jié)提出VAR范式

輕薄滴假象 ? 2412瀏覽 ? 0回復(fù)
史上首個(gè)實(shí)時(shí)AI視頻生成技術(shù)：DiT通用，速度提升10.6倍

輕薄滴假象 ? 2963瀏覽 ? 0回復(fù)
揭秘YOLO-World：顛覆傳統(tǒng)，開啟實(shí)時(shí)開放詞匯檢測(cè)新時(shí)代

sword_hero ? 4931瀏覽 ? 0回復(fù)
長(zhǎng)視頻生成速度提升100倍！新加坡國(guó)立提出Video-Infinity：分布式長(zhǎng)視頻生成

angel ? 2765瀏覽 ? 0回復(fù)
視頻生成控制提升幾十倍，新一代輕量級(jí)ControlNeXt火了，賈佳亞團(tuán)隊(duì)正挑戰(zhàn)Scaling Law

輕薄滴假象 ? 2138瀏覽 ? 0回復(fù)
OpenAI o1模型推理能力大幅提升的背后：重復(fù)采樣如何提升AI推理能力

Syrupup ? 3341瀏覽 ? 0回復(fù)
剛剛，OpenAI發(fā)布sCM提升50倍效率，擴(kuò)散模型重大技術(shù)突破！

玄姐聊AGI ? 1856瀏覽 ? 0回復(fù)
清華大學(xué)提出1-Bit FQT：將全量化訓(xùn)練極限推到極致,訓(xùn)練速度提升5倍！

AI論文解讀 ? 2274瀏覽 ? 0回復(fù)
新Scaling Law浮出水面！OpenAI內(nèi)部員工爆料下一代模型Orion性能堪憂

51CTO技術(shù)棧 ? 1946瀏覽 ? 0回復(fù)
公開版 OpenAI Sora 震撼登場(chǎng)！獨(dú)立產(chǎn)品，開服就被擠爆！視頻可控性拉滿！奧特曼：視頻的GPT時(shí)代開啟

51CTO技術(shù)棧 ? 1885瀏覽 ? 0回復(fù)
ChatGPT解鎖高級(jí)視頻對(duì)話、屏幕共享，實(shí)時(shí)交互時(shí)代

Aceryt ? 8502瀏覽 ? 0回復(fù)
看了這么多文章，終于理解了 Scaling Law

芝士AI吃魚 ? 5100瀏覽 ? 0回復(fù)
Model2Vec：RAG 加速新引擎，模型瘦身15倍，速度提升500倍，最新emb benchmark

鴻煊的學(xué)習(xí)筆記 ? 2153瀏覽 ? 0回復(fù)
DeepSeek-R1-Zero激發(fā)了推理Scaling Law

ceesoft ? 1913瀏覽 ? 0回復(fù)
OpenAI將開源 o3-mini，或適合手機(jī)大模型

Aceryt ? 1603瀏覽 ? 0回復(fù)
DeepSeek爆火后的新Scaling Law究竟是什么？

51CTO技術(shù)棧 ? 1667瀏覽 ? 0回復(fù)
剛剛，OpenAI 開源了兩個(gè) Agent 項(xiàng)目，手搓 Manus 時(shí)代來(lái)襲

玄姐聊AGI ? 1842瀏覽 ? 0回復(fù)
使用Unsloth微調(diào)與運(yùn)行Gemma 3，速度提升1.6倍，VRAM使用減少60%

sbf_2000 ? 2271瀏覽 ? 0回復(fù)

51CTO技術(shù)棧

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

微軟突然封鎖Cursor，全面禁用C、C++、C#擴(kuò)展，網(wǎng)友：理解微軟，Cursor白嫖VSCode 0回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇：微軟內(nèi)部工程師突爆料：OpenAI下一代模型11月即將上架，今天離職的AGI顧問(wèn)：今天Lastday

下一篇：黃仁勛和印度首富安巴尼對(duì)話：CPU摩爾定律已停滯，發(fā)現(xiàn)第二個(gè)縮放定律，不外包數(shù)據(jù)做AI

社區(qū)精華內(nèi)容

目錄