自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<pre id="x6m5f"><strike id="x6m5f"></strike></pre>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

OpenAI新生成模型開源炸場！比Diffusion更快更強，清華校友宋飏一作

作者：量子位 2023-04-13 13:24:38

就在剛剛，OpenAI開源了比擴散模型更快、性能更好的一致性模型：無需對抗訓(xùn)練，就能生成高質(zhì)量圖片！

圖像生成領(lǐng)域，看來又要變天了。

就在剛剛，OpenAI開源了比擴散模型更快、性能更好的一致性模型：

無需對抗訓(xùn)練，就能生成高質(zhì)量圖片！

這個重磅消息一經(jīng)發(fā)出，立刻引爆學(xué)術(shù)圈。

雖說論文本身在3月份就已低調(diào)發(fā)布，但當(dāng)時大伙兒普遍認(rèn)為它只是個OpenAI的前沿研究，并不會真正將細(xì)節(jié)公開。

沒想到這次直接來了個開源。有網(wǎng)友立刻上手實測了一波效果，發(fā)現(xiàn)只需要3.5秒左右就能生成64張左右256×256的圖像：

游戲結(jié)束！

這是這位網(wǎng)友生成的圖像效果，看起來還不錯：

還有網(wǎng)友調(diào)侃稱：這次OpenAI終于Open了！

值得一提的是，論文一作OpenAI科學(xué)家宋飏，是一位清華校友，16歲就通過領(lǐng)軍計劃進(jìn)入清華數(shù)理基礎(chǔ)科學(xué)班求學(xué)。

一起來看看這次OpenAI開源了一項怎樣的研究。

開源了一個怎樣的重磅研究？

作為一個圖像生成AI，一致性模型（Consistency Model）最大的特點在于快又好。

相比擴散模型，它主要有兩大優(yōu)勢：

其一，無需對抗訓(xùn)練（adversarial training），就能直接生成高質(zhì)量的圖像樣本。

其二，相比擴散模型可能需要幾百甚至上千次迭代，一致性模型只需要一兩步就能搞定多種圖像任務(wù)——

包括上色、去噪、超分等，都可以在幾步之內(nèi)搞定，而不需要對這些任務(wù)進(jìn)行明確訓(xùn)練。（當(dāng)然，如果進(jìn)行少樣本學(xué)習(xí)的話，生成效果也會更好）

所以一致性模型究竟是如何實現(xiàn)這種效果的？

從原理來看，一致性模型的誕生與ODE（常微分方程）式生成擴散模型有關(guān)。

圖中可見，ODE會先一步步將圖片數(shù)據(jù)轉(zhuǎn)換成噪聲，隨后再進(jìn)行一個逆向求解，從噪聲中學(xué)習(xí)生成圖像。

而就在這個過程中，作者們試圖將ODE軌跡上的任何點（如Xt、Xt和Xr）映射到它的原點（如X0）進(jìn)行生成建模。

隨后，這個映射的模型被命名為一致性模型，因為它們的輸出都是同一軌跡上的同一點：

基于這種思路，一致性模型不需要再經(jīng)過漫長的迭代，才能生成一個相對質(zhì)量比較高的圖像，而是能做到一步生成。

下圖是一致性模型（CD）和擴散模型（PD）在圖像生成指標(biāo)FID上的對比。

其中，PD是去年斯坦福和谷歌大腦提出的一種最新擴散模型方法漸進(jìn)式蒸餾（progressive distillation）的簡稱，CD（consistency distillation）則是一致性蒸餾方法。

可以看出，幾乎在所有數(shù)據(jù)集上，一致性模型的圖像生成效果都要比擴散模型更好，唯一的例外是256×256的房間數(shù)據(jù)集上：

除此之外，作者們也將擴散模型、一致性模型和GAN等模型在其他各種數(shù)據(jù)集上進(jìn)行了對比：

不過也有網(wǎng)友提到，這次開源的AI一致性模型，能生成的圖像還是太?。?/p>

很難過，這次開源的版本生成的圖像還是太小了，要是能給出生成更大圖像的開源版本，肯定會非常讓人興奮。

也有網(wǎng)友猜測，可能只是OpenAI還沒訓(xùn)練出來。不過可能訓(xùn)練出來了我們也不一定能搞到代碼（手動狗頭）。

不過對于這項工作的意義，TechCrunch表示：

你若是有一堆GPU，那用擴散模型在一兩分鐘內(nèi)迭代1500多次，生成圖片的效果當(dāng)然是極好的。

但如果你想在手機上或者聊天對話的時候?qū)崟r生成圖片，那顯然擴散模型不是最好的選擇。

一致性模型是OpenAI下一個重要動作。

期待OpenAI會開源一波分辨率更高的圖像生成AI~

清華校友宋飏一作

論文一作宋飏，目前是OpenAI的研究科學(xué)家。

他14歲時，曾以17位評委全票通過的成績，入選“清華大學(xué)新百年領(lǐng)軍計劃”。在次年高考中，他又成為連云港市理科狀元，順利考入清華。

2016年，宋飏從清華大學(xué)數(shù)理基礎(chǔ)科學(xué)班畢業(yè)，此后赴斯坦福深造。2022年，宋飏獲斯坦福計算機科學(xué)博士學(xué)位，而后加入OpenAI。

在博士期間，他的一作論文“Score-Based Generative Modeling through Stochastic Differential Equations”還獲得過ICLR 2021的杰出論文獎。

根據(jù)其個人主頁信息，從2024年1月開始，宋飏將正式加入加州理工學(xué)院電子系和計算數(shù)學(xué)科學(xué)系，擔(dān)任助理教授。

項目地址：
???https://github.com/openai/consistency_models??

論文地址：
???https://arxiv.org/abs/2303.01469??

參考鏈接：
[1]https://twitter.com/alfredplpl/status/1646217811898011648
[2]https://twitter.com/_akhaliq/status/1646168119658831874?

責(zé)任編輯：武曉燕來源：量子位

OpenAI 模型圖片

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<cite id="mx868"></cite>

<em id="mx868"><b id="mx868"><ins id="mx868"></ins></b></em>

<legend id="mx868"><track id="mx868"><dfn id="mx868"></dfn></track></legend>

<pre id="mx868"></pre>