自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

零樣本 | ZAPS:零樣本擴(kuò)散采樣,3倍加速逆問題重建,重塑高效影像修復(fù)新范式

人工智能
ZAPS(Zero-Shot Approximate Posterior Sampling)是一種針對擴(kuò)散模型(Diffusion Models, DMs)在逆問題(Inverse Problems)中的高效采樣方法。

一、 一眼概覽

ZAPS(Zero-Shot Approximate Posterior Sampling)是一種針對擴(kuò)散模型(Diffusion Models, DMs)在逆問題(Inverse Problems)中的高效采樣方法。它利用零樣本學(xué)習(xí)(Zero-Shot Learning)進(jìn)行自適應(yīng)超參數(shù)優(yōu)化,使得擴(kuò)散采樣步驟固定,同時(shí)提高重建質(zhì)量并減少推理時(shí)間。

二、核心問題

當(dāng)前的擴(kuò)散模型在解決逆問題(如去模糊、修復(fù)、超分辨率)時(shí),存在以下挑戰(zhàn):

  • 需要大量的采樣步驟,導(dǎo)致推理速度慢;
  • 現(xiàn)有的噪聲調(diào)度策略(Noise Schedule)在逆問題場景下難以直接適用;
  • 傳統(tǒng)方法使用手動(dòng)調(diào)整的對數(shù)似然權(quán)重(Log-Likelihood Weights),不夠魯棒,容易導(dǎo)致次優(yōu)解。論文核心問題:如何在固定的采樣步數(shù)下,提高擴(kuò)散模型的逆問題求解性能,并自適應(yīng)優(yōu)化超參數(shù)?

三、技術(shù)亮點(diǎn)

1. 提出零樣本近似后驗(yàn)采樣(ZAPS)方法

? 通過零樣本學(xué)習(xí)自動(dòng)優(yōu)化對數(shù)似然權(quán)重,無需手動(dòng)調(diào)整;

? 避免傳統(tǒng)方法中的手工調(diào)參問題,適應(yīng)不同的噪聲調(diào)度。

2. 設(shè)計(jì)基于離散小波變換(DWT)的 Hessian 近似

? 近似后驗(yàn)的二階信息,提高計(jì)算效率;

 3.優(yōu)化采樣策略,實(shí)現(xiàn)快速收斂

? 結(jié)合不規(guī)則噪聲調(diào)度(Irregular Noise Schedule),在低噪聲水平更多采樣;

? 相比傳統(tǒng)方法,將采樣步數(shù)從1000步減少到 20-30步,實(shí)現(xiàn)3×加速。

四、方法框架

圖片圖片

ZAPS 通過以下關(guān)鍵步驟完成擴(kuò)散模型的高效后驗(yàn)采樣:

1. 采樣初始化:從噪聲分布開始,設(shè)定固定的采樣步數(shù)(S 步)。

2. 零樣本優(yōu)化

? 采用自監(jiān)督損失函數(shù)調(diào)整對數(shù)似然權(quán)重 ζt;

? 通過 DWT 近似 Hessian 計(jì)算,提高計(jì)算效率。

3. 逐步采樣更新

? 交替執(zhí)行擴(kuò)散模型采樣(Score Model Sampling, SMS)和似然引導(dǎo)(Likelihood Guidance, LG)。

4. 最終輸出:生成高質(zhì)量的逆問題重建結(jié)果。

五、實(shí)驗(yàn)結(jié)果速覽

圖片圖片

論文在FFHQ、ImageNet等數(shù)據(jù)集上進(jìn)行了去模糊、修復(fù)、超分辨率等任務(wù)測試,主要結(jié)果如下:

ZAPS 在超分辨率任務(wù)中比 DPS 提高 2.77dB(PSNR),且計(jì)算時(shí)間減少 3 倍。

相較于 DDRM,ZAPS 在相近計(jì)算復(fù)雜度下顯著提升圖像質(zhì)量。

實(shí)驗(yàn)驗(yàn)證 ZAPS 在多種逆問題(高斯去模糊、運(yùn)動(dòng)去模糊、超分辨率、圖像修復(fù))上均表現(xiàn)優(yōu)越

6. 實(shí)用價(jià)值與應(yīng)用

ZAPS 具備廣泛的實(shí)際應(yīng)用場景:

醫(yī)學(xué)影像重建(MRI、CT 降噪):減少成像時(shí)間,提高細(xì)節(jié)還原能力;

自動(dòng)駕駛(圖像去模糊):提升低光環(huán)境下的視覺感知能力;

計(jì)算機(jī)視覺(圖像修復(fù)):改善低質(zhì)量視頻和照片;

遙感成像(超分辨率重建):提高衛(wèi)星影像質(zhì)量。

7. 開放問題

? ZAPS 是否能推廣到非線性逆問題(如 3D 重建、層析成像)?

? 如果輸入數(shù)據(jù)具有極端噪聲或大尺度失真,ZAPS 的性能如何?

? 該方法是否可用于文本和信號處理領(lǐng)域,如語音降噪、時(shí)序預(yù)測?

責(zé)任編輯:武曉燕 來源: 萍哥學(xué)AI
相關(guān)推薦

2025-02-06 11:25:50

2025-02-07 10:10:05

MusicMagus擴(kuò)散模型音樂編輯

2024-06-25 09:35:04

模型訓(xùn)練

2024-11-20 16:51:00

目標(biāo)檢測模型

2023-02-24 10:22:15

2024-09-12 08:00:00

2023-07-12 09:00:00

自動(dòng)語音識(shí)別機(jī)器學(xué)習(xí)

2024-02-07 12:13:19

AI數(shù)據(jù)

2021-10-25 09:06:29

模型人工智能計(jì)算

2023-02-03 16:31:02

模型

2024-03-15 12:49:40

AI訓(xùn)練

2025-02-07 09:00:00

2024-12-26 16:30:00

AI設(shè)計(jì)數(shù)據(jù)

2021-07-24 10:19:14

AI 數(shù)據(jù)克隆

2023-09-19 13:11:26

自動(dòng)駕駛研究

2025-04-23 09:28:58

2025-01-26 10:50:00

模型視頻生成

2021-09-08 17:23:33

谷歌模型開發(fā)

2025-02-07 15:20:00

AI數(shù)據(jù)訓(xùn)練

2025-03-24 13:32:43

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號