自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

MDMS-Diffusion:空間-頻率融合,多尺度采樣,低光圖像增強新突破

人工智能
在低光條件下拍攝的圖像往往存在低對比度和高噪聲問題,不僅影響視覺質(zhì)量,還會降低下游計算機視覺任務(wù)(如目標(biāo)檢測、分割等)的準(zhǔn)確性。

一眼概覽

MDMS-Diffusion 提出了一種多域多尺度擴散模型(Multi-Domain Multi-Scale Diffusion Model),通過結(jié)合空間-頻率特征學(xué)習(xí)和多尺度采樣策略,突破低光圖像增強的現(xiàn)有局限,實現(xiàn)了無損降噪和高保真度的圖像恢復(fù),在 LOL 和 LOLv2 數(shù)據(jù)集上達到了 SOTA 級別的性能。

核心問題

在低光條件下拍攝的圖像往往存在低對比度和高噪聲問題,不僅影響視覺質(zhì)量,還會降低下游計算機視覺任務(wù)(如目標(biāo)檢測、分割等)的準(zhǔn)確性。當(dāng)前的擴散模型主要在空間域建模噪聲分布,而忽略了頻率域信息。此外,傳統(tǒng)的單尺度補丁采樣策略容易引發(fā)嚴(yán)重的棋盤格偽影。本研究提出 MDMS-Diffusion 模型,以同時解決這兩個問題。

技術(shù)亮點

1. 空間-頻率融合學(xué)習(xí):提出多域?qū)W習(xí)(Multi-Domain Learning, MDL)模塊,結(jié)合 Fast Fourier Transform (FFT) 提取的頻率域信息,以更全面地建模圖像特征,提高低光圖像增強的質(zhì)量。

2. 多尺度采樣策略:通過不同分辨率補丁的融合(64×64、96×96、128×128),平滑邊界區(qū)域,避免傳統(tǒng)單尺度方法導(dǎo)致的棋盤格偽影問題。

3. 亮通道先驗(Bright Channel Prior, BCP)引導(dǎo):基于自然圖像的統(tǒng)計規(guī)律,為擴散過程提供額外的光照和顏色信息,引導(dǎo)生成更自然的增強圖像。

方法框架

圖片圖片

MDMS-Diffusion 采用 U-Net 結(jié)構(gòu),并引入以下關(guān)鍵模塊:

1. 多域?qū)W習(xí)(MDL):空間域和頻率域雙分支處理,分別提取局部/全局信息,并利用 IFFT 變換回到空間域,實現(xiàn)特征融合。

2. 多尺度采樣(MSS):在采樣過程中,利用不同大小的補丁提取信息,并在融合階段合并多尺度結(jié)果,以平滑圖像邊界。

3. 亮通道先驗(BCP):基于圖像亮度通道信息提供先驗引導(dǎo),增強色彩和光照一致性,減少失真。

實驗結(jié)果速覽

圖片圖片

實驗結(jié)果表明,MDMS-Diffusion 在 LOL 和 LOLv2 數(shù)據(jù)集上均達到 SOTA 性能:

LOL 數(shù)據(jù)集:PSNR 27.12 dB,SSIM 0.882,LPIPS 0.078,相比現(xiàn)有最佳方法 Pydiff(27.07 dB)略有提升,尤其在 LPIPS 指標(biāo)上顯著降低。

LOLv2-Real 數(shù)據(jù)集:PSNR 提升至 33.30 dB,相比 Pydiff(31.11 dB)提高 2.19 dB,表明該方法在真實低光圖像上的泛化能力更強。

多尺度采樣策略分析:相比傳統(tǒng)單尺度方法,MSS 采樣策略能夠顯著減少棋盤格偽影,使增強圖像更平滑自然。

??數(shù)據(jù)呈現(xiàn)方式

表格:對比現(xiàn)有方法(Zero-DCE、LLFlow、Pydiff 等)的性能指標(biāo)(PSNR/SSIM/LPIPS)。

圖示:展示不同方法的增強效果,包括細(xì)節(jié)保留、光照均衡度等。

實用價值與應(yīng)用

MDMS-Diffusion 可廣泛應(yīng)用于低光環(huán)境下的計算機視覺任務(wù),例如:

  • 自動駕駛:提高夜間和低光環(huán)境下的視覺感知能力,增強目標(biāo)檢測和分割的準(zhǔn)確性。
  • 視頻監(jiān)控:改善夜間監(jiān)控視頻的清晰度,有助于犯罪預(yù)防和證據(jù)采集。
  • 醫(yī)療成像:適用于低光醫(yī)學(xué)圖像增強,提高診斷準(zhǔn)確度。
  • 機器人導(dǎo)航:提升機器人在弱光環(huán)境下的視覺感知能力,提高定位和避障能力。

開放問題

1. MDMS-Diffusion 在極端低光場景(如紅外或夜視成像)下的適應(yīng)性如何?是否需要進一步調(diào)整先驗或結(jié)構(gòu)?

2. 多域?qū)W習(xí)是否可以擴展到其他圖像增強任務(wù),如超分辨率或去噪?頻率域特征的深度建模是否會帶來進一步提升?

3. 如何在計算資源受限的環(huán)境下優(yōu)化該模型,使其適用于移動端或嵌入式設(shè)備?

責(zé)任編輯:武曉燕 來源: 萍哥學(xué)AI
相關(guān)推薦

2024-08-26 07:40:00

AI訓(xùn)練

2013-02-19 10:38:51

IBM光傳感技術(shù)數(shù)據(jù)中心

2020-08-24 15:55:26

腦機接口機器人工智能

2022-10-13 10:01:12

AI模型

2024-03-07 08:12:31

2022-12-18 19:49:45

AI

2024-08-27 10:20:00

2024-11-04 10:40:00

AI模型

2021-01-29 09:01:25

低代碼軟件低代碼工具

2022-11-14 14:08:39

計算機模型

2025-02-05 12:41:21

線性新范式分辨率

2021-05-17 10:05:08

神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)圖形

2024-11-01 15:05:12

2025-01-23 10:45:52

2023-03-09 15:25:49

2024-10-08 15:42:45

2023-03-14 14:10:00

圖像檢測
點贊
收藏

51CTO技術(shù)棧公眾號