「擴(kuò)散模型+多模態(tài)提示」精準(zhǔn)增強(qiáng)皮膚病變分割,超越GAN,SSIM提升9%,Dice提升5%!
1. 一眼概覽
該論文提出了一種基于擴(kuò)散模型的醫(yī)學(xué)影像生成方法,結(jié)合視覺(jué)和文本提示,以精準(zhǔn)控制皮膚鏡病變圖像的生成,提升皮膚病變的分割性能。實(shí)驗(yàn)結(jié)果顯示,該方法比傳統(tǒng)GAN生成方法在圖像質(zhì)量(SSIM提升9%)和分割性能(Dice系數(shù)提升5%)上均有顯著改進(jìn)。
2. 核心問(wèn)題
問(wèn)題背景
醫(yī)學(xué)影像分析受限于公開(kāi)數(shù)據(jù)集稀缺及高質(zhì)量標(biāo)注成本高,數(shù)據(jù)增強(qiáng)方法(如GAN)雖能擴(kuò)充數(shù)據(jù),但難以精準(zhǔn)控制病變類(lèi)型、位置及屬性,導(dǎo)致對(duì)下游任務(wù)(如病變分割)的提升有限。
論文關(guān)注的問(wèn)題
如何利用擴(kuò)散模型生成高質(zhì)量且可控的皮膚鏡病變圖像,提升下游皮膚病變分割任務(wù)的表現(xiàn)?
3. 技術(shù)亮點(diǎn)
? 視覺(jué) + 文本提示,精準(zhǔn)控制病變生成
? 結(jié)合視覺(jué)提示(病變掩碼)和文本提示(病變類(lèi)型和屬性),提高圖像生成的控制性,實(shí)現(xiàn)定制化病變合成。
? 改進(jìn)擴(kuò)散模型,提高圖像質(zhì)量
? 采用Stable Diffusion + ControlNet 結(jié)構(gòu),增強(qiáng)模型的可控性和泛化能力,在醫(yī)學(xué)影像領(lǐng)域首次實(shí)現(xiàn)基于擴(kuò)散模型的病變圖像生成。
? 自動(dòng)病變掩碼生成,提高數(shù)據(jù)多樣性
? 提出自動(dòng)病變掩碼生成模塊,通過(guò)隨機(jī)形狀、模糊、彈性變形等方式生成多樣化的病變形態(tài),進(jìn)一步提升數(shù)據(jù)增強(qiáng)效果。
4. 方法框架
圖片
該方法基于Stable Diffusion + ControlNet,結(jié)合視覺(jué)和文本提示,進(jìn)行皮膚病變圖像的生成和分割任務(wù)。其主要流程如下:
1?? 訓(xùn)練階段
? 使用ISIC皮膚鏡數(shù)據(jù)集訓(xùn)練擴(kuò)散模型,輸入包含:
a.視覺(jué)提示(病變掩碼,指定病變位置與形狀)
b.文本提示(病變類(lèi)型和屬性)
? 采用ControlNet 結(jié)構(gòu)控制病變的合成方式。
2?? 數(shù)據(jù)增強(qiáng)
? 采用自動(dòng)病變掩碼生成,擴(kuò)充數(shù)據(jù),提高訓(xùn)練樣本的多樣性。
3?? 分割任務(wù)
? 通過(guò)擴(kuò)散模型合成的病變圖像,提升皮膚病變分割模型的泛化能力。
?? 核心改進(jìn)點(diǎn):相較于傳統(tǒng)GAN方法(如Pix2PixHD),該方法在病變生成質(zhì)量、數(shù)據(jù)控制性和分割任務(wù)提升方面均表現(xiàn)優(yōu)異。
5. 實(shí)驗(yàn)結(jié)果速覽
圖片
?? 生成圖像質(zhì)量對(duì)比
模型 | MSE(↓) | PSNR(↑) | SSIM(↑) |
Pix2PixHD | 0.09 | 58.80 | 0.71 |
本文方法 | 0.06 | 61.64 | 0.80 |
? SSIM 提升 9%,證明生成圖像的質(zhì)量更高,結(jié)構(gòu)信息保留更好。
?? 皮膚病變分割性能提升
方法 | 僅S數(shù)據(jù)集 | S+1K 生成數(shù)據(jù) | S+3K 生成數(shù)據(jù) | S+5K 生成數(shù)據(jù) |
Pix2PixHD | 0.861 | 0.871 | 0.903 | 0.912 |
本文方法 | 0.903 | 0.912 | 0.913 | 0.914 |
? 比GAN方法(Pix2PixHD)在Dice系數(shù)上提升超過(guò)5%,證明該方法生成的圖像更有利于分割任務(wù)的提升。
?? 關(guān)鍵結(jié)論:
? 該方法生成的圖像質(zhì)量更高,病變細(xì)節(jié)保留更好。
? 結(jié)合合成數(shù)據(jù)后,分割模型的性能顯著提升,且數(shù)據(jù)量越大,提升越明顯。
6. 實(shí)用價(jià)值與應(yīng)用
?? 真實(shí)世界應(yīng)用
? 醫(yī)學(xué)影像增強(qiáng):適用于皮膚病變、腫瘤影像等領(lǐng)域,提高模型在數(shù)據(jù)稀缺情況下的泛化能力。
? 智能輔助診斷:可幫助醫(yī)生獲取更多高質(zhì)量的病變樣本,提高疾病檢測(cè)的準(zhǔn)確率。
? 數(shù)據(jù)增強(qiáng)與遷移學(xué)習(xí):可用于不同病變類(lèi)型的合成,提高模型在多種醫(yī)療數(shù)據(jù)上的適應(yīng)性。
7.開(kāi)放問(wèn)題
?? 思考與討論
? 該方法能否推廣至其他類(lèi)型的醫(yī)學(xué)影像(如CT、MRI)?
? 擴(kuò)散模型在小樣本和零樣本學(xué)習(xí)上的潛力如何?
? 未來(lái)是否可以結(jié)合物理模型,進(jìn)一步提高醫(yī)學(xué)影像的真實(shí)性?