自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

拖動(dòng)圖像編輯再升級(jí)!北大、騰訊提出DragonDiffusion,在擴(kuò)散模型上啟用拖動(dòng)式操作

人工智能 新聞
在本文中,我們提出了一種新穎的圖像編輯方法DragonDiffusion,可在擴(kuò)散模型上實(shí)現(xiàn)Drag式的操作。

北大、騰訊提出的DragonDiffusion可以對(duì)生成或真實(shí)的圖像進(jìn)行多種編輯,包括移動(dòng)物體、調(diào)整物體大小、替換物體外觀、拖動(dòng)內(nèi)容等。值得注意的是,所有編輯和內(nèi)容保存信號(hào)都來(lái)自圖像本身,模型不需要微調(diào)或額外的模塊。

圖片圖片圖片

論文介紹

圖片

盡管現(xiàn)有的大規(guī)模文本轉(zhuǎn)圖像 (T2I) 模型能夠從詳細(xì)的文本描述生成高質(zhì)量的圖像,但它們往往缺乏對(duì)生成或真實(shí)圖像進(jìn)行精確編輯的能力。在本文中,我們提出了一種新穎的圖像編輯方法DragonDiffusion,可在擴(kuò)散模型上實(shí)現(xiàn)Drag式的操作。

圖片

具體而言,我們根據(jù)擴(kuò)散模型中中間特征的強(qiáng)對(duì)應(yīng)性構(gòu)建分類(lèi)器指導(dǎo)。它可以通過(guò)特征對(duì)應(yīng)損失將編輯信號(hào)轉(zhuǎn)換為梯度,以修改擴(kuò)散模型的中間表示?;谶@種指導(dǎo)策略,我們還構(gòu)建了一個(gè)多尺度指導(dǎo),以考慮語(yǔ)義和幾何對(duì)齊。此外,還添加了跨分支自注意力以保持原始圖像和編輯結(jié)果之間的一致性。

圖片

我們的方法通過(guò)高效的設(shè)計(jì),實(shí)現(xiàn)了對(duì)生成或真實(shí)圖像的各種編輯模式,例如對(duì)象移動(dòng)、對(duì)象調(diào)整大小、對(duì)象外觀替換和內(nèi)容拖動(dòng)。值得注意的是,所有編輯和內(nèi)容保存信號(hào)都來(lái)自圖像本身,模型不需要微調(diào)或額外的模塊。

圖片

方法

圖片所提出的DragonDiffusion 的流程。我們提出的方法由指導(dǎo)分支和生成分支組成。指導(dǎo)分支通過(guò)中間特征的對(duì)應(yīng)關(guān)系為生成分支提供編輯和一致性指導(dǎo)。

結(jié)果

物體移動(dòng)結(jié)果

圖片

物體外觀替換結(jié)果

圖片

內(nèi)容拖拽結(jié)果

圖片

責(zé)任編輯:張燕妮 來(lái)源: AIGC Studio
相關(guān)推薦

2025-01-21 10:45:00

訓(xùn)練模型架構(gòu)

2024-03-11 09:37:01

模型圖片編輯

2025-02-05 10:15:00

2023-05-22 07:29:59

AIDragGAN

2025-02-18 09:27:20

2025-01-17 10:30:00

2019-04-03 15:00:47

Python圖像編輯工具

2025-03-31 08:46:00

圖像AI生成

2023-12-23 23:04:26

AI模型

2023-10-11 12:32:26

模型訓(xùn)練

2023-01-02 13:12:07

模型圖像

2024-07-08 08:47:00

2024-03-07 14:55:18

模型論文

2020-08-22 07:46:58

Photoflare開(kāi)源圖像編輯器

2025-01-06 10:30:00

圖像AI模型

2019-12-02 15:23:34

FedoraLinuxGIMP

2023-04-13 15:55:00

AI開(kāi)源

2025-01-07 11:00:00

AI生成

2022-05-07 15:59:36

AI模型

2024-11-04 10:05:00

AI模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)