自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型

發(fā)布于 2024-3-28 11:44
瀏覽
0收藏

第一步在常見 AI 作圖模型輸入「一只胖胖的像面包的橘貓」,畫出一只長得很像面包的貓貓,然后用概念半透膜 SPM 技術(shù),將貓貓這個概念擦掉,結(jié)果它就失去夢想變成了一只面包。上圖 1 是更多的貓貓圖失去貓這個概念后的結(jié)果。

橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

▲ 圖1. 概念半透膜 SPM 針對不同的「貓」圖擦除貓概念后的效果


下圖 2 到圖 6 展示了更多的示例。


橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

▲ 圖2. 失去夢想變成一只面包表情包


橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

▲ 圖3. 西裝光劍米老鼠圖擦除米老鼠概念


橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

▲ 圖4. 稻田里的史努比圖擦除史努比概念


橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

▲ 圖5. 梵高的向日葵圖擦除梵高概念

 

橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

▲ 圖6. 畢加索的抽象畫擦除畢加索概念


這便是清華大學(xué)丁貴廣教授團(tuán)隊和阿里安全聯(lián)合發(fā)布的概念半透膜模型(concept Semi-Permeable Membrane,SPM 模型),該模型能夠在 Diffusion 架構(gòu)的 AI 作圖模型中,精準(zhǔn)、可控地擦除各類具象或抽象概念,并對無關(guān)概念做到幾乎完全保留。


相關(guān)論文《One-dimensional Adapter to Rule Them All: Concepts, Diffusion Models and Erasing Applications》已經(jīng)被計算機(jī)視覺國際頂級會議 CVPR 2024 高分錄用。



橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

項目鏈接:

??https://lyumengyao.github.io/projects/spm??

代碼鏈接:

??https://github.com/Con6924/SPM??

論文鏈接:

??https://arxiv.org/abs/2312.16145??


阿里集團(tuán)資深總監(jiān)、人工智能治理與可持續(xù)發(fā)展研究中心主任、集團(tuán)科技倫理治理委員會執(zhí)行主席薛暉表示:該項成果在通義大模型系列的 AIGC 內(nèi)生安全領(lǐng)域、可控生成等方面都具備落地潛力,能夠有效避免有害概念的侵害,促進(jìn)通義等 AI 技術(shù)產(chǎn)品可用、可靠、可信、可控地向善發(fā)展。


01 動機(jī)和研究背景

前不久,OpenAI 的文生視頻模型 Sora 帶來了 AIGC 新時代,主流的視覺 AIGC 基于擴(kuò)散模型(Diffusion Model,DM),但依然存在各類問題,比如可以被誘導(dǎo)生成涉黃、侵權(quán)等危險概念、無法精準(zhǔn)地對某些概念進(jìn)行作畫和控制等。這里的 「概念」可以是具象的「蘋果」,也可以是抽象的「梵高風(fēng)」、「色情」、「暴力」。


外置安全系統(tǒng)攔截風(fēng)險會造成較差的用戶體驗(一些無惡意的用戶可能在創(chuàng)作時,因為模型偶然生成一些違規(guī)內(nèi)容而被攔截),因此需要一種基于模型內(nèi)生安全的概念擦除方法,保留用戶意圖,同時對模型違規(guī)元素進(jìn)行柔性地精準(zhǔn)擦除。


針對此,本文提出了概念半透膜模型(concept Semi-Permeable Membrane,SPM 模型)。


02 技術(shù)框架

如下圖 7 所示,給定一個目標(biāo)概念,本文的主要目標(biāo)是從預(yù)訓(xùn)練的 DM 中精確地擦除該概念,同時保留其他生成內(nèi)容。


為了避免對特定 DM 參數(shù)的依賴和訓(xùn)練過程中出現(xiàn)的參數(shù)漂移,本文首先設(shè)計了一種輕量化的一維 Adapter,稱為概念半透膜(concept Semi-Permeable Membrane,SPM)。這種極輕量的非侵入性結(jié)構(gòu)可以插入任何預(yù)訓(xùn)練的 DM(如 SD v1.x)中,以學(xué)習(xí)特定概念的可遷移識別及其相應(yīng)的擦除,同時保持原始模型的完整性。


然后,本文提出了一種新穎的 SPM 微調(diào)策略——Latent Anchoring(LA),以有效地在潛空間中利用連續(xù)的概念進(jìn)行精確的擦除和有效的概念保留。一旦 SPM 獨(dú)立學(xué)習(xí)到擦除不同的潛在風(fēng)險的能力,這些 SPMs 就構(gòu)成了一個概念擦除庫,其中任何概念的組合(例如 Van Gogh + nudity)都可以根據(jù)需求場景定制,并直接免訓(xùn)練地遷移到其他 SPM 兼容的模型中(例如社區(qū)中的 RealisticVision 模型)。


在適配 SPM 后的推理過程中,本文的 Facilitated Transport 機(jī)制在接受輸入 prompt 時會動態(tài)地控制 SPM 的激活和滲透性。例如,包含不雅內(nèi)容的 prompt 將由 nudity SPM 擦除,但不會觸發(fā) Van Gogh SPM。同時,沒有在 DM 中安裝相應(yīng) SPM 的 Picasso 風(fēng)格的生成幾乎不會受到影響。


橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

▲ 圖7. SPM 技術(shù)框架


2.1 輕量化的一維Adapter:SPM


為了擺脫預(yù)訓(xùn)練模型的參數(shù)依賴,本文設(shè)計了一種輕量高效的 Adapter,SPM。它僅有一個內(nèi)在維度,作為一種「半透薄膜」被插入到 DM 中來實現(xiàn)精準(zhǔn)擦除。


SPM 的單元結(jié)構(gòu)由兩個可學(xué)習(xí)的向量組成。擦除信號

橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

用于抑制特定概念的生成,而它的振幅

橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

由對應(yīng)的調(diào)節(jié)器控制,以確定擦除的強(qiáng)度。


橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

SPM 的結(jié)構(gòu)設(shè)計使得多個 SPM 可以疊加地插入到同一個 DM 中,基于信號加法的擦除使得多個危險概念可以靈活定制,以滿足錯綜復(fù)雜且不斷變化的擦除需求。此外,它可以在大多數(shù)的 DM 上輕松遷移,相比現(xiàn)有方法,顯著提高推理、部署和存儲效率。


2.2 微調(diào)階段的概念半透性精準(zhǔn)習(xí)得:Latent Anchoring


本文通過模型參數(shù)微調(diào)使 SPM 獲得對特定概念的擦除半滲透性。基于 LDM 中概念的疊加與消去對應(yīng)于對數(shù)概率算數(shù)運(yùn)算的理論,本文對 SPM 進(jìn)行參數(shù)化,以在 DM 的噪聲預(yù)測過程中執(zhí)行概念的擦除。

具體而言,給定目標(biāo)概念橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

,本文預(yù)定義一個代理概念橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

(或一般地,空字符串),用來指定目標(biāo)概念擦出后模型預(yù)期的行為,擦除損失如下:


橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

然而,僅用上述學(xué)習(xí)目標(biāo)會引發(fā) DM 中其他概念的災(zāi)難性遺忘,導(dǎo)致生成中概念的侵蝕現(xiàn)象。對此,本文提出 Latent Anchoring 策略,在上式基礎(chǔ)上,對于其他的尤其是距離目標(biāo)概念更遠(yuǎn)的概念,本文期望模型盡可能地與原生成保持一致


其中有:


橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)是影響目標(biāo)概念近義詞行為的超參數(shù)。

目標(biāo)概念的精準(zhǔn)擦除和安全概念的廣泛保留由橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

平衡,SPM 的微調(diào)總損失如下:

橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

2.3 生成階段的概念半透性動態(tài)適配:Facilitated Transport


當(dāng)前文得到一系列擦除不同目標(biāo)的獨(dú)立 SPM 后,可以將它們不沖突地組合并覆蓋在其他 DM(如橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū))上:


橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

盡管 Latent Anchoring 旨在在微調(diào)過程中保護(hù)非目標(biāo)概念,但在安裝了多個 SPM 的挑戰(zhàn)性場景中,已有方法的結(jié)果表明整體生成效果不可避免地退化。為了進(jìn)一步最小化對無關(guān)概念的影響,本文在推理階段引入 Facilitated Transport 機(jī)制,動態(tài)地傳輸目標(biāo)概念的擦除信號,同時拒絕 SPM 對非目標(biāo)概念的響應(yīng)。


具體地,對于給定的 prompt p,每個 SPM 的信息滲透性和傳輸速率,表示為

橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

,取決于 p 中包含的目標(biāo)概念 c 的概率。為了估計這個概率,本方法首先在 CLIP 文本編碼空間中計算 p 和 c 的語義距離,表示為

橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

。然而,潛空間上的距離作為一種全局視角可能無法完全捕捉到簡單的概念名稱和復(fù)雜的 prompt 局部描述之間的相關(guān)性。為此,本文又引入了局部的度量標(biāo)準(zhǔn),以在 token 級別上識別相關(guān)性:


橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

其中 T 表示 DM 的 Tokenizer。


最終將

橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

計算為:


橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

以在全局和局部兩個視角下捕捉到 prompt 和目標(biāo)概念的相關(guān)性。當(dāng)輸入的 prompt 中蘊(yùn)涵了概念 c 的相關(guān)信息, 一個較大的

橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

將會在在上文公式中激活對應(yīng)的 SPM,使得相應(yīng)的生成被抑制;反之,

橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

將接近于零,保持生成與原有模型一致。


03 實驗效果


3.1 單概念的擦除


面對具體概念如「史努比」(圖 8 一行五列),抽象概念如「梵高畫風(fēng)」和「畢加索畫風(fēng)」(圖 9 一行六列,四行六列),SPM 都擦除足夠徹底,且對其他概念幾乎沒有影響。而其他方法或擦除不徹底,或?qū)o關(guān)概念有所破壞。


橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

▲ 圖8. 擦除史努比的效果


橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

▲ 圖9. 擦除梵高、畢加索畫風(fēng)的效果

3.2 多概念的擦除


擦除多個概念時,SPM 能保持穩(wěn)定效果如圖 10,且不會影響其他無關(guān)概念如圖 11,而其他方法都或多或少對無關(guān)概念進(jìn)行侵蝕。


橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

▲ 圖10. SPM 對多個概念的擦除效果


橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

▲ 圖11. SPM 擦除多概念時對無關(guān)概念沒有影響

3.3 違規(guī)概念的擦除


如圖 12,對于一些抽象的有害概念例如色情,只需要加入 SPM,即可做到相對穩(wěn)定的消除。如圖 13,在學(xué)界著名的 I2P 測評集合上,SPM 對于色情概念的擦除效果目前達(dá)到了業(yè)界最優(yōu)。

 

橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

▲ 圖12. 擦除色情概念的效果

橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

▲ 圖13. 色情概念擦除效果業(yè)界最優(yōu)

3.4 無需訓(xùn)練的遷移


如圖 15 顯示,當(dāng) SPM 訓(xùn)練完成后,就可以直接遷移到同樣架構(gòu)、不同參數(shù)的其他模型上,達(dá)成即插即用的擦除目的。


橘貓減去「貓」會變成什么?清華聯(lián)合阿里推出概念半透膜模型-AI.x社區(qū)

▲ 圖15. 在不同社區(qū)模型下的擦除表現(xiàn)


04 結(jié)論

SPM 針對視覺 AIGC 的可控擦除,能夠帶來更多創(chuàng)作可能性,也能通過擦除危險概念幫助 AI 向善。未來可以遷移到視頻側(cè)、3d 側(cè)等各種模態(tài)下的概念編輯和擦除工作,都會成為后續(xù) Sora 時代值得研究的點(diǎn)。


本文轉(zhuǎn)自 PaperWeekly ,作者:機(jī)器之心編輯部


原文鏈接:??https://mp.weixin.qq.com/s/7t5uWFo59XtAXNnMPOJBxQ??

標(biāo)簽
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦