自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

ICLR 2024 | 聯(lián)邦學(xué)習(xí)后門攻擊的模型關(guān)鍵層

作者：機(jī)器之心 2024-04-07 07:40:00

人工智能新聞

本文重點關(guān)注如何在有防御保護(hù)的訓(xùn)練框架下，對聯(lián)邦學(xué)習(xí)發(fā)起后門攻擊。本文發(fā)現(xiàn)后門攻擊的植入與部分神經(jīng)網(wǎng)絡(luò)層的相關(guān)性更高，并將這些層稱為后門攻擊關(guān)鍵層。

想了解更多AIGC的內(nèi)容，

請訪問： 51CTO AI.x社區(qū)

http://www.scjtxx.cn/aigc/

聯(lián)邦學(xué)習(xí)使多個參與方可以在數(shù)據(jù)隱私得到保護(hù)的情況下訓(xùn)練機(jī)器學(xué)習(xí)模型。但是由于服務(wù)器無法監(jiān)控參與者在本地進(jìn)行的訓(xùn)練過程，參與者可以篡改本地訓(xùn)練模型，從而對聯(lián)邦學(xué)習(xí)的全局模型構(gòu)成安全序隱患，如后門攻擊。

本文重點關(guān)注如何在有防御保護(hù)的訓(xùn)練框架下，對聯(lián)邦學(xué)習(xí)發(fā)起后門攻擊。本文發(fā)現(xiàn)后門攻擊的植入與部分神經(jīng)網(wǎng)絡(luò)層的相關(guān)性更高，并將這些層稱為后門攻擊關(guān)鍵層。

基于后門關(guān)鍵層的發(fā)現(xiàn)，本文提出通過攻擊后門關(guān)鍵層繞過防御算法檢測，從而可以控制少量的參與者進(jìn)行高效的后門攻擊。

論文題目：Backdoor Federated Learning By Poisoning Backdoor-Critical Layers

論文鏈接：https://openreview.net/pdf?id=AJBGSVSTT2

代碼鏈接：https://github.com/zhmzm/Poisoning_Backdoor-critical_Layers_Attack

方法

本文提出層替換方法識別后門關(guān)鍵層。具體方法如下：

第一步，先將模型在干凈數(shù)據(jù)集上訓(xùn)練至收斂，并保存模型參數(shù)記為良性模型。再將良性模型的復(fù)制在含有后門的數(shù)據(jù)集上訓(xùn)練，收斂后保存模型參數(shù)并記為惡意模型。
第二步，取良性模型中一層參數(shù)替換到包含后門的惡意模型中，并計算所得到的模型的后門攻擊成功率。將得到的后門攻擊成功率與惡意模型的后門攻擊成功率 BSR 做差得到 △BSR，可得到該層對后門攻擊的影響程度。對神經(jīng)網(wǎng)絡(luò)中每一層使用相同的方法，可得到一個記錄所有層對后門攻擊影響程度的列表。
第三步，對所有層按照對后門攻擊的影響程度進(jìn)行排序。將列表中影響程度最大的一層取出并加入后門攻擊關(guān)鍵層集合，并將惡意模型中的后門攻擊關(guān)鍵層（在集合中的層）參數(shù)植入良性模型。計算所得到模型的后門攻擊成功率。如果后門攻擊成功率大于所設(shè)閾值 τ 乘以惡意模型后門攻擊成功率，則停止算法。若不滿足，則繼續(xù)將列表所剩層中最大的一層加入后門攻擊關(guān)鍵層直到滿足條件。

在得到后門攻擊關(guān)鍵層的集合之后，本文提出通過攻擊后門關(guān)鍵層的方法來繞過防御方法的檢測。除此之外，本文引入模擬聚合和良性模型中心進(jìn)一步減小與其他良性模型的距離。

實驗結(jié)果

本文對多個防御方法在 CIFAR-10 和 MNIST 數(shù)據(jù)集上驗證了基于后門關(guān)鍵層攻擊的有效性。實驗將分別使用后門攻擊成功率 BSR 和惡意模型接收率 MAR（良性模型接收率 BAR）作為衡量攻擊有效性的指標(biāo)。

首先，基于層的攻擊 LP Attack 可以讓惡意客戶端獲得很高的選取率。如下表所示，LP Attack 在 CIFAR-10 數(shù)據(jù)集上得到了 90% 的接收率，遠(yuǎn)高于良性用戶的 34%。

然后，LP Attack 可以取得很高的后門攻擊成功率，即使在只有 10% 惡意客戶端的設(shè)定下。如下表所示，LP Attack 在不同的數(shù)據(jù)集和不同的防御方法保護(hù)下，均能取得很高的后門攻擊成功率 BSR。

在消融實驗中，本文分別對后門關(guān)鍵層和非后門關(guān)鍵層進(jìn)行投毒并測量兩種實驗的后門攻擊成功率。如下圖所示，攻擊相同層數(shù)的情況下，對非后門關(guān)鍵層進(jìn)行投毒的成功率遠(yuǎn)低于對后門關(guān)鍵層進(jìn)行投毒，這表明本文的算法可以選擇出有效的后門攻擊關(guān)鍵層。

除此之外，我們對模型聚合模塊 Model Averaging 和自適應(yīng)控制模塊 Adaptive Control 進(jìn)行消融實驗。如下表所示，這兩個模塊均對提升選取率和后門攻擊成功率，證明了這兩個模塊的有效性。

總結(jié)

本文發(fā)現(xiàn)后門攻擊與部分層緊密相關(guān)，并提出了一種算法搜尋后門攻擊關(guān)鍵層。本文利用后門攻擊關(guān)鍵層提出了針對聯(lián)邦學(xué)習(xí)中保護(hù)算法的基于層的 layer-wise 攻擊。所提出的攻擊揭示了目前三類防御方法的漏洞，表明未來將需要更加精細(xì)的防御算法對聯(lián)邦學(xué)習(xí)安全進(jìn)行保護(hù)。

作者介紹

Zhuang Haomin，本科畢業(yè)于華南理工大學(xué)，曾于路易斯安那州立大學(xué) IntelliSys 實驗室擔(dān)任研究助理，現(xiàn)于圣母大學(xué)就讀博士。主要研究方向為后門攻擊和對抗樣本攻擊。

想了解更多AIGC的內(nèi)容，

請訪問： 51CTO AI.x社區(qū)

http://www.scjtxx.cn/aigc/

責(zé)任編輯：張燕妮來源：機(jī)器之心

神經(jīng)網(wǎng)絡(luò)訓(xùn)練

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<sub id="k2xym"><p id="k2xym"></p></sub>

<style id="k2xym"></style>

<blockquote id="k2xym"><p id="k2xym"></p></blockquote>