自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

一文綜述「聯(lián)邦圖機(jī)器學(xué)習(xí)」,概念、技術(shù)、應(yīng)用全都有

人工智能 機(jī)器學(xué)習(xí) 新聞
一文總結(jié)聯(lián)邦圖機(jī)器學(xué)習(xí)。

近年來,圖已被廣泛應(yīng)用于表示和處理很多領(lǐng)域的復(fù)雜數(shù)據(jù),如醫(yī)療、交通運(yùn)輸、生物信息學(xué)和推薦系統(tǒng)等。圖機(jī)器學(xué)習(xí)技術(shù)是獲取隱匿在復(fù)雜數(shù)據(jù)中豐富信息的有力工具,并且在像節(jié)點(diǎn)分類和鏈接預(yù)測(cè)等任務(wù)中,展現(xiàn)出很強(qiáng)的性能。

盡管圖機(jī)器學(xué)習(xí)技術(shù)取得了重大進(jìn)展,但大多數(shù)都需要把圖數(shù)據(jù)集中存儲(chǔ)在單機(jī)上。然而,隨著對(duì)數(shù)據(jù)安全和用戶隱私的重視,集中存儲(chǔ)數(shù)據(jù)變的不安全和不可行。圖數(shù)據(jù)通常分布在多個(gè)數(shù)據(jù)源(數(shù)據(jù)孤島),由于隱私和安全的原因,從不同的地方收集所需的圖數(shù)據(jù)變的不可行。

例如一家第三方公司想為一些金融機(jī)構(gòu)訓(xùn)練圖機(jī)器學(xué)習(xí)模型,以幫助他們檢測(cè)潛在的金融犯罪和欺詐客戶。每個(gè)金融機(jī)構(gòu)都擁有私有客戶數(shù)據(jù),如人口統(tǒng)計(jì)數(shù)據(jù)以及交易記錄等。每個(gè)金融機(jī)構(gòu)的客戶形成一個(gè)客戶圖,其中邊代表交易記錄。由于嚴(yán)格的隱私政策和商業(yè)競(jìng)爭(zhēng),各個(gè)機(jī)構(gòu)的私有客戶數(shù)據(jù)無法直接與第三方公司或其它他機(jī)構(gòu)共享。同時(shí),機(jī)構(gòu)之間也可能有關(guān)聯(lián),這可以看作是機(jī)構(gòu)之間的結(jié)構(gòu)信息。因此面臨的主要挑戰(zhàn)是:在不直接訪問每個(gè)機(jī)構(gòu)的私有客戶數(shù)據(jù)的情況下,基于私有客戶圖和機(jī)構(gòu)間結(jié)構(gòu)信息,來訓(xùn)練用于金融犯罪檢測(cè)的圖機(jī)器學(xué)習(xí)模型。

聯(lián)邦學(xué)習(xí)(FL)是一種分布式機(jī)器學(xué)習(xí)方案,通過協(xié)作訓(xùn)練解決數(shù)據(jù)孤島問題。它使參與者(即客戶)能夠在不共享其私有數(shù)據(jù)的情況下聯(lián)合訓(xùn)練機(jī)器學(xué)習(xí)模型。因此,將 FL 與圖機(jī)器學(xué)習(xí)相結(jié)合成為解決上述問題的有希望的解決方案。

本文中,來自弗吉尼亞大學(xué)的研究者提出聯(lián)邦圖機(jī)器學(xué)習(xí)(FGML,F(xiàn)ederated Graph Machine Learning)。一般來說,F(xiàn)GML 可以根據(jù)結(jié)構(gòu)信息的級(jí)別分為兩種設(shè)置:第一種是具有結(jié)構(gòu)化數(shù)據(jù)的 FL,在具有結(jié)構(gòu)化數(shù)據(jù)的 FL 中,客戶基于其圖數(shù)據(jù)協(xié)作訓(xùn)練圖機(jī)器學(xué)習(xí)模型,同時(shí)將圖數(shù)據(jù)保留在本地。第二種是結(jié)構(gòu)化 FL,在結(jié)構(gòu)化 FL 中,客戶端之間存在結(jié)構(gòu)信息,形成客戶端圖。可以利用客戶端圖設(shè)計(jì)更有效的聯(lián)合優(yōu)化方法。

圖片

論文地址:https://arxiv.org/pdf/2207.11812.pdf

雖然 FGML 提供了一個(gè)有前景的藍(lán)圖,但仍存在一些挑戰(zhàn):

1、跨客戶端的信息缺失。在具有結(jié)構(gòu)化數(shù)據(jù)的 FL 中,常見的場(chǎng)景是每個(gè)客戶端機(jī)器都擁有全局圖的子圖,并且一些節(jié)點(diǎn)可能具有屬于其他客戶端的近鄰。出于隱私考慮,節(jié)點(diǎn)只能在客戶端內(nèi)聚合其近鄰的特征,但無法訪問位于其它客戶端上的特征,這導(dǎo)致節(jié)點(diǎn)表示不足。

2、圖結(jié)構(gòu)的隱私泄漏。在傳統(tǒng) FL 中,不允許客戶端公開其數(shù)據(jù)樣本的特征和標(biāo)簽。在具有結(jié)構(gòu)化數(shù)據(jù)的 FL 中,還應(yīng)考慮結(jié)構(gòu)信息的隱私。結(jié)構(gòu)信息可以通過共享鄰接矩陣直接公開,也可以通過傳輸節(jié)點(diǎn)嵌入間接公開。

3、跨客戶端的數(shù)據(jù)異構(gòu)性。與傳統(tǒng) FL 中數(shù)據(jù)異構(gòu)性來自 non-IID 數(shù)據(jù)樣本不同,F(xiàn)GML 中的圖數(shù)據(jù)包含豐富的結(jié)構(gòu)信息。同時(shí),不同客戶的圖結(jié)構(gòu)也會(huì)影響圖機(jī)器學(xué)習(xí)模型的性能。 

4、參數(shù)使用的策略。在結(jié)構(gòu)化 FL 中,客戶端圖使客戶端能夠從其相鄰客戶端獲取信息。在結(jié)構(gòu)化 FL 中,需要設(shè)計(jì)有效的策略,以充分利用由中心服務(wù)器協(xié)調(diào)或完全分散的近鄰信息。

為了應(yīng)對(duì)上述挑戰(zhàn),研究人員開發(fā)了大量算法。目前各種算法主要關(guān)注標(biāo)準(zhǔn) FL 中的挑戰(zhàn)和方法,只有少數(shù)人嘗試解決 FGML 中的具體問題和技術(shù)。有人發(fā)表對(duì) FGML 進(jìn)行分類的綜述性論文,但沒有總結(jié) FGML 中的主要技術(shù)。而有的綜述文章僅涵蓋了 FL 中數(shù)量有限的相關(guān)論文,并非常簡(jiǎn)要地介紹了目前現(xiàn)有的技術(shù)。

圖片

而在今天介紹的這篇論文中,作者首先介紹 FGML 中兩種問題設(shè)計(jì)的概念。然后,回顧了每種 shezhi 下的最新的技術(shù)進(jìn)展,還介紹了 FGML 的實(shí)際應(yīng)用。并對(duì)可用于 FGML 應(yīng)用的可訪問圖數(shù)據(jù)集和平臺(tái)進(jìn)行總結(jié)。最后,作者給出了幾個(gè)有前途的研究方向。文章的主要貢獻(xiàn)包括:

FGML 技術(shù)分類:文章給出了基于不同問題的 FGML 分類法,并總結(jié)了每個(gè)設(shè)置中的關(guān)鍵挑戰(zhàn)。

全面的技術(shù)回顧:文章全面概述了 FGML 中的現(xiàn)有技術(shù)。與現(xiàn)有其它綜述性論文相比,作者不僅研究了更廣泛的相關(guān)工作,而且提供了更詳細(xì)的技術(shù)分析,而不是簡(jiǎn)單地列出每種方法的步驟。

實(shí)際應(yīng)用:文章首次總結(jié) FGML 的實(shí)際應(yīng)用。作者根據(jù)應(yīng)用領(lǐng)域?qū)ζ溥M(jìn)行分類,并介紹每個(gè)領(lǐng)域中的相關(guān)工作。

數(shù)據(jù)集和平臺(tái):文章介紹了 FGML 中現(xiàn)有的數(shù)據(jù)集和平臺(tái),對(duì)于想在 FGML 中開發(fā)算法和部署應(yīng)用程序的工程師和研究人員非常有幫助。

未來方向:文章不僅指出了現(xiàn)有方法的局限性,而且給出了 FGML 未來的發(fā)展方向。

圖片

FGML 技術(shù)綜述 這里對(duì)文章的主要結(jié)構(gòu)做下簡(jiǎn)介。

第 2 節(jié)簡(jiǎn)要介紹了圖機(jī)器學(xué)習(xí)中的定義以及 FGML 中兩種設(shè)置的概念和挑戰(zhàn)。

第 3 節(jié)和第 4 節(jié)回顧了這兩種設(shè)置中的主流技術(shù)。第 5 節(jié)進(jìn)一步探討了 FGML 在現(xiàn)實(shí)世界中的應(yīng)用。第 6 節(jié)介紹了相關(guān) FGML 論文中使用的開放圖數(shù)據(jù)集和 FGML 的兩個(gè)平臺(tái)。在第 7 節(jié)中提供了未來可能的發(fā)展方向。

最后第 8 節(jié)對(duì)全文進(jìn)行了總結(jié)。更多詳細(xì)信息請(qǐng)參考原論文。


責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2018-06-04 10:58:46

機(jī)器學(xué)習(xí)預(yù)測(cè)應(yīng)用API

2022-02-09 08:55:13

RAID獨(dú)立冗余磁盤陣列數(shù)據(jù)丟失

2018-11-13 17:12:53

戴爾

2019-08-12 08:43:53

GitHub代碼開發(fā)者

2023-06-19 10:32:49

持續(xù)學(xué)習(xí)

2023-02-26 14:17:44

2024-04-26 14:18:43

機(jī)器學(xué)習(xí)人工智能

2023-05-11 15:24:12

2022-02-17 12:57:18

Kali LinuxLinux

2020-11-08 13:33:05

機(jī)器學(xué)習(xí)數(shù)據(jù)中毒人工智能

2017-07-21 10:42:27

自動(dòng)駕駛應(yīng)用機(jī)器學(xué)習(xí)

2017-10-24 11:19:16

深度學(xué)習(xí)機(jī)器學(xué)習(xí)數(shù)據(jù)

2022-01-06 07:45:44

機(jī)器學(xué)習(xí)算法思路

2018-08-23 04:26:54

合成數(shù)據(jù)機(jī)器學(xué)習(xí)數(shù)據(jù)集

2018-10-18 11:00:50

人工智能機(jī)器學(xué)習(xí)模型偏差

2019-11-29 17:26:56

大數(shù)據(jù)分布式計(jì)算技術(shù)

2018-05-13 16:06:55

數(shù)據(jù)科學(xué)機(jī)器學(xué)習(xí)面試

2017-08-07 10:08:29

深度學(xué)習(xí)分類體系信息檢索

2020-10-09 10:10:28

編程小程序開發(fā)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)