自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

沒有完整圖時,如何使用圖深度學(xué)習(xí)?

人工智能 機器學(xué)習(xí) 新聞
自從神經(jīng)網(wǎng)絡(luò)提出以來,其在人臉識別、語音識別等方面表現(xiàn)出卓越的性能。以前需要人工提取特征的機器學(xué)習(xí)任務(wù),現(xiàn)在通過端到端的方法就能解決。

 流形學(xué)習(xí),自 2000 年在著名的科學(xué)雜志《Science》被首次提出以來,已成為信息科學(xué)領(lǐng)域的研究熱點??赡芎芏嗳藭?,流形學(xué)習(xí)有什么用呢?首先流形學(xué)習(xí)可以作為一種數(shù)據(jù)降維的方式,第二,流形能夠刻畫數(shù)據(jù)的本質(zhì)。其主要代表方法有等距映射、局部線性嵌入等。那么,具有流形學(xué)習(xí) 2.0 之稱的潛圖學(xué)習(xí)方法如何呢?

沒有完整圖時,如何使用圖深度學(xué)習(xí)?需要了解流形學(xué)習(xí)2.0版本

自從神經(jīng)網(wǎng)絡(luò)提出以來,其在人臉識別、語音識別等方面表現(xiàn)出卓越的性能。以前需要人工提取特征的機器學(xué)習(xí)任務(wù),現(xiàn)在通過端到端的方法就能解決。

傳統(tǒng)的深度學(xué)習(xí)方法在提取歐氏空間數(shù)據(jù)(比如圖片是規(guī)則的正方形柵格,語音數(shù)據(jù)是一維序列)的特征方面取得了巨大的成功。但是,在許多任務(wù)中,數(shù)據(jù)不具備規(guī)則的空間結(jié)構(gòu),即非歐氏空間下的數(shù)據(jù),如電子交易、推薦系統(tǒng)等抽象出來的圖譜,圖譜中每個節(jié)點與其他節(jié)點的連接不是固定的。在經(jīng)典的 CNN、RNN 等框架無法解決或效果不好的情況下,圖神經(jīng)網(wǎng)絡(luò)應(yīng)運而生。

沒有完整圖時,如何使用圖深度學(xué)習(xí)?需要了解流形學(xué)習(xí)2.0版本

圖左(紅框):歐氏空間數(shù)據(jù);圖右:非歐氏空間數(shù)據(jù)。

圖神經(jīng)網(wǎng)絡(luò)利用關(guān)系歸納偏置來處理以圖形式出現(xiàn)的數(shù)據(jù)。然而,在許多情況下,并沒有現(xiàn)成的圖。那么圖深度學(xué)習(xí)適用于這類情形嗎?本文將介紹潛圖學(xué)習(xí)(latent graph learning)和更早的流形學(xué)習(xí)(manifold learning)。

潛圖學(xué)習(xí)

在過去的幾年里,人們對使用機器學(xué)習(xí)方法處理圖結(jié)構(gòu)數(shù)據(jù)產(chǎn)生了濃厚的興趣。這類數(shù)據(jù)自然也出現(xiàn)在許多應(yīng)用中,例如社會科學(xué)(如 Twitter 或 Facebook 上的用戶 Follow 圖)、化學(xué)(分子可被建模為鍵連接的原子圖)或生物學(xué)(不同生物分子之間的相互作用通常被建模為相互作用組圖)。圖神經(jīng)網(wǎng)絡(luò)(GNN)是一種特別流行的圖學(xué)習(xí)方法,該算法通過在相鄰節(jié)點之間交換信息的共享參數(shù)進行局部操作。

然而,在某些情況下,沒有現(xiàn)成的圖可以作為輸入。在生物學(xué)中尤其如此,諸如蛋白質(zhì) - 蛋白質(zhì)相互作用的圖只有部分已知,因為發(fā)現(xiàn)蛋白質(zhì)相互作用的實驗費用昂貴,而且噪聲很大。因此,研究者從數(shù)據(jù)中推斷出圖并在其上應(yīng)用 GNN,并將其稱為「潛圖學(xué)習(xí)」。潛圖學(xué)習(xí)特定于應(yīng)用,并針對下游任務(wù)進行了優(yōu)化。此外,有時這樣的圖可能比任務(wù)本身更重要,因為它可以傳達關(guān)于數(shù)據(jù)的重要洞察,并提供解釋結(jié)果的方法。

潛圖學(xué)習(xí)是學(xué)習(xí)具有空邊集的圖。在這一設(shè)置中,輸入為高維特征空間中的點云。在集合上進行深度學(xué)習(xí)的方法(如 PointNet)對每個點應(yīng)用共享可學(xué)習(xí) point-wise 函數(shù),與之不同,潛圖學(xué)習(xí)還尋求跨點信息傳遞。

DGCNN

點云動態(tài)圖卷積神經(jīng)網(wǎng)絡(luò)(DGCNN)是第一個這樣的架構(gòu),該架構(gòu)由麻省理工學(xué)院的 Yue Wang 開發(fā)。受計算機圖形學(xué)中涉及 3D 點云分析問題的啟發(fā),該架構(gòu)將圖用作點云下局部光滑流形結(jié)構(gòu)的粗略表示。Yue 的一個重要發(fā)現(xiàn)是,圖在整個神經(jīng)網(wǎng)絡(luò)中不需要保持不變,事實上,它可以而且應(yīng)該動態(tài)更新——因此該方法被命名為 DGCNN。

沒有完整圖時,如何使用圖深度學(xué)習(xí)?需要了解流形學(xué)習(xí)2.0版本

DGCNN 動態(tài)構(gòu)造一個用于特征擴散的 k 近鄰圖。圖依賴于任務(wù),并在每個層之后更新。這幅圖(摘自 [4])展示了與紅點的距離(黃色代表更近的點),表明在分割任務(wù)中,更深層次的圖捕捉語義關(guān)系而不是幾何關(guān)系,如成對的機翼、發(fā)動機等。

DGM

DGCNN 的一個局限性是用相同的空間來構(gòu)造圖和圖上的特征。Anees Kazi 和 Luca Cosmo 提出了一種新的架構(gòu)——可微圖模塊(DGM),通過對圖和特征構(gòu)造進行解耦來擴展 DGCNN,如下圖所示:

沒有完整圖時,如何使用圖深度學(xué)習(xí)?需要了解流形學(xué)習(xí)2.0版本

DGM 提供了一種基于輸入數(shù)據(jù)構(gòu)造圖并在圖上擴散特征的機制。(圖源:[5])

當(dāng)應(yīng)用于醫(yī)學(xué)領(lǐng)域問題時,DGM 顯示出優(yōu)秀的結(jié)果,例如根據(jù)腦成像數(shù)據(jù)預(yù)測疾病。在這些任務(wù)中,研究者獲取到多個患者的電子健康記錄,包括人口統(tǒng)計學(xué)特征(如年齡、性別等)和大腦成像特征,并嘗試預(yù)測患者是否患有神經(jīng)系統(tǒng)疾病。之前的工作展示了 GNN 在這類任務(wù)中的應(yīng)用,方法是在一個根據(jù)人口統(tǒng)計學(xué)特征手工構(gòu)建的「病人圖」上進行特征擴散。而 DGM 提供了學(xué)習(xí)圖的優(yōu)勢,可以傳達某些特征在特定診斷任務(wù)中是如何相互依賴的。其次,DGM 在點云分類任務(wù)中也擊敗了 DGCNN,不過優(yōu)勢很小。

流形學(xué)習(xí)

DGCNN 和 DGM 在概念上與流形學(xué)習(xí)或非線性降維算法相似,流形學(xué)習(xí)很早就已出現(xiàn)并流行,且目前仍用于數(shù)據(jù)可視化。流形學(xué)習(xí)方法的基本假設(shè)是數(shù)據(jù)具有內(nèi)在的低維結(jié)構(gòu)。雖然數(shù)據(jù)可以在數(shù)百甚至數(shù)千維的空間中表示,但它卻只有幾個自由度,示例如下:

沒有完整圖時,如何使用圖深度學(xué)習(xí)?需要了解流形學(xué)習(xí)2.0版本

雖然這個數(shù)據(jù)集中的手部圖像是高維的(64x64 像素構(gòu)成 4096 個維度),但它們本質(zhì)上是低維的,可以用兩個自由度來解釋:手腕旋轉(zhuǎn)和手指伸展。流形學(xué)習(xí)算法能夠捕捉數(shù)據(jù)集的這種內(nèi)在低維結(jié)構(gòu),并將其在歐幾里德空間中進行表示。(圖源 [9])

再比如球面上的一點(即三維歐式空間上的點),可以用三元組來表示其坐標(biāo):

沒有完整圖時,如何使用圖深度學(xué)習(xí)?需要了解流形學(xué)習(xí)2.0版本

但事實上這個三維坐標(biāo)只有兩個變量 θ 和 φ,也可以說它的自由度為 2,正好對應(yīng)了它是一個二維的流形。

流形學(xué)習(xí)的目的是捕捉這些自由度,并將數(shù)據(jù)的維數(shù)降至其固有維數(shù)。流形學(xué)習(xí)與 PCA 等線性降維方法的重要區(qū)別在于,由于數(shù)據(jù)的非歐幾里德結(jié)構(gòu),我們可能無法通過線性投影恢復(fù)流形。如下圖所示,線性降維(左)為線性降維,流形學(xué)習(xí)(右)為非線性降維。

沒有完整圖時,如何使用圖深度學(xué)習(xí)?需要了解流形學(xué)習(xí)2.0版本

流形學(xué)習(xí)算法在恢復(fù)「流形」方法上各不相同,但它們有一個共同的藍圖。

首先,創(chuàng)建一個數(shù)據(jù)表示,通過構(gòu)造一個 k 近鄰圖來獲取其局部結(jié)構(gòu)。其次,計算數(shù)據(jù)的低維表示(嵌入),并試圖保留原始數(shù)據(jù)的結(jié)構(gòu)。這是大多數(shù)流形學(xué)習(xí)方法的區(qū)別所在。這種新的表示將原來的非歐幾里德結(jié)構(gòu)「展平」成一個更容易處理的歐幾里德空間。第三,一旦計算出表示,就會對其應(yīng)用機器學(xué)習(xí)算法(通常是聚類)。

沒有完整圖時,如何使用圖深度學(xué)習(xí)?需要了解流形學(xué)習(xí)2.0版本

多種流形學(xué)習(xí)方法的藍圖:首先,將數(shù)據(jù)表示為圖;其次,計算該圖的低維嵌入;第三,將 ML 算法應(yīng)用于這種低維表示。

這其中面臨的一項挑戰(zhàn)是圖構(gòu)建與 ML 算法的分離,有時需要精確的參數(shù)調(diào)整(例如鄰域數(shù)或鄰域半徑),以確定如何構(gòu)建圖才能使下游任務(wù)正常運行。流形學(xué)習(xí)算法更嚴重的缺點或許是:數(shù)據(jù)很少表示為低維的原始形式。例如,在處理圖像時,必須使用各種人工制定的特征提取技術(shù)作為預(yù)處理步驟。

圖深度學(xué)習(xí)提供了一種現(xiàn)代方法,即用單個圖神經(jīng)網(wǎng)絡(luò)代替上文提到的三個階段。例如,在 DGCNN 或 DGM 中,圖的構(gòu)造和學(xué)習(xí)是同一架構(gòu)的一部分:

沒有完整圖時,如何使用圖深度學(xué)習(xí)?需要了解流形學(xué)習(xí)2.0版本

潛圖學(xué)習(xí)可以看作是流形學(xué)習(xí)問題的一種現(xiàn)代設(shè)置,在這里,圖被學(xué)習(xí)并用作某些下游任務(wù)優(yōu)化的端到端 GNN pipeline 的一部分。

這種方法的吸引力在于:將單個數(shù)據(jù)點和它們所在的空間結(jié)合在相同的 pipeline 中。在圖像的例子中,我們可以使用傳統(tǒng)的 CNN 從每個圖像中提取視覺特征,并使用 GNN 來建模它們之間的關(guān)系。

沒有完整圖時,如何使用圖深度學(xué)習(xí)?需要了解流形學(xué)習(xí)2.0版本

PeerNet 是標(biāo)準(zhǔn) CNN 中基于圖的正則化層,可聚合來自多個圖像的相似像素,從而降低對對抗性擾動的敏感性。(圖源 [12])

潛圖學(xué)習(xí)的其它應(yīng)用

潛圖學(xué)習(xí)還有許多其他有趣的應(yīng)用。

第一是少樣本學(xué)習(xí):利用基于圖的方法從少量樣本中進行歸納(重點:只需要少量帶有標(biāo)注的樣本)。在計算機視覺中,數(shù)據(jù)標(biāo)注量從幾千到上萬不等,成本很高,因此少樣本學(xué)習(xí)變得越來越重要。

第二是生物學(xué)領(lǐng)域:人們經(jīng)常通過實驗觀察生物分子如蛋白質(zhì)的表達水平,并試圖重建它們的相互作用和信號網(wǎng)絡(luò)。

第三是對物理系統(tǒng)的分析:其中圖可以描述多個對象之間的交互作用。尤其是處理復(fù)雜粒子相互作用的物理學(xué)家,最近對基于圖的方法表現(xiàn)出了濃厚的興趣。

第四是 NLP 問題:在 NLP 領(lǐng)域中,圖神經(jīng)網(wǎng)絡(luò)可以看作是 transformer 架構(gòu)的泛化。所提到的許多問題也提出了在圖結(jié)構(gòu)中加入先驗知識,這一結(jié)構(gòu)在很大程度上仍然是開放的:例如,人們可能希望強迫圖遵守某些構(gòu)造規(guī)則或與某些統(tǒng)計模型兼容。

潛圖學(xué)習(xí),雖然不是全新的領(lǐng)域,但它為舊問題提供了新的視角。對于圖機器學(xué)習(xí)問題而言,這無疑是一個有趣的設(shè)置,為 GNN 研究人員提供了新的方向。

責(zé)任編輯:張燕妮 來源: 機器之心Pro
相關(guān)推薦

2018-01-03 10:00:39

深度學(xué)習(xí)摳圖消除背景

2021-03-24 14:32:44

人工智能深度學(xué)習(xí)

2017-05-17 15:09:06

深度學(xué)習(xí)人工智能

2023-05-19 08:00:00

ReactJSJavaScript蜘蛛圖

2022-10-11 16:34:28

深度學(xué)習(xí)模型

2023-09-26 22:13:09

深度學(xué)習(xí)

2021-05-13 15:23:31

人工智能深度學(xué)習(xí)

2020-03-25 14:20:29

微軟機器學(xué)習(xí)云計算

2017-08-03 11:00:20

2010-06-11 09:46:55

UML順序圖

2021-04-23 10:55:52

人工智能深度學(xué)習(xí)

2017-02-08 17:08:32

谷歌深度學(xué)習(xí)計算圖

2023-05-11 08:00:00

JavaScript柱狀圖

2024-11-27 08:00:00

代碼圖代碼分析開發(fā)

2022-05-06 12:13:55

模型AI

2011-03-07 09:51:12

Filezilla

2010-06-29 11:16:02

UML畫類圖

2019-01-21 09:52:26

深度學(xué)習(xí)開源人工智能

2024-06-14 16:24:42

2022-02-13 00:27:34

機器學(xué)習(xí)數(shù)字隱私技術(shù)
點贊
收藏

51CTO技術(shù)棧公眾號