自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

第四范式NeurIPS 2020:知識圖譜嵌入的自動化

新聞 人工智能 知識圖譜 自動化
前不久,來自第四范式的資深研究員姚權(quán)銘博士和大家分享了其參與并被 NeurIPS 2020 接收的論文《Interstellar: Searching Recurrent Architecture for Knowledge Graph Embedding》。

 前不久,來自第四范式的資深研究員姚權(quán)銘博士和大家分享了其參與并被 NeurIPS 2020 接收的論文《Interstellar: Searching Recurrent Architecture for Knowledge Graph Embedding》。

[[354582]]

 

這項(xiàng)研究受神經(jīng)架構(gòu)搜索(NAS)的啟發(fā),提出將 Interstellar 作為一種處理關(guān)系路徑中信息的循環(huán)架構(gòu)。此外,該研究中的新型混合搜索算法突破了 stand-alone 和 one-shot 搜索方法的局限,并且有希望應(yīng)用于其他具有復(fù)雜搜索空間的領(lǐng)域。

視頻鏈接:https://v.qq.com/x/page/n3207ugke4j.html?start=6

知識圖譜嵌入(Knowledge Graph Embedding)目前在學(xué)習(xí)知識圖譜(KG)中的知識表達(dá)上具有很強(qiáng)的能力。在以往的研究中,很多工作主要針對單個(gè)三元組(triplet)建模,然而對 KG 而言,三元組間的長鏈依賴信息在一些任務(wù)上也很重要。

在第四范式、香港科技大學(xué)這篇被 NeurIPS 2020 會議接收的論文中,研究者基于由三元組組成的關(guān)系路徑(relational path)提出 Interstellar 模型,通過搜索一種遞歸神經(jīng)網(wǎng)絡(luò),來處理關(guān)系路徑中的短鏈、長鏈信息。

第四范式NeurIPS 2020:知識圖譜嵌入的自動化

論文鏈接:https://arxiv.org/pdf/1911.07132.pdf

代碼鏈接:https://github.com/AutoML-4Paradigm/Interstellar

首先,該研究通過一組模擬實(shí)驗(yàn)分析了用單一模型對不同任務(wù)中關(guān)系路徑建模的難度,并由此提出通過搜索的方式對不同任務(wù)針對性地建模。為了提高搜索效率,該研究提出了一種混合搜索算法(hybrid-search algorithm),在鏈接預(yù)測(link prediction)和結(jié)點(diǎn)匹配(entity alignment)任務(wù)上,能高效地搜索到具有更好效果的模型。

背景介紹

第四范式NeurIPS 2020:知識圖譜嵌入的自動化

知識圖譜嵌入(KG Embedding)旨在把圖譜中的結(jié)點(diǎn)(entities)和關(guān)系(relations)映射到一個(gè)低維空間,同時(shí)保留圖中的重要性質(zhì)。在目前學(xué)術(shù)領(lǐng)域,一些工作基于單個(gè)三元組(s,r,o)建模,如 TransE、RESCAL、DistMult、RotatE、ConvE、SimplE 等,它們在鏈接預(yù)測任務(wù)(即給定頭結(jié)點(diǎn) s 和關(guān)系 r ,預(yù)測尾結(jié)點(diǎn) o )上表現(xiàn)良好,而在結(jié)點(diǎn)匹配任務(wù)(即給定兩個(gè) KG,預(yù)測哪些結(jié)點(diǎn)有相同含義)上性能一般。另一類基于關(guān)系路徑的工作,如 IPTransE、Chains、RSN 等則在結(jié)點(diǎn)匹配任務(wù)上表現(xiàn)更好。

研究人員觀察到,關(guān)系路徑包含多種重要信息,如單個(gè)三元組的短鏈信息、多個(gè)關(guān)系的復(fù)合、多個(gè)三元組之間的長鏈信息等等。基于此,該研究提出 Interstellar 模型,通過搜索的方式來根據(jù)不同任務(wù),有針對性地對關(guān)系路徑進(jìn)行建模。

動機(jī)

為了驗(yàn)證不同模型對不同任務(wù)的擬合能力不同,研究人員設(shè)計(jì)了一組模擬實(shí)驗(yàn)。Countries 數(shù)據(jù)集有 S1-S3 三個(gè)不同任務(wù),預(yù)測難度逐一增大,需要模擬的預(yù)測路徑逐漸變長。為此研究者基于先驗(yàn)知識(prior knowledge)設(shè)計(jì)了 4 類模式 P1-P4,分別用于建模單個(gè)三元組、連續(xù)的兩個(gè)三元組、多重關(guān)系的復(fù)合,以及全遞歸連接。直觀上看,P4 的建模能力更強(qiáng),但在有限的樣本上,樣本復(fù)雜度同樣重要,選擇更能擬合數(shù)據(jù)規(guī)律的模型能夠獲得更好的效果。

如下表所示,在 S1 這個(gè)簡單任務(wù)上,基于單個(gè)或兩個(gè)三元組的模型 P1 和 P2 表現(xiàn)更好,在 S2 上 P1-P3 均優(yōu)于 P4,而在 S3 上,遞歸模型 P4 由于能模擬更長路徑而勝出。由此我們可以得出,關(guān)系路徑上的建模應(yīng)該是模型相關(guān)的,如果我們能夠通過搜索的方式把專家的先驗(yàn)知識融入到建模能力中,那么針對不同任務(wù),模型就可以自動地找到更優(yōu)解。

第四范式NeurIPS 2020:知識圖譜嵌入的自動化

問題定義與搜索空間

第四范式NeurIPS 2020:知識圖譜嵌入的自動化

首先,研究者將 Interstellar 定義為一個(gè)遞歸式地處理關(guān)系路徑的模型,在每一個(gè)遞歸步中,模型關(guān)注到一個(gè)三元組,信息在三元組之內(nèi)、之間以不同方式穿梭。與傳統(tǒng) RNN 不同,這里的每一步有兩個(gè)輸入,同時(shí)由于需要考慮知識圖譜相關(guān)的領(lǐng)域知識,單純地使用 RNN 對其建模是不合適的。為了利用好知識圖譜領(lǐng)域的先驗(yàn)知識,同時(shí)使模型可以適用于不同任務(wù),受神經(jīng)網(wǎng)絡(luò)搜索技術(shù)(Neural Architecture Search)的啟發(fā),該研究把建模問題定義為搜索問題,來自適應(yīng)地對不同任務(wù)建模。

通過對知識圖譜嵌入領(lǐng)域相關(guān)模型的總結(jié),該研究提出上圖的搜索空間,利用運(yùn)算單元 O_s 來處理結(jié)點(diǎn)嵌入 s_t ,用 O_r 來處理關(guān)系嵌入 r_t ,用 O_v 來輸出向量 v_t 從而預(yù)測下一個(gè)結(jié)點(diǎn) s_t+1 。具體而言,該研究在 macro-level 搜索不同單元間的連接方式(connections)和復(fù)合方式(combinators),在 micro-level 搜索激活函數(shù)(activation)與權(quán)重矩陣(weight matrix)。

搜索算法

第四范式NeurIPS 2020:知識圖譜嵌入的自動化

該研究的目標(biāo)是更快地在搜索空間中找到能在驗(yàn)證集上達(dá)到更好性能的模型,這可以通過 bi-level 優(yōu)化方式來定義。為了求解這個(gè)優(yōu)化問題,學(xué)術(shù)界目前有兩類方法。一類是 stand-alone 算法,對每個(gè)模型單獨(dú)訓(xùn)練參數(shù) F 至收斂,這樣可以得到準(zhǔn)確的性能評估 Μ ,但訓(xùn)練代價(jià)較高;另一類是 one-shot 算法,建立一個(gè)包含所有網(wǎng)絡(luò)的超網(wǎng)絡(luò)(supernet),不同模型在超網(wǎng)絡(luò)中采樣,同時(shí)可以參數(shù)共享,這樣的評估方式更高效,但不總能保證可靠性。研究人員觀察到在 Interstellar 的建模上,one-shot 方式并不可靠。

為了解決這些問題,該研究提出 Hybrid 搜索算法,在 macro-level 采用 stand-alone 方式,給定 α_2 ,從 Α_1 中采樣不同的 α_1 ,訓(xùn)練模型參數(shù)至收斂,拿到對 α_1 的可靠評估;在 micro-level 采用 one-shot 方式,給定 α_1 ,從 Α_2 中采樣不同的 α_2 ,同時(shí)讓不同 α_2 對應(yīng)的模型在超網(wǎng)絡(luò)中共享參數(shù),加速訓(xùn)練評估的過程。二者結(jié)合,即保證了搜索準(zhǔn)確性,又保證了搜索效率。

實(shí)驗(yàn)結(jié)果

在搜索效果上,該方法在結(jié)點(diǎn)匹配和鏈接預(yù)測任務(wù)中,都能針對不同數(shù)據(jù)任務(wù)搜索到更好的模型,這得益于 Interstellar 上合理的搜索空間和高效的搜索算法。

第四范式NeurIPS 2020:知識圖譜嵌入的自動化

在搜索效率上,Hybrid 算法能夠比隨機(jī)搜索(Random)、強(qiáng)化學(xué)習(xí)(Reinforce)、貝葉斯優(yōu)化(Bayes)算法更快地得到更好的模型,同時(shí)下圖中的兩條虛線(表示單獨(dú)的 one-shot 算法)表明其在這個(gè)問題上性能并不好。在搜索時(shí)間上,Hybrid 算法和調(diào)參(如 learning rate、batch size 等參數(shù))時(shí)間是相當(dāng)?shù)?,說明這個(gè)搜索方法代價(jià)并不高。在新的問題中,先搜索模型再進(jìn)行調(diào)參是一個(gè)不錯(cuò)的選擇。

第四范式NeurIPS 2020:知識圖譜嵌入的自動化

 

 

 

責(zé)任編輯:張燕妮 來源: 機(jī)器之心Pro
相關(guān)推薦

2024-10-08 10:37:12

語言數(shù)據(jù)自然語言

2023-08-22 15:34:01

Python開發(fā)

2017-03-06 16:48:56

知識圖譜構(gòu)建存儲

2021-01-19 10:52:15

知識圖譜

2025-04-27 00:10:00

AI人工智能知識圖譜

2021-01-25 10:36:32

知識圖譜人工智能

2023-08-17 08:29:22

2017-04-13 11:48:05

NLP知識圖譜

2021-01-18 10:50:29

知識圖譜人工智能深度學(xué)習(xí)

2024-07-26 11:42:28

2024-06-03 07:28:43

2021-01-18 10:42:36

深度學(xué)習(xí)知識圖譜

2020-11-13 15:38:12

深度學(xué)習(xí)編程人工智能

2020-04-30 09:22:06

人工智能知識圖譜研究

2022-08-11 14:11:14

知識圖譜人工智能

2022-03-01 15:14:36

圖數(shù)據(jù)庫知識圖譜

2025-04-18 12:49:58

知識圖譜大模型人工智能

2019-05-07 10:01:49

Redis軟件開發(fā)

2021-02-01 22:41:05

語義網(wǎng)知識圖譜

2017-05-04 13:18:18

深度學(xué)習(xí)知識圖譜
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號