自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

提高復雜網(wǎng)絡分析效率!中國科學家研發(fā)強化學習新框架

新聞 人工智能
近日,中國國防科技大學、美國加州大學洛杉磯分校和哈佛醫(yī)學院的研究人員研發(fā)了一個深度強化學習框架FINDER。相比于現(xiàn)有的解決方案,F(xiàn)INDER能夠更快速、更高效地找到復雜網(wǎng)絡中一組最關鍵的節(jié)點,進而使復雜網(wǎng)絡以較高的效率運行。

   提高復雜網(wǎng)絡分析效率!中國科學家研發(fā)強化學習新框架

近日,中國國防科技大學、美國加州大學洛杉磯分校和哈佛醫(yī)學院的研究人員研發(fā)了一個深度強化學習框架FINDER。相比于現(xiàn)有的解決方案,F(xiàn)INDER能夠更快速、更高效地找到復雜網(wǎng)絡中一組最關鍵的節(jié)點,進而使復雜網(wǎng)絡以較高的效率運行。

這項研究發(fā)表在國際期刊《自然》旗下的《自然–機器智能》上,論文標題為《用深度強化學習找到復雜網(wǎng)絡的關鍵參與者(Finding key players in complex networks through deep reinforcement learning)》。

論文鏈接:
https://www.nature.com/articles/s42256-020-0177-2

提高復雜網(wǎng)絡分析效率!中國科學家研發(fā)強化學習新框架

一、FINDER:適用場景更廣泛,運行速度快出幾個數(shù)量級

在物理科學、信息科學、生物科學等領域的研究中,研究人員可以通過建立網(wǎng)絡拓撲結(jié)構(gòu)來模擬實際情況、進而作出預測。

在這類復雜網(wǎng)絡的運行過程中,節(jié)點間的配合直接決定了復雜網(wǎng)絡運行的效率。當被用于解決NP難題(NP-hard)時,復雜網(wǎng)絡中節(jié)點的“分工協(xié)作”尤其重要。

NP難題指的是在多項式時間內(nèi)可以被驗證其正確性的問題。比如,在疫情防控領域,復雜網(wǎng)絡模型可以模擬出疫情傳播情況、幫助找到疫苗藥物分子等。運行這些任務時,復雜網(wǎng)絡要推演和驗證病毒是否會傳染給下一個人、某種藥物分子是否有效的各種情況。在這個過程中,找到最關鍵的節(jié)點能夠提升復雜網(wǎng)絡的運行效率。

對于這類問題,現(xiàn)有的解決方案通?;诖笮途W(wǎng)絡進行訓練、針對特定場景提出策略,但缺乏統(tǒng)一的框架。相比之下,中國國防科技大學、加州大學洛杉磯分校、哈佛醫(yī)學院的研究人員提出的FINDER可以應用于廣泛的復雜網(wǎng)絡場景,其運行速度快了幾個數(shù)量級。

二、分兩階段進行訓練,分別采用不同獎勵函數(shù)

FINDER框架采用純數(shù)據(jù)驅(qū)動的方法,分兩個階段進行訓練。在兩個階段中,研究人員用不同的獎勵函數(shù)來訓練FINDER。

第一階段用經(jīng)典模型生成的小型合成網(wǎng)絡對FINDER進行離線訓練。離線訓練采用ϵ-greedy策略。

離線訓練階段分三步進行:首先,研究人員生成一批合成圖形;然后,研究人員從合成圖形中任意取樣一個圖形;接下來,F(xiàn)INDER框架在這一圖形上進行整個尋找關鍵節(jié)點的流程。這一流程中,代理與圖形通過一系列狀態(tài)、動作、激勵進行交互。

為了確定狀態(tài)的正確動作,代理先在當前的圖形上編碼,并獲取每個節(jié)點的嵌入向量。節(jié)點的嵌入向量會捕獲節(jié)點的結(jié)構(gòu)信息和節(jié)點特征之間的長程相互作用(long-range interaction)。接下來,代理將嵌入向量解碼為標量Q值,以便所有節(jié)點能夠預測部署某個動作的長程增益。

提高復雜網(wǎng)絡分析效率!中國科學家研發(fā)強化學習新框架

▲離線訓練階段示意圖

一旦離線訓練結(jié)束,F(xiàn)INDER就進入第二個訓練階段,被應用于真實網(wǎng)絡拓撲結(jié)構(gòu)中。研究人員在浣熊接觸網(wǎng)絡(the raccoon contact network)的最大連通元件(connected component)上進行測試。最大連通元件包括14個節(jié)點和20條邊。

這一階段中,代理首先將當前網(wǎng)絡編碼為低維嵌入向量,然后利用這些向量對每個節(jié)點的Q值進行解碼。

第二階段采用“批量節(jié)點選擇(batch nodes selection)”策略。該策略在每個自適應步驟中選擇一個有限分數(shù)的最高Q節(jié)點,避免了對嵌入向量和Q值的逐個迭代選擇和重新計算。批量節(jié)點選擇策略不會影響最終的結(jié)果,但可以降低幾個數(shù)量級的時間復雜度。

研究人員會重復這個過程,直到復雜網(wǎng)絡達到用戶定義的終端狀態(tài)、被移除的節(jié)點構(gòu)成最優(yōu)的節(jié)點集合。

提高復雜網(wǎng)絡分析效率!中國科學家研發(fā)強化學習新框架

▲用真實復雜網(wǎng)絡進行訓練示意圖

三、對比3個模型性能,F(xiàn)INDER找出關鍵節(jié)點的效率最高

相比于機器人等傳統(tǒng)的強化學習技術(狀態(tài)和動作較為簡單),復雜網(wǎng)絡技術更加復雜和難以表示。研究團隊高級研究員孫怡舟稱,這是因為復雜網(wǎng)絡具有離散的數(shù)據(jù)結(jié)構(gòu)和處于極其高維的空間。

本項研究中,研究人員用圖神經(jīng)網(wǎng)絡(GNN)來解決這個問題。圖神經(jīng)網(wǎng)絡中的節(jié)點代表動作、圖形代表狀態(tài)。

以911恐怖襲擊事件發(fā)生預測網(wǎng)絡為例,網(wǎng)絡中每個節(jié)點代表參與911恐襲的恐怖分子、每個邊(edge)代表他們的社會交流。

研究人員在911恐怖襲擊事件發(fā)生預測網(wǎng)絡上運行FINDER框架,并運行現(xiàn)有的高維(HD)方法和集體影響(CI)方法做對比。

下圖d顯示了三種方法的ANC曲線。在框架部署動作后,剩余節(jié)點的重要性越低,代表框架性能越好。

可以看到,F(xiàn)INDER框架最有效地找到了復雜網(wǎng)絡中關鍵節(jié)點。相比于其他兩個解決方案,隨著被移除節(jié)點的重要性升高,運行FINDER框架的復雜網(wǎng)絡中剩余的節(jié)點重要性最低。

▲911恐怖襲擊事件發(fā)生預測網(wǎng)絡(藍色點代表剩余圖形中的節(jié)點,紅色點代表當前時間步長中FINDER找出的關鍵節(jié)點,灰色點代表剩余的孤立節(jié)點)

結(jié)語:未來將可用于更多類型復雜網(wǎng)絡

FINDER框架通過深度強化學習方法進行訓練,可以找到復雜網(wǎng)絡中的關鍵節(jié)點。在未來,F(xiàn)INDER框架或可被用于優(yōu)化社交網(wǎng)絡、電力網(wǎng)絡、傳染病蔓延網(wǎng)絡等模型的性能。

目前,加州大學洛杉磯分校的研究團隊正計劃將FINDER框架用于網(wǎng)絡科學研究。哈佛醫(yī)學院的團隊希望將FINDER用于生物網(wǎng)絡,以確定蛋白質(zhì)交互網(wǎng)絡和基因調(diào)控網(wǎng)絡中的關鍵參與者。

另外,研究人員稱未來將從以下三方面著手,提升框架尋找關鍵節(jié)點的性能:設計出更好的圖形表示學習架構(gòu);探索如何在跨圖形甚至跨域轉(zhuǎn)移知識;研究并解決復雜網(wǎng)絡上的其他NP難題。

 

責任編輯:張燕妮 來源: 智東西
相關推薦

2012-05-11 16:38:07

2024-12-06 09:00:00

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學家

2012-12-06 15:36:55

CIO

2020-08-10 06:18:24

應用程序代碼開發(fā)

2023-11-03 20:35:57

AI人工智能

2025-02-03 00:00:01

Ai2o1LLM

2020-12-09 06:25:19

ETL數(shù)據(jù)分析數(shù)據(jù)科學家

2020-03-20 14:40:48

數(shù)據(jù)科學Python學習

2022-11-03 14:13:52

強化學習方法

2013-09-11 14:13:39

2012-12-26 10:51:20

數(shù)據(jù)科學家

2025-03-03 09:12:00

2022-11-03 14:13:24

騰訊科學家

2023-03-20 13:39:00

數(shù)據(jù)分析開源

2018-12-24 08:37:44

數(shù)據(jù)科學家數(shù)據(jù)模型

2018-01-25 14:19:32

深度學習數(shù)據(jù)科學遷移學習

2020-06-01 13:52:15

AWSSageMaker

2020-04-15 16:44:38

谷歌強化學習算法
點贊
收藏

51CTO技術棧公眾號