自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

這個(gè)圖聚類Python工具火了:社群結(jié)構(gòu)可視化、檢測(cè)

新聞 開發(fā)工具
最近,又有一款Python可視化工具火了。這一次,功能是針對(duì)圖聚類問(wèn)題的社群結(jié)構(gòu)進(jìn)行檢測(cè)、可視化。

本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

 最近,又有一款Python可視化工具火了。

這一次,功能是針對(duì)圖聚類問(wèn)題的社群結(jié)構(gòu)進(jìn)行檢測(cè)、可視化。

這個(gè)圖聚類Python工具火了:社群結(jié)構(gòu)可視化、檢測(cè) |開源

該項(xiàng)目的帖子在reddit上一經(jīng)發(fā)布,就被頂?shù)搅?ldquo;機(jī)器學(xué)習(xí)板塊”的榜首

這個(gè)圖聚類Python工具火了:社群結(jié)構(gòu)可視化、檢測(cè) |開源

一起來(lái)看看它究竟都能用來(lái)做什么吧~

功能亮點(diǎn)

這款工具叫作communities, 是一個(gè)Python庫(kù),用于圖聚類問(wèn)題的社群結(jié)構(gòu)檢測(cè)。

它支持多種算法,包括:

  • Louvain算法;
  • Girvan-Newman算法;
  • 層次聚類算法;
  • 光譜聚類算法;
  • Bron-Kerbosch算法。

更贊的是,communities還可以實(shí)現(xiàn)這些算法的可視化。

具體了解一下~

導(dǎo)入算法并插入矩陣

這里以Louvain算法為例。

這是一種基于模塊度的社群發(fā)現(xiàn)算法,也是貪心算法。

它根據(jù)頂點(diǎn)的共享邊將頂點(diǎn)排列成社群結(jié)構(gòu),也就是說(shuō),它將節(jié)點(diǎn)分為幾個(gè)社群,每個(gè)社群之間共享很少的連接,但是同一社群的節(jié)點(diǎn)之間共享許多連接。

最終,讓整個(gè)社群網(wǎng)絡(luò)呈現(xiàn)出一種模塊聚集的結(jié)構(gòu),實(shí)現(xiàn)整個(gè)社群網(wǎng)絡(luò)的模塊度的最大化。

所以首先,我們需要構(gòu)建一個(gè)表示無(wú)向圖的鄰接矩陣,可以加權(quán),也可以不加權(quán),矩陣為2Dnumpy數(shù)組。

n*n矩陣則表示有n個(gè)節(jié)點(diǎn),矩陣的每個(gè)位置分別表示各節(jié)點(diǎn)之間邊的關(guān)系,有邊則為1,沒(méi)有邊則為0。

然后,只需從communities.algorithms中導(dǎo)入算法并插入矩陣。

  1. import numpy as np 
  2. from communities.algorithms import louvain_method 
  3. adj_matrix = np.array([[011000], 
  4.                        [101000], 
  5.                        [110100], 
  6.                        [001011], 
  7.                        [000101], 
  8.                        [000110]]) 
  9. communities, _ = louvain_method(adj_matrix) 
  10. # >>> [{012}, {345}] 

接下來(lái)輸出社群列表,每個(gè)社群即為一組節(jié)點(diǎn)。

實(shí)現(xiàn)可視化,并進(jìn)行顏色編碼

利用communities將圖進(jìn)行可視化,將節(jié)點(diǎn)分到社群中并進(jìn)行顏色編碼,還可以選擇深色或淺色背景、保存圖片、選擇圖片的分辨率等等 。

draw_communities(adj_matrix : numpy.ndarray, communities : list, dark : bool = False, filename : str = None, seed : int = 1)

其中各參數(shù)的具體含義為:

  • adj_matrix (numpy.ndarray):圖的鄰接矩陣;
  • dark (bool, optional (default=False)):如果為 True, 則繪圖為深色背景,否則為淺色背景;
  • filename (str or None, optional (default=None)):通過(guò) filename 路徑可以將圖另存為PNG格式; 設(shè)置 None 則是用交互方式顯示圖;
  • dpi (int or None, optional (default=None)):每英寸的點(diǎn)數(shù),控制圖像的分辨率;
  • seed (int, optional (default=2)):隨機(jī)種子。

具體到Louvain算法的可視化,代碼是這樣的:

  1. from communities.algorithms import louvain_method 
  2. from communities.visualization import draw_communities 
  3. adj_matrix = [...] 
  4. communities, frames = louvain_method(adj_matrix) 
  5. draw_communities(adj_matrix, communities) 
這個(gè)圖聚類Python工具火了:社群結(jié)構(gòu)可視化、檢測(cè) |開源

動(dòng)畫呈現(xiàn)算法

communities 還可以動(dòng)畫呈現(xiàn)節(jié)點(diǎn)分配到社群的過(guò)程。

louvain_animation(adj_matrix : numpy.ndarray, frames : list, dark : bool = False, duration : int = 15, filename : str = None, dpi : int = None, seed : int = 2)

其中各參數(shù)的含義如下:

  • adj_matrix (numpy.ndarray):圖的鄰接矩陣;
  • frames (list):算法每次迭代的字典列表;
  • 每個(gè)字典都有倆個(gè)鍵:“C”包含節(jié)點(diǎn)到社群的查找表,“Q”表示圖的模塊度數(shù)值;
  • 此字典列表是 louvain_method的第二個(gè)返回值;
  • dark (bool, optional (default=False)):如果為 True, 則動(dòng)畫為深色背景和配色方案,否則為淺色方案;
  • duration (int, optional (default=15)):動(dòng)畫所需的持續(xù)時(shí)間,以秒為單位;
  • filename (str or None, optional (default=None)):通過(guò)filename 路徑將動(dòng)畫存為GIF;設(shè)置None則以交互方式展示動(dòng)畫;
  • dpi (int or None, optional (default=None)):每英寸點(diǎn)數(shù),控制動(dòng)畫的分辨率;
  • seed (int, optional (default=2)):隨機(jī)種子。

例如,空手道俱樂(lè)部網(wǎng)絡(luò)中Louvain算法的動(dòng)畫呈現(xiàn):

  1. from communities.algorithms import louvain_method 
  2. from communities.visualization import louvain_animation 
  3. adj_matrix = [...] 
  4. communities, frames = louvain_method(adj_matrix) 
  5. louvain_animation(adj_matrix, frames) 
這個(gè)圖聚類Python工具火了:社群結(jié)構(gòu)可視化、檢測(cè) |開源

我們可以看到Louvain算法的動(dòng)態(tài)過(guò)程:

  • 首先掃描數(shù)據(jù)中的所有節(jié)點(diǎn),將每個(gè)節(jié)點(diǎn)看做一個(gè)獨(dú)立的社群;
  • 接下來(lái),遍歷每個(gè)節(jié)點(diǎn)的鄰居節(jié)點(diǎn),判斷是否將該節(jié)點(diǎn)加入鄰居節(jié)點(diǎn)所在的社群,以提升模塊度;
  • 這一過(guò)程重復(fù)迭代,直到每一個(gè)節(jié)點(diǎn)的社群歸屬穩(wěn)定;
  • 最后,將所有在同一個(gè)社群的節(jié)點(diǎn)壓縮成一個(gè)新節(jié)點(diǎn),計(jì)算新節(jié)點(diǎn)的權(quán)重,直到整個(gè)圖的模塊度穩(wěn)定。

大家可以通過(guò)文末鏈接,自行嘗試一下其他算法~

此外,它還可以用于社群間鄰接矩陣、拉普拉斯矩陣以及模塊度矩陣等。

對(duì)于這款工具,不少網(wǎng)友發(fā)出“awesome”、“really cool!”等花式贊嘆,表示正是自己需要的。

當(dāng)然,也有網(wǎng)友提出疑問(wèn),例如:是否可以指定執(zhí)行的迭代次數(shù)(例如:提前停止)?

開發(fā)者對(duì)此表示:不能,但是對(duì)于某些算法,可以指定要將圖形劃分為多少個(gè)社群。

這個(gè)圖聚類Python工具火了:社群結(jié)構(gòu)可視化、檢測(cè) |開源

作者簡(jiǎn)介

[[383607]]

項(xiàng)目開發(fā)者Jonathan Shobrook,他目前是美國(guó)一家電商公司的軟件工程師。

之前GitHub上的熱門項(xiàng)目Rebound,也是出自他手,已經(jīng)獲得3.5k星。

更多信息可戳下方鏈接了解~

相關(guān)鏈接:

[1]https://github.com/shobrook/communities

[2]https://www.reddit.com/r/MachineLearning/comments/lozys9/p_i_made_communities_a_library_of_clustering/

 

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2021-03-08 09:48:35

圖聚類Python可視化

2023-03-27 23:42:29

樹狀圖開發(fā)可視化

2021-02-21 08:11:46

PythonDash工具

2021-10-08 09:27:11

Python圖形化工具

2024-08-20 14:31:16

2022-08-26 09:15:58

Python可視化plotly

2021-07-27 11:45:37

Python 開發(fā)編程

2020-03-11 14:39:26

數(shù)據(jù)可視化地圖可視化地理信息

2021-08-05 10:46:59

GitHub代碼開發(fā)者

2018-07-11 12:30:51

編程語(yǔ)言Python數(shù)據(jù)可視化

2023-05-06 12:57:34

Python工具

2021-07-02 14:07:00

可視化Plotly漏斗圖

2021-01-21 14:53:31

工具Python開發(fā)

2022-03-03 13:02:37

可視化網(wǎng)頁(yè)低代碼編程工具

2021-02-07 20:23:09

GoogeBlockly可視化編程

2018-05-31 08:25:13

誤區(qū)工具可視化

2022-07-13 15:54:14

Matplotlib圖表

2017-10-14 13:54:26

數(shù)據(jù)可視化數(shù)據(jù)信息可視化

2009-04-21 14:26:41

可視化監(jiān)控IT管理摩卡

2014-04-23 09:21:38

大數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)