使用PyGWalker可視化分析表格型數(shù)據(jù)
簡(jiǎn)介
想象一下,在Jupyter Notebook中擁有大量數(shù)據(jù),想要對(duì)其進(jìn)行分析和可視化。PyGWalker就像一個(gè)神奇的工具,能讓這項(xiàng)工作變得超級(jí)簡(jiǎn)單。它能獲取用戶(hù)的數(shù)據(jù),并將其轉(zhuǎn)化為一種特殊的表格,可以與之交互,就像使用Tableau一樣??梢灾庇^地探索數(shù)據(jù),玩轉(zhuǎn)數(shù)據(jù),查看模式和洞察力,而不會(huì)迷失在復(fù)雜的代碼中。PyGWalker簡(jiǎn)化了一切,讓用戶(hù)可以毫不費(fèi)力地快速分析和理解數(shù)據(jù)。PyGWalker由Kanaries開(kāi)發(fā)。
【官方GitHub代碼庫(kù)】:
https://github.com/Kanaries/pygwalker
【代碼】:
Google Colab(https://colab.research.google.com/drive/171QUQeq-uTLgSj1u-P9DQig7Md1kpXQ2?usp=sharing)
Kaggle Notebook(https://www.kaggle.com/code/asmdef/pygwalker-test/notebook)
【開(kāi)發(fā)者簡(jiǎn)介】:
https://github.com/ObservedObserver
具體探索
通過(guò)pip安裝PyGWalker庫(kù)。
!pip install pygwalker -q
要開(kāi)始在Jupyter Notebook中使用PyGWalker,需要導(dǎo)入兩個(gè)基本庫(kù):pandas和pygwalker。
import pandas as pd
import pygwalker as pyg
import pandas as pd這一行允許你處理表格格式的數(shù)據(jù),而import pygwalker as pyg則引入了PyGWalker庫(kù)。
導(dǎo)入后,你就可以將PyGWalker無(wú)縫地集成到現(xiàn)有工作流程中。
例如,你可以使用pandas加載數(shù)據(jù)。
df = pd.read_csv('my_data.csv')
然后,你可以創(chuàng)建一個(gè)PyGWalker實(shí)例,命名為“gwalker”,將數(shù)據(jù)幀作為參數(shù)傳遞,如下所示:
gwalker = pyg.walk(df)
執(zhí)行提供的命令后,代碼單元格下方會(huì)出現(xiàn)一個(gè)新的輸出。該輸出將包含一個(gè)交互式用戶(hù)界面。
圖片
該界面提供了各種拖放功能,可用于分析和探索數(shù)據(jù)。它提供了一種與數(shù)據(jù)交互的便捷互動(dòng)方式,讓你能夠執(zhí)行可視化數(shù)據(jù)、探索關(guān)系等任務(wù)。
有了PyGWalker,你現(xiàn)在就擁有了一個(gè)類(lèi)似于Tableau的用戶(hù)界面,可以對(duì)數(shù)據(jù)進(jìn)行分析和可視化。
圖片
PyGWalker提供了改變標(biāo)記類(lèi)型的靈活性,使你能夠創(chuàng)建不同的圖表。例如,你可以通過(guò)選擇所需的變量和線條標(biāo)記類(lèi)型,輕松切換到折線圖。
圖片
你還可以通過(guò)創(chuàng)建拼接視圖來(lái)比較不同的測(cè)量值。通過(guò)將多個(gè)測(cè)量值添加到行或列,可以輕松地對(duì)它們進(jìn)行并排分析和比較。
圖片
你可以根據(jù)特定類(lèi)別或特征將數(shù)據(jù)整理成不同的部分。這有助于對(duì)數(shù)據(jù)的不同子集進(jìn)行單獨(dú)分析和比較。
圖片
PyGWalker允許你以表格格式查看數(shù)據(jù),并自定義分析類(lèi)型和語(yǔ)義類(lèi)型。你可以輕松地以結(jié)構(gòu)化的方式將數(shù)據(jù)可視化,并根據(jù)具體需求調(diào)整數(shù)據(jù)分析和解釋的方式。
圖片
你還可以將數(shù)據(jù)探索結(jié)果保存到本地文件中。
總結(jié)
PyGWalker是一個(gè)提供多種功能的通用庫(kù)。探索這個(gè)強(qiáng)大的工具可以提高你在數(shù)據(jù)分析和可視化方面的技能。