使用這些 Python 工具可視化地探索數(shù)據(jù)
開源工具在推動技術(shù)進步和使其更加普及方面發(fā)揮了重要作用。數(shù)據(jù)分析也不例外。隨著數(shù)據(jù)變得越來越豐富和復(fù)雜,數(shù)據(jù)科學(xué)家 始終在尋找簡化工作流程并創(chuàng)建交互式和吸引人的可視化的方式。PyGWalker 就是為解決此類問題而設(shè)計的。
PyGWalker(Graphic Walker 的 Python 綁定)將 Python Jupyter Notebook 的工作環(huán)境連接到 Graphic Walker,以創(chuàng)建開源數(shù)據(jù)可視化工具。你可以通過簡單的拖放操作將 Pandas 數(shù)據(jù)幀 轉(zhuǎn)化為精美的數(shù)據(jù)可視化。
Exploring data through a visual interface with Pygwalker
開始使用 PyGWalker
使用 pip
安裝 PyGWalker:
$ python3 -m pip install pygwalker
導(dǎo)入 pygwalker
和 pandas
以在項目中使用它:
import pandas as pd
import pygwalker as pyg
將數(shù)據(jù)加載到 Pandas 數(shù)據(jù)報中并調(diào)用 PyGWalker:
df = pd.read_csv('./bike_sharing_dc.csv', parse_dates=['date'])
gwalker = pyg.walk(df)
你現(xiàn)在有一個圖形用戶界面來探索和可視化你的 Pandas 數(shù)據(jù)幀!
使用 Graphic Walker 探索數(shù)據(jù)
Graphic Walker 的主要功能之一是能夠更改標記類型以創(chuàng)建不同類型的圖表。例如,通過將標記類型更改為折線來創(chuàng)建折線圖。
Line charts generated by Pygwalker
你還可以通過創(chuàng)建 concat 視圖來比較不同的度量,該視圖將多個度量添加到行和列中。
Comparing data in the Graphic Walker interface.
將維度放入行或列中,以創(chuàng)建一個 facet 視圖,這個視圖包含多個子視圖,這些子視圖由一個維度中的值分隔開。
The facets view in Graphic Walker.
在 數(shù)據(jù)Data
Table data in Graphic Walker.
使用 PyGWalker 進行數(shù)據(jù)探索
你可以使用 PyGWalker 將 Pandas 數(shù)據(jù)轉(zhuǎn)換為高度可定制的圖形圖表。你也可以使用 PyGWalker 作為探索數(shù)據(jù)的強大工具,以發(fā)現(xiàn)潛在的模式、趨勢和洞察力。
數(shù)據(jù)探索選項可以在“探索模式Exploration Mode”選項(工具欄中)中找到。它們可以設(shè)置為點模式或刷模式。
- 點模式:通過將你的鼠標光標指向數(shù)據(jù)的一個特定部分來探索數(shù)據(jù)。
- 刷模式:通過在數(shù)據(jù)范圍周圍畫一個選擇框來探索數(shù)據(jù),然后拖動選擇框來查看生成的報告。
試試看你的數(shù)據(jù)
你可以在這些云演示中試用 PyGWalker:Google Colab、Binder 或 Graphic Walker Online Demo。
PyGWalker 是一個用于簡化數(shù)據(jù)分析和可視化工作流程的優(yōu)秀工具,特別是對于那些想要使用 Pandas 進行界面可視化的人。借助 PyGWalker 和 Graphic Walker,數(shù)據(jù)科學(xué)家可以在 Jupyter Notebook 中通過簡單的拖放操作輕松創(chuàng)建令人驚嘆的可視化效果。請查看 PyGWalker Git 倉庫獲取源代碼。
對于尋求自動化數(shù)據(jù)探索和高級增強分析的開源解決方案的數(shù)據(jù)科學(xué)家,該項目還適用于 RATH,這是一種開源自動 EDA、人工智能支持的數(shù)據(jù)探索和可視化工具。你還可以查看 RATH Git 倉庫 獲取源代碼和活躍的社區(qū)。
(題圖:MJ/21c21716-b900-4466-98a9-51268960c9b8)