D-Tale,實(shí)現(xiàn)Pandas GUI高效數(shù)據(jù)分析
想必很多人都用過Pandas來處理數(shù)據(jù),作為Python數(shù)據(jù)科學(xué)領(lǐng)域的頂級(jí)庫(kù),Pandas確實(shí)有著強(qiáng)大的數(shù)據(jù)處理能力。特別是結(jié)合Jupyter Notebook平臺(tái),簡(jiǎn)直可以稱作編程里的Excel。
Pandas是代碼工具,不能像Excel那樣通過軟件界面操作,有時(shí)候也給數(shù)據(jù)探索帶來小小的困擾。
比如說,你想簡(jiǎn)單探索下數(shù)據(jù)集的結(jié)構(gòu)、描述統(tǒng)計(jì)結(jié)果、可視化圖表等等,如果能繞開代碼,直接通過GUI界面來操作,會(huì)更加方便。
D-Tale就可以完美實(shí)現(xiàn)上述功能,作為Pandas生態(tài)的輔助GUI工具,能讀取DataFrame數(shù)據(jù),供使用者進(jìn)行探索分析。
D-Tale是 Flask 后端和 React 前端的組合,提供了簡(jiǎn)潔的GUI分析界面。它可以在PyCharm、Jupyter、命令行中打開,其功能包括篩選、排序、高亮、拼接、數(shù)據(jù)轉(zhuǎn)換、描述統(tǒng)計(jì)、可視化等等。
尤其是可視化能力,D-Tale可以像Power BI那樣實(shí)現(xiàn)拖拉拽的圖表制作,而且提供了很多圖表類型,包括折線圖、柱狀圖、直方圖、餅圖、熱力圖、三維圖、詞云圖、地圖等等。
如果你經(jīng)常使用Pandas進(jìn)行數(shù)據(jù)分析,那么便可以試試D-Tale,它通過pip進(jìn)行安裝,非常簡(jiǎn)單。
pip install D-Tale
安裝好后,導(dǎo)入D-Tale中的show()方法,通過show()就可以讀取DataFrame數(shù)據(jù),激活GUI分析界面。
該GUI界面提供了多種數(shù)據(jù)工具,可以在菜單中進(jìn)行選擇使用。
你可以對(duì)數(shù)據(jù)集進(jìn)行篩選、排序、隱藏、調(diào)整大小等操作:
還可以查看數(shù)據(jù)集的描述性統(tǒng)計(jì)結(jié)果:
分析數(shù)據(jù)的缺失值情況:
對(duì)數(shù)據(jù)集進(jìn)行熱力圖展示:
進(jìn)行多元化的圖表分析:
還可以制作有向圖:
如果你想導(dǎo)出數(shù)據(jù)集,D-Tale能很方便地實(shí)現(xiàn):
總的來說,D-Tale是一款Pandas輔助工具,可以高效地進(jìn)行探索性分析。但D-Tale并不能替代Pandas來處理數(shù)據(jù),因?yàn)樗墓δ苓€是有限的。