自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

高級,這個Python庫助力pandas智能可視化分析

開發(fā) 前端
這次介紹一個可視化工具-LUX,它能自動地將DataFrame數(shù)據(jù)轉化為統(tǒng)計圖表,讓你一目了然地看到相關性、分布、頻率等信息。

 Pandas是用于數(shù)據(jù)處理的核心庫,它也可以進行簡單的可視化,繪制散點、折線、直方等基礎圖表都不在話下。 

 

 


 

Pandas自帶的可視化方法是基于matplotlib的函數(shù)接口,在Jupyter里可以靜態(tài)展示。

這次介紹一個可視化工具-LUX,它能自動地將DataFrame數(shù)據(jù)轉化為統(tǒng)計圖表,讓你一目了然地看到相關性、分布、頻率等信息。 

 

 

 

 

 

LUX在Jupyter Notebook或Lab中進行交互,圖表與數(shù)據(jù)可以同步顯示。

項目地址: https:// github.com/lux-org/lux

使用LUX

以下面數(shù)據(jù)集(美國各大學信息表)為例:

  1. # 導入pandas和lux庫 
  2. import pandas as pd 
  3. import lux 
  4.  
  5. #加載數(shù)據(jù) 
  6. df = pd.read_excel("C:\\Users\\zii\\Documents\\USA_College.xlsx"
  7. df 

讀取的數(shù)據(jù)如下:

 

 

 

 

 

 

除了顯示的數(shù)據(jù)表外,同時你還會看到數(shù)據(jù)集上面出現(xiàn)一個按鈕,可以進行數(shù)據(jù)/圖表的交換顯示。

 

 

 

 

 

 

所以說只需要導入lux庫,就能直接使用圖表功能。

 

 

 

 

 

 

大家看到下面有三種類型的圖表,代表的統(tǒng)計學含義分別是相關性、直方分布、事件頻次。

 

 

 

 

 

 

除了全表的可視化探索外,你還可以研究特定變量間的關系。

比如,我想看 SAT平均值 和 收入中位數(shù) 的關聯(lián)性.

  1. df.intent = ['SAT平均值','收入中位數(shù)'
  2. df 

 

 

 

 

 

 

左邊的表是兩個變量的總體分布,右邊是在有篩選條件下的分布。

導出圖表

LUX支持圖表的導出,既可以導出圖表文件,也可以導出相應的matplotlib、altair代碼。

首先選定一個或多個圖表,點擊導出按鈕。

 

 

 

 

 

 

可以直接將選定的圖表單獨顯示出來:

 

 

 

 

 

 

  1. 導出html df.save_as_html('hpi.html')
  2. 導出matplotlib代碼
  1. vis = df.exported 
  2. print (vis[0].to_matplotlib()) 

 

 

 

 

 

 

  1. 導出altair代碼
  1. vis = df.exported 
  2. print(vis[0].to_Altair()) 

 

 

 

 

導出的代碼可以直接運行:

  1. import altair as alt 
  2.  
  3. chart = alt.Chart(df).mark_circle().encode( 
  4.     x=alt.X('SAT平均值',scale=alt.Scale(domain=(6661534)),type='quantitative', axis=alt.Axis(title='SAT平均值')), 
  5.     y=alt.Y('收入中位數(shù)',scale=alt.Scale(domain=(20200125600)),type='quantitative', axis=alt.Axis(title='收入中位數(shù)')) 
  6. chart = chart.configure_mark(tooltip=alt.TooltipContent('encoding')) # Setting tooltip as non-null 
  7. chart = chart.interactive() # Enable Zooming and Panning 
  8. chart = chart.encode(color=alt.Color('最高學位',type='nominal')) 
  9.  
  10. chart = chart.configure_title(fontWeight=500,fontSize=13,font='Helvetica Neue'
  11. chart = chart.configure_axis(titleFontWeight=500,titleFontSize=11,titleFont='Helvetica Neue'
  12. labelFontWeight=400,labelFontSize=8,labelFont='Helvetica Neue',labelColor='#505050'
  13. chart = chart.configure_legend(titleFontWeight=500,titleFontSize=10,titleFont='Helvetica Neue'
  14. labelFontWeight=400,labelFontSize=8,labelFont='Helvetica Neue'
  15. chart = chart.properties(width=160,height=150
  16.  
  17. chart 

 

 

 

 

 

 

安裝設置

lux安裝過程和其他庫一樣,可以通過pip或conda安裝,直接在命令行輸入:

  1. pip install lux-api 

  1. conda install -c conda-forge lux-api 

因為lux一般用在Jupyter生態(tài)中,所以需要安裝并激活luxwidget拓展,才能顯示交互式窗口。

如果你是在Jupyter Notebook或VSCode中使用,使用下面代碼激活拓展:

  1. jupyter nbextension install --py luxwidget 
  2. jupyter nbextension enable --py luxwidget 

如果你使用的是Jupyter Lab,則激活lab拓展:

  1. jupyter labextension install @jupyter-widgets/jupyterlab-manager 
  2. jupyter labextension install luxwidget 

總結

LUX是一個不錯的數(shù)據(jù)可視化分析工具,能智能地輔助Pandas做數(shù)據(jù)探索,省去了很多不必要的操作。

 

責任編輯:張燕妮 來源: 知乎
相關推薦

2021-11-29 13:29:06

Basemap可視化分析

2015-11-17 18:44:06

Qlik可視化

2021-08-05 10:46:59

GitHub代碼開發(fā)者

2022-06-15 08:25:07

Python天氣數(shù)據(jù)可視化分析

2021-10-26 10:15:34

Python股市代碼

2023-07-26 12:38:42

PyGWalker數(shù)據(jù)類型

2016-11-28 15:03:06

Python數(shù)據(jù)可視化網(wǎng)絡分析

2016-11-25 11:16:22

阿里支付寶數(shù)據(jù)分析

2020-09-27 10:32:05

開發(fā) Github可視化

2020-09-09 12:15:50

大數(shù)據(jù)互聯(lián)網(wǎng)可視化

2018-01-25 14:34:18

大數(shù)據(jù)可視化工具

2018-01-03 17:22:22

DataHunter數(shù)據(jù)可視化分析

2018-11-14 10:15:58

開源技術 數(shù)據(jù)

2020-09-27 14:56:33

工具數(shù)據(jù)可視化技術

2020-09-27 11:15:37

可視化PandasPython

2021-06-30 23:38:56

Python微信好友

2024-07-31 11:48:07

2022-05-12 08:58:03

開源日志查詢日志可視化

2021-09-09 06:40:28

Pyecharts可視化源碼

2017-01-05 16:48:50

Python道路數(shù)據(jù)數(shù)據(jù)可視化
點贊
收藏

51CTO技術棧公眾號