自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Pandas做數據可視化具體操作,快來看看吧

大數據 數據可視化
在本文我們可以學到用pandas做,導入數據、繪制最簡單的圖plot()、多個y的繪制圖、折線圖、條形圖、餅形圖和散點圖繪制、統(tǒng)計信息繪圖、箱型圖、軸坐標刻度、plot()更多精細化參數、可視化結果輸出保存等。

常見的數據可視化庫有:

  • matplotlib 是最常見的2維庫,可以算作可視化的必備技能庫,由于matplotlib是比較底層的庫,api很多,代碼學起來不太容易。
  • seaborn 是建構于matplotlib基礎上,能滿足絕大多數可視化需求。更特殊的需求還是需要學習matplotlib
  • pyecharts 上面的兩個庫都是靜態(tài)的可視化庫,而pyecharts有很好的web兼容性,可以做到可視化的動態(tài)效果。

但是在數據科學中,幾乎都離不開pandas數據分析庫,而pandas可以做

  • 數據采集 如何批量采集網頁表格數據?
  • 數據讀取 pd.read_csv/pd.read_excel
  • 數據清洗(預處理) 理解pandas中的apply和map的作用和異同
  • 可視化,兼容matplotlib語法(今天重點)

在本文我們可以學到用pandas做

  • 導入數據
  • 繪制最簡單的圖plot()
  • 多個y的繪制圖
  • 折線圖、條形圖、餅形圖和散點圖繪制
  • 統(tǒng)計信息繪圖
  • 箱型圖
  • 軸坐標刻度
  • plot()更多精細化參數
  • 可視化結果輸出保存

準備工作

如果你之前沒有學過pandas和matpltolib,我們先安裝好這幾個庫

  1. !pip3 install numpy!pip3 install pandas!pip3 install matplotlib 

已經安裝好,現在我們導入這幾個要用到的庫。使用的是倫敦天氣數據,一開始我們只有12個月的小數據作為例子

  1. #jupyter notebook中需要加這行代碼%matplotlib inlineimport  
  2. matplotlib.pyplot as pltimport numpy as npimport pandas as pd#讀取天 
  3. 氣數據df = pd.read_csv('data/london2018.csv')df  
pandas做數據可視化具體操作,快來看看吧

plot最簡單的圖

選擇Month作為橫坐標,Tmax作為縱坐標,繪圖。

大家注意下面兩種寫法

  1. #寫法1df.plot(x='Month', y='Tmax')plt.show()  
pandas做數據可視化具體操作,快來看看吧
  • 橫坐標軸參數x傳入的是df中的列名Month
  • 縱坐標軸參數y傳入的是df中的列名Tmax
  • 折線圖

上面的圖就是折線圖,折線圖語法有三種 

  1. df.plot(x='Month', y='Tmax' 
  2. df.plot(x='Month', y='Tmax', kind='line' 
  3. df.plot.line(x='Month', y='Tmax'
  1. df.plot.line(x='Month', y='Tmax')plt.show()  
pandas做數據可視化具體操作,快來看看吧

 

  1. #grid繪制格線df.plot(x='Month', y='Tmax', kind='line',  
  2. grid=True)plt.show()  
pandas做數據可視化具體操作,快來看看吧

多個y值

上面的折線圖中只有一條線, 如何將多個y繪制到一個圖中

比如Tmax, Tmin

  1. df.plot(x='Month', y=['Tmax''Tmin'])plt.show()  
pandas做數據可視化具體操作,快來看看吧

條形圖

  1. df.plot(x='Month',        y='Rain',        kind='bar')#同樣還可以這樣 
  2. 畫#df.plot.bar(x='Month', y='Rain')plt.show()  
pandas做數據可視化具體操作,快來看看吧

水平條形圖

bar環(huán)衛(wèi)barh,就可以將條形圖變?yōu)樗綏l形圖

  1. df.plot(x='Month',        y='Rain',        kind='barh')#同樣還可以這 
  2. 樣畫#df.plot.bar(x='Month', y='Rain')plt.show()  
pandas做數據可視化具體操作,快來看看吧

多個變量的條形圖

  1. df.plot(kind='bar', x = 'Month', y=['Tmax''Tmin'])plt.show()  
pandas做數據可視化具體操作,快來看看吧

散點圖

  1. df.plot(kind='scatter', x = 'Month', y = 'Sun')plt.show()  
pandas做數據可視化具體操作,快來看看吧

餅形圖

  1. df.plot(kind='pie', y='Sun')plt.show()  
pandas做數據可視化具體操作,快來看看吧

上圖繪制有兩個小問題:

  1. legend圖例不應該顯示
  2. 月份的顯示用數字不太正規(guī)
  1. df.index =  
  2. ['Jan','Feb','Mar','Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','D 
  3. ec']df.plot(kind='pie', y = 'Sun', legend=False)plt.show()  
pandas做數據可視化具體操作,快來看看吧

更多數據

一開頭的數據只有12條記錄(12個月)的數據,現在我們用更大的倫敦天氣數據

  1. import pandas as pddf2 = pd.read_csv('data/londonweather.csv')df2.head()  
pandas做數據可視化具體操作,快來看看吧

 

  1. df2.Rain.describe() 
  2.  
  3. count    748.000000mean      50.408957std       29.721493min     
  4.     0.30000025%       27.80000050%       46.10000075%        
  5. 68.800000max      174.800000Name: Rain, dtype: float64 

上面一共有748條記錄, 即62年的記錄。

箱型圖

  1. df2.plot.box(y='Rain')#df2.plot(y='Rain', kind='box')plt.show()  
pandas做數據可視化具體操作,快來看看吧

直方圖

  1. df2.plot(y='Rain', kind='hist')#df2.plot.hist(y='Rain')plt.show()  
pandas做數據可視化具體操作,快來看看吧

縱坐標的刻度可以通過bins設置

  1. df2.plot(y='Rain', kind='hist', bins=[0,25,50,75,100,125,150,175,  
  2. 200])#df2.plot.hist(y='Rain')plt.show()  
pandas做數據可視化具體操作,快來看看吧

多圖并存

  1. df.plot(kind='line',         y=['Tmax''Tmin''Rain''Sun'], #4個 
  2. 變量可視化         subplots=True,   #多子圖并存         layout=(2,  
  3. 2),   #子圖排列2行2列         figsize=(20, 10)) #圖布的尺寸plt.show()  
pandas做數據可視化具體操作,快來看看吧

 

  1. df.plot(kind='bar',         y=['Tmax''Tmin''Rain''Sun'], #4個變 
  2. 量可視化         subplots=True,   #多子圖并存         layout=(2, 2), 
  3.    #子圖排列2行2列         figsize=(20, 10)) #圖布的尺寸plt.show()  
pandas做數據可視化具體操作,快來看看吧

加標題

給可視化起個標題

  1. df.plot(kind='bar',         y=['Tmax''Tmin'], #2個變量可視化     
  2.      subplots=True,   #多子圖并存         layout=(1, 2),   #子圖排列1 
  3. 行2列         figsize=(20, 5),#圖布的尺寸         title='The Weather  
  4. of London')  #標題plt.show()  
pandas做數據可視化具體操作,快來看看吧

保存結果

可視化的結果可以存儲為圖片文件

  1. df.plot(kind='pie', y='Rain', legend=False, figsize=(10, 5), title='Pie of Weather in London')plt.savefig('img/pie.png')plt.show()  
pandas做數據可視化具體操作,快來看看吧

df.plot更多參數

df.plot(x, y, kind, figsize, title, grid, legend, style)

  • x 只有dataframe對象時,x可用。橫坐標
  • y 同上,縱坐標變量
  • kind 可視化圖的種類,如line,hist, bar, barh, pie, kde, scatter
  • figsize 畫布尺寸
  • title 標題
  • grid 是否顯示格子線條
  • legend 是否顯示圖例
  • style 圖的風格
  • 查看plot參數可以使用help
  1. import pandas as pdhelp(pd.DataFrame.plot)  
pandas做數據可視化具體操作,快來看看吧

 

 

責任編輯:未麗燕 來源: 今日頭條
相關推薦

2018-03-12 10:35:01

LinuxBash快捷鍵

2021-04-19 09:23:26

數字化

2017-11-24 08:00:55

前端JSCSS

2025-01-13 00:00:05

2025-01-13 07:10:00

前端開發(fā)

2020-11-04 08:40:23

C++多元組Tuple

2020-09-27 11:15:37

可視化PandasPython

2018-03-06 09:54:48

數據庫備份恢復

2018-01-19 10:37:00

2009-12-30 15:47:40

Silverlight

2020-03-11 14:39:26

數據可視化地圖可視化地理信息

2024-06-03 00:00:06

高性能數據傳輸應用程序

2011-03-17 09:06:58

iptables映射端口

2023-02-15 08:24:12

數據分析數據可視化

2018-01-30 17:54:37

數據庫MySQLSQL Server

2010-08-02 17:20:12

nfs啟動Linux

2009-12-31 15:36:13

SilverLight

2010-07-26 13:30:23

2018-04-18 17:08:45

2020-04-16 09:35:53

數據科學機器學習數據分析
點贊
收藏

51CTO技術棧公眾號