用Python繪制棒棒糖圖表,真的好看!
本文轉(zhuǎn)載自微信公眾號(hào)「法納斯特」,作者小F。轉(zhuǎn)載本文請聯(lián)系法納斯特公眾號(hào)。
大家好,我是小F~
條形圖在數(shù)據(jù)可視化里,是一個(gè)經(jīng)常被使用到的圖表。
雖然很好用,也還是存在著缺陷呢。比如條形圖條目太多時(shí),會(huì)顯得臃腫,不夠直觀。
棒棒糖圖表則是對條形圖的改進(jìn),以一種小清新的設(shè)計(jì),清晰明了表達(dá)了我們的數(shù)據(jù)。
下面小F就給大家介紹一下,如何使用Python繪制棒棒糖圖表。
使用到的是我國1949到2019年,歷年的出生人口數(shù)據(jù),數(shù)據(jù)來源國家統(tǒng)計(jì)局。
首先讀取一下數(shù)據(jù)。
- import pandas as pd
- import matplotlib.pyplot as plt
- # 讀取數(shù)據(jù)
- df = pd.read_csv('data.csv')
- print(df)
結(jié)果如下。
數(shù)據(jù)集很簡單,每行都只有一個(gè)年份和一個(gè)值。
先繪制一個(gè)帶有每年數(shù)值的條形圖。
- # 繪制柱狀圖
- plt.bar(df.Year, df.value)
- plt.show()
兩行代碼,即可得到一張條形圖圖表,看起來確實(shí)是有點(diǎn)擁擠。
下面將最后一年,即2019年的數(shù)據(jù)區(qū)分出來。
給2019年的條形著色為黑色,其他年份為淺灰色。
并且在圖表中添加散點(diǎn)圖,可在條形圖的頂部繪制圓形。
- # 新建畫布
- fig, ax = plt.subplots(1, figsize=(12, 8))
- # 年份數(shù)
- n = len(df)
- # 顏色設(shè)置
- colors = ['black'] + ((n-1)*['lightgrey'])
- plt.bar(df.Year, df.value, color=colors)
- plt.scatter(df.Year, df.value, color=colors)
- plt.show()
得到結(jié)果如下。
顏色已經(jīng)修改成功,還需要調(diào)整一下條形圖的寬度以及頂部圓圈的大小。
- # width: 條形圖寬度 s: 散點(diǎn)圖圓圈大小
- plt.bar(df.Year, df.value, color=colors, width=0.2)
- plt.scatter(df.Year, df.value, color=colors, s=10)
- plt.show()
結(jié)果如下。
比起先前的藍(lán)色條形圖圖表,棒棒糖圖表確實(shí)是好看了不少。
除了用條形圖來繪制棒棒糖圖表,還可以使用線條,這樣整體的寬度會(huì)更加一致。
X將Year(年份)數(shù)據(jù)作為起點(diǎn)和終點(diǎn),Y以-20和各年份數(shù)據(jù)作為起點(diǎn)和終點(diǎn)。
- import pandas as pd
- import matplotlib.pyplot as plt
- # 讀取數(shù)據(jù)
- df = pd.read_csv('data.csv')
- print(df)
- # 新建畫布
- fig, ax = plt.subplots(1, figsize=(12, 8))
- # 年份數(shù)
- n = len(df)
- # 顏色設(shè)置
- colors = ['black'] + ((n-1)*['lightgrey'])
- # 使用線條
- for idx, val in df.iterrows():
- plt.plot([val.Year, val.Year],
- [-20, val.value],
- color=colors[idx])
- plt.show()
得到結(jié)果如下。
可以使用參數(shù)標(biāo)記在兩端繪制圓,而不是只在頂部生成散點(diǎn)圖。
然后可以通過更改y-limit參數(shù)來隱藏最底端的圓。
- # 新建畫布
- fig, ax = plt.subplots(1, figsize=(12, 8))
- # 年份數(shù)
- n = len(df)
- # 顏色設(shè)置
- colors = ['black'] + ((n-1)*['lightgrey'])
- # 使用線條, markersize設(shè)置標(biāo)記點(diǎn)大小
- for idx, val in df.iterrows():
- plt.plot([val.Year, val.Year],
- [-20, val.value],
- color=colors[idx],
- marker='o',
- markersize=3)
- # 設(shè)置y軸最低值
- plt.ylim(0,)
- plt.show()
結(jié)果如下。
此外還可以調(diào)整lw、markersize參數(shù),定義線條的粗細(xì)及標(biāo)記的大小,甚至可以繪制兩次線條以創(chuàng)建輪廓效果。
- # 新建畫布
- fig, ax = plt.subplots(1, figsize=(12, 8))
- color = 'b'
- # 年份數(shù)
- n = len(df)
- # 顏色設(shè)置
- colors = ['black'] + ((n-1)*['lightgrey'])
- # 使用線條
- for idx, val in df.iterrows():
- plt.plot([val.Year, val.Year],
- [-20, val.value],
- color='black',
- marker='o',
- lw=4,
- markersize=6)
- plt.plot([val.Year, val.Year],
- [-20, val.value],
- color=colors[idx],
- marker='o',
- markersize=4)
- # 移除上邊框、右邊框
- ax.spines['right'].set_visible(False)
- ax.spines['top'].set_visible(False)
- # 設(shè)置x、y軸范圍
- plt.xlim(1948, 2020)
- plt.ylim(0,)
- # 中文顯示
- plt.rcParams['font.sans-serif'] = ['Songti SC']
- plt.title('中國歷年出生人口數(shù)據(jù)(萬)', loc='left', fontsize=16)
- plt.text(2019, -220, '來源:國家統(tǒng)計(jì)局', ha='right')
- # 2019年出生人口數(shù)(顯示)
- value_2019 = df[df['Year'] == 2019].value.values[0]
- plt.text(2019, value_2019+80, value_2019, ha='center')
- # 保存圖片
- plt.savefig('chart.png')
得到結(jié)果如下。
黑色不是特別好看,改個(gè)顏色看看。
- # 新建畫布
- fig, ax = plt.subplots(1, figsize=(12, 8))
- # 年份數(shù)
- n = len(df)
- # 顏色設(shè)置
- color = 'b'
- colors = ['#E74C3C'] + ((len(df)-1)*['#F5B7B1'])
- # 使用線條
- for idx, val in df.iterrows():
- plt.plot([val.Year, val.Year],
- [-20, val.value],
- color=colors[idx],
- marker='o',
- lw=4,
- markersize=6,
- markerfacecolor='#E74C3C')
- # 移除上邊框、右邊框
- ax.spines['right'].set_visible(False)
- ax.spines['top'].set_visible(False)
- # 設(shè)置x、y軸范圍
- plt.xlim(1948, 2020)
- plt.ylim(0,)
- # 中文顯示
- plt.rcParams['font.sans-serif'] = ['Songti SC']
- plt.title('中國歷年出生人口數(shù)據(jù)(萬)', loc='left', fontsize=16)
- plt.text(2019, -220, '來源:國家統(tǒng)計(jì)局', ha='right')
- # 2019年出生人口數(shù)(顯示)
- value_2019 = df[df['Year'] == 2019].value.values[0]
- plt.text(2019, value_2019+80, value_2019, ha='center')
- # 保存圖片
- plt.savefig('chart.png')
得到結(jié)果如下。
現(xiàn)在對于條形圖,你就有了另外一個(gè)選擇,即棒棒糖圖表。
此外我們也能了解到目前中國的新出生人口數(shù)量是越來越少,據(jù)說2020年出生人口降幅或超一成,未來幾年恐跌破1000萬...