自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

分享一個(gè)口碑炸裂的Python可視化模塊,簡(jiǎn)單快速入手?。?/h1>

開(kāi)發(fā) 后端
今天小編來(lái)和大家聊一下Python當(dāng)中的altair可視化模塊,并且通過(guò)調(diào)用該模塊來(lái)繪制一些常見(jiàn)的圖表,借助Altair,我們可以將更多的精力和時(shí)間放在理解數(shù)據(jù)本身以及數(shù)據(jù)的意義上面,從復(fù)雜的數(shù)據(jù)可視化過(guò)程中解脫出來(lái)。

Altair是啥?

Altair被稱為是統(tǒng)計(jì)可視化庫(kù),因?yàn)樗梢酝ㄟ^(guò)分類(lèi)匯總、數(shù)據(jù)變換、數(shù)據(jù)交互、圖形復(fù)合等方式全面地認(rèn)識(shí)數(shù)據(jù)、理解和分析數(shù)據(jù),并且其安裝的過(guò)程也是十分的簡(jiǎn)單,直接通過(guò)pip命令來(lái)執(zhí)行,如下:

pip install altair
pip install vega_datasets
pip install altair_viewer

如果使用的是conda包管理器來(lái)安裝Altair模塊的話,代碼如下:

conda install -c conda-forge altair vega_datasets

Altair初體驗(yàn)

我們先簡(jiǎn)單地來(lái)嘗試?yán)L制一個(gè)直方圖,首先創(chuàng)建一個(gè)DataFrame數(shù)據(jù)集,代碼如下:

df = pd.DataFrame({"brand":["iPhone","Xiaomi","HuaWei","Vivo"],
"profit(B)":[200,55,88,60]})

接下來(lái)便是繪制直方圖的代碼:

import altair as alt
import pandas as pd
import altair_viewer
chart = alt.Chart(df).mark_bar().encode(x="brand:N",y="profit(B):Q")
# 展示數(shù)據(jù),調(diào)用display()方法
altair_viewer.display(chart,inline=True)

output

從整個(gè)的語(yǔ)法結(jié)構(gòu)來(lái)看,首先使用alt.Chart()指定使用的數(shù)據(jù)集,然后使用實(shí)例方法mark_*()繪圖圖表的樣式,最后指定X軸和Y軸所代表的數(shù)據(jù),可能大家會(huì)感到好奇,當(dāng)中的N以及Q分別代表的是什么,這個(gè)是變量類(lèi)型的縮寫(xiě)形式,換句話說(shuō),Altair模塊需要了解繪制圖形所涉及的變量類(lèi)型,只有這樣,繪制的圖形才是我們期望的效果。

其中的N代表的是名義型的變量(Nominal),例如手機(jī)的品牌都是一個(gè)個(gè)專(zhuān)有名詞,而Q代表的是數(shù)值型變量(Quantitative),可以分為離散型數(shù)據(jù)(discrete)和連續(xù)型數(shù)據(jù)(continuous),除此之外還有時(shí)間序列型數(shù)據(jù),縮寫(xiě)是T以及次序型變量(O),例如在網(wǎng)購(gòu)過(guò)程當(dāng)中的對(duì)商家的評(píng)級(jí)有1-5個(gè)星級(jí)。

圖表的保存

最后的圖表的保存,我們可以直接調(diào)用save()方法來(lái)保存,將對(duì)象保存成HTML文件,代碼如下:

chart.save("chart.html")

也可以保存成JSON文件,從代碼上來(lái)看十分的相類(lèi)似。

chart.save("chart.json")

當(dāng)然我們也能夠保存成圖片格式的文件,如下圖所示:

Altair之進(jìn)階操作

我們?cè)谏厦娴幕A(chǔ)之上,進(jìn)一步的衍生和拓展,例如我們想要繪制一張水平方向的條形圖,X軸和Y軸的數(shù)據(jù)互換,代碼如下:

chart = alt.Chart(df).mark_bar().encode(x="profit(B):Q", y="brand:N")
chart.save("chart1.html")

output

同時(shí)我們也來(lái)嘗試?yán)L制一張折線圖,調(diào)用的是mark_line()方法代碼如下:

## 創(chuàng)建一組新的數(shù)據(jù),以日期為行索引值
np.random.seed(29)
value = np.random.randn(365)
data = np.cumsum(value)
date = pd.date_range(start="20220101", end="20221231")
df = pd.DataFrame({"num": data}, index=date)
line_chart = alt.Chart(df.reset_index()).mark_line().encode(x="index:T", y="num:Q")
line_chart.save("chart2.html")

output

我們還可以來(lái)繪制一張甘特圖,通常在項(xiàng)目管理上面用到的比較多,X軸添加的是時(shí)間日期,而Y軸上表示的則是項(xiàng)目的進(jìn)展,代碼如下:

project = [{"project": "Proj1", "start_time": "2022-01-16", "end_time": "2022-03-20"},
{"project": "Proj2", "start_time": "2022-04-12", "end_time": "2022-11-20"},
......
]
df = alt.Data(values=project)
chart = alt.Chart(df).mark_bar().encode(
alt.X("start_time:T",
axis=alt.Axis(format="%x",
formatType="time",
tickCount=3),
scale=alt.Scale(domain=[alt.DateTime(year=2022, month=1, date=1),
alt.DateTime(year=2022, month=12, date=1)])),
alt.X2("end_time:T"),
alt.Y("project:N", axis=alt.Axis(labelAlign="left",
labelFontSize=15,
labelOffset=0,
labelPadding=50)),
color=alt.Color("project:N", legend=alt.Legend(labelFontSize=12,
symbolOpacity=0.7,
titleFontSize=15)))
chart.save("chart_gantt.html")

output

從上圖中我們看到團(tuán)隊(duì)當(dāng)中正在做的幾個(gè)項(xiàng)目,每個(gè)項(xiàng)目的進(jìn)展程度不同,當(dāng)然了,不同項(xiàng)目的時(shí)間跨度也不盡相同,表現(xiàn)在圖表上面的話就顯得十分的直觀了。

緊接著,我們?cè)賮?lái)繪制散點(diǎn)圖,調(diào)用的是mark_circle()方法,代碼如下:

df = data.cars()
## 篩選出地區(qū)是“USA”也就是美國(guó)的乘用車(chē)數(shù)據(jù)
df_1 = alt.Chart(df).transform_filter(
alt.datum.Origin == "USA"
)
df = data.cars()
df_1 = alt.Chart(df).transform_filter(
alt.datum.Origin == "USA"
)
chart = df_1.mark_circle().encode(
alt.X("Horsepower:Q"),
alt.Y("Miles_per_Gallon:Q")
)
chart.save("chart_dots.html")

output

當(dāng)然我們可以將其進(jìn)一步的優(yōu)化,讓圖表顯得更加美觀一些,添加一些顏色上去,代碼如下:

chart = df_1.mark_circle(color=alt.RadialGradient("radial",[alt.GradientStop("white", 0.0),
alt.GradientStop("red", 1.0)]),
size=160).encode(
alt.X("Horsepower:Q", scale=alt.Scale(zero=False,padding=20)),
alt.Y("Miles_per_Gallon:Q", scale=alt.Scale(zero=False,padding=20))
)

output

我們更改散點(diǎn)的大小,不同散點(diǎn)的大小代表著不同的值,代碼如下:

chart = df_1.mark_circle(color=alt.RadialGradient("radial",[alt.GradientStop("white", 0.0),
alt.GradientStop("red", 1.0)]),
size=160).encode(
alt.X("Horsepower:Q", scale=alt.Scale(zero=False, padding=20)),
alt.Y("Miles_per_Gallon:Q", scale=alt.Scale(zero=False, padding=20)),
size="Acceleration:Q"
)

output

責(zé)任編輯:龐桂玉 來(lái)源: Python客棧
相關(guān)推薦

2022-04-20 20:30:36

可視化模塊Python

2022-07-25 10:07:26

Python可視化技巧

2017-06-19 08:30:35

大數(shù)據(jù)數(shù)據(jù)可視化報(bào)表

2018-07-11 12:30:51

編程語(yǔ)言Python數(shù)據(jù)可視化

2020-04-10 14:20:47

算法可視化Github

2021-06-09 11:26:37

BokehPython可視化

2018-10-16 15:12:48

2018-10-18 11:03:06

2017-07-10 14:18:34

微服務(wù)架構(gòu)可視化

2021-03-31 13:28:17

開(kāi)源工具Python編程語(yǔ)言

2022-08-26 09:15:58

Python可視化plotly

2025-04-01 08:30:00

Plotly數(shù)據(jù)可視化數(shù)據(jù)分析

2020-07-27 07:37:43

Python開(kāi)發(fā)工具

2023-06-11 16:12:14

數(shù)據(jù)可視化圖表類(lèi)型

2020-03-11 14:39:26

數(shù)據(jù)可視化地圖可視化地理信息

2018-03-15 09:57:00

PythonMatplotlib數(shù)據(jù)可視化

2022-09-08 16:28:53

Python數(shù)據(jù)可視化機(jī)器學(xué)習(xí)

2023-12-06 08:07:13

拖拽庫(kù)可視化

2021-11-04 09:10:22

CSS 技巧代碼重構(gòu)

2017-08-17 14:20:35

大數(shù)據(jù)可視化方法
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)