自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

用藝術(shù)的眼光探索數(shù)據(jù)之美

大數(shù)據(jù) 數(shù)據(jù)分析
在深入分析的情況下,我們應(yīng)該用數(shù)據(jù)圖形表示技術(shù)的思想。我們經(jīng)常使用bar charts, histograms, pie charts, boxplots, heatmaps, scatter plots, line plots等等這些典型的圖,這些圖對于數(shù)據(jù)可視化是必不可少的。

獨特的數(shù)據(jù)可視化技術(shù),用于深入了解數(shù)據(jù)。當(dāng)我們觀想它時,它的美就顯現(xiàn)出來了。可視化是一種更方便的方式,可以一目了然地了解大量數(shù)據(jù)。在深入分析的情況下,我們應(yīng)該用數(shù)據(jù)圖形表示技術(shù)的思想。我們經(jīng)常使用bar charts, histograms, pie charts, boxplots, heatmaps, scatter plots, line plots等等這些典型的圖,這些圖對于數(shù)據(jù)可視化是必不可少的。除了這些被廣泛使用的情況外,還有許多精湛的情節(jié)卻很少被使用。當(dāng)我們考慮分析數(shù)據(jù)并以藝術(shù)方式表示時,這些圖有助于發(fā)現(xiàn)洞察。

1 平行坐標(biāo)圖

實際上,我們最多可以可視化 3 維數(shù)據(jù)。但有時,我們需要可視化超過 3 維的數(shù)據(jù)才能獲得洞察力。我們經(jīng)常使用 PCA 或 t-SNE 來降維并繪制它。在降維的情況下,可能會丟失大量信息。在某些情況下,我們需要考慮所有需要,平行坐標(biāo)圖有助于做到這一點。

圖片

看上面的圖片。水平線(平行軸)代表鳶尾花的特征(Petal length, Sepal length, Sepal width, Petal width) 。類別是Setosa, Versicolor and Virginica。上圖將物種編碼為Setosa →1、Versicolor →2 和 Virginica →3。每個平行軸包含最小值到最大值(例如,花瓣長度從 1 到 6.9,萼片長度從 4.3 到 7.9,等等)。例如花瓣長度軸,表明該品種的花瓣長度Setosa 與其他兩個品種相比較小,且Virginica 最高。所以,通過這張圖,我們可以很容易地得到數(shù)據(jù)集的整體信息。

2 六角裝箱圖

六角裝箱是用六邊形二維數(shù)值的密度直觀地表示數(shù)據(jù)點的過程。

利用上面的數(shù)據(jù)集來繪制的六邊形分箱圖。如果仔細(xì)觀察,我們會發(fā)現(xiàn)總面積被分成了無數(shù)個六邊形。每個六邊形覆蓋特定區(qū)域。我們注意到六邊形有顏色變化。六邊形有的沒有顏色,有的是淡綠色,有的顏色很深。根據(jù)圖右側(cè)顯示的色標(biāo),顏色密度隨密度變化。比例表示具有顏色變化的數(shù)據(jù)點的數(shù)量。六邊形沒有填充顏色,這意味著該區(qū)域沒有數(shù)據(jù)點。

3 等值線圖

二維等高線密度圖是另一種可視化特定區(qū)域中數(shù)據(jù)點密度的方法。這樣做是為了找到兩個數(shù)值變量的密度。例如,下圖顯示了每個陰影區(qū)域中有多少數(shù)據(jù)點落入。

4 QQ-plot圖

QQ 代表 Quantile — Quantile plot (Quantile/percentile 是一個范圍,在這個范圍內(nèi),指定百分比的數(shù)據(jù)已經(jīng)下降。例如,第 10 個 quantile/percentile 表示在該范圍下,找到了 10% 的數(shù)據(jù),找到了 90%超出范圍)。這是一種直觀地檢查數(shù)值變量是否服從正態(tài)分布的方法。

(a) 樣本分布 (b) 標(biāo)準(zhǔn)正態(tài)分布

圖(a)是樣本分布;另一方面,(b)是標(biāo)準(zhǔn)正態(tài)分布。對于樣本分布,數(shù)據(jù)范圍為10 到 100 (100% 數(shù)據(jù)在 10 到 100 之間)。但對于標(biāo)準(zhǔn)正態(tài)分布,100% 的數(shù)據(jù)在范圍內(nèi)-3 到 3 (z-score)。在 QQ 圖中,兩個 x 軸值均分為 100 個相等的部分(稱為分位數(shù))。如果我們針對 x 和 y 軸繪制這兩個值,我們將得到一個散點圖。

圖片

散點圖位于對角線上。這意味著樣本分布是正態(tài)分布的。但是,如果散點圖位于左側(cè)或右側(cè)而不是對角線,則表明樣本不是正態(tài)分布的。

5 小提琴圖

小提琴圖與箱線圖相關(guān)。我們從小提琴圖中獲得的另一個信息是密度分布。簡單來說就是一個結(jié)合了密度分布的箱線圖。因此,讓我們將其與箱線圖進行比較。

在小提琴圖中,小提琴中間的白點表示中點。實心框表示四分位數(shù)間距 (IQR)。上下相鄰值是異常值的圍欄。超出范圍,一切都是異常值。下圖顯示了比較。

圖片

我們還可以通過傳遞列名來繪制不同物種的小提琴圖。

圖片

6 旭日圖

它是圓環(huán)圖或餅圖的定制化版本,將一些額外的層次信息集成到圖中。

圖片

整個圖表被分成一些環(huán)(從內(nèi)側(cè)到外側(cè))。它包含層次信息,其中內(nèi)環(huán)位于層次結(jié)構(gòu)的頂部,外環(huán)位于較低的順序。

圖片

如果我們仔細(xì)觀察數(shù)據(jù)集,第一列包含一年的季度;每個季度下面有幾個月,每個月有幾個星期。上面的旭日圖描述了這種情況。

小結(jié)

數(shù)據(jù)可視化是數(shù)據(jù)科學(xué)不可或缺的一部分。在數(shù)據(jù)科學(xué)中,我們探索數(shù)據(jù)。少量數(shù)據(jù)手動分析還好,但是當(dāng)我們處理成千上萬的數(shù)據(jù)時,它就變得非常繁重,有時甚至是不可能的。如果我們無法找出數(shù)據(jù)集的趨勢和見解,我們可能無法使用該數(shù)據(jù)。希望上面的圖可以幫助您從美學(xué)上可視化數(shù)據(jù)并深入了解數(shù)據(jù)。

責(zé)任編輯:華軒 來源: 數(shù)據(jù)驅(qū)動智能
相關(guān)推薦

2025-01-07 08:00:00

有序集合數(shù)據(jù)結(jié)構(gòu)

2022-05-24 09:50:27

元宇宙藝術(shù)人工智能

2024-02-26 18:23:29

C++封裝代碼

2023-11-06 10:04:51

Go語言大數(shù)據(jù)

2012-02-15 09:48:27

SEO

2017-06-29 11:26:08

Python數(shù)據(jù)可視化

2018-03-14 14:28:20

Python數(shù)據(jù)分析可視化

2017-11-21 12:22:11

數(shù)據(jù)可視化密集恐懼證笑哭

2015-12-18 17:26:38

華碩

2023-10-20 08:18:17

Python數(shù)據(jù)類型

2014-12-09 14:52:42

編程

2015-11-25 17:22:03

CIO時代網(wǎng)

2020-12-21 10:03:32

大數(shù)據(jù)美團技術(shù)

2022-08-12 12:23:28

神經(jīng)網(wǎng)絡(luò)優(yōu)化

2023-07-12 08:29:58

TypeScrip元組元素

2015-08-28 10:09:35

數(shù)據(jù)之美

2018-06-01 10:08:00

DBA美團SQL

2010-07-06 09:39:37

2018-12-14 11:04:56

數(shù)據(jù)庫運維智能
點贊
收藏

51CTO技術(shù)棧公眾號