數(shù)據(jù)科學(xué)家必備的六款數(shù)據(jù)可視化工具,顛覆傳統(tǒng)圖表!
在數(shù)據(jù)可視化領(lǐng)域,散點(diǎn)圖、柱狀圖、折線圖、箱型圖和熱力圖等是最為常見(jiàn)的圖表類型,它們簡(jiǎn)單易懂且廣為人知。然而,在面對(duì)多元復(fù)雜的數(shù)據(jù)場(chǎng)景時(shí),這些標(biāo)準(zhǔn)圖表可能并非最佳選擇。本文中,筆者為大家總結(jié)了這些熱門圖表的幾種替代方案:
尺寸編碼熱圖(Size-encoded heatmaps)
傳統(tǒng)的熱力圖通常通過(guò)顏色標(biāo)度來(lái)表示數(shù)據(jù)值,然而在實(shí)際應(yīng)用中,將單元格顏色與具體的數(shù)值精確對(duì)應(yīng)仍然具有一定的挑戰(zhàn)性。尺寸編碼熱圖則是一種有效的替代方案,它采用方塊或圓形等圖形元素的大小直觀展示數(shù)據(jù)的絕對(duì)數(shù)值大小,尺寸越大表示數(shù)值越高。這樣,不僅可以借助顏色變化反映相對(duì)差異,還能通過(guò)圖形大小的變化直觀展現(xiàn)各單元格數(shù)值的絕對(duì)大小,從而使得數(shù)據(jù)表達(dá)更加清晰、立體和易于理解。如下圖所示。
瀑布圖(Waterfall charts)
為了可視化數(shù)據(jù)值隨時(shí)間的變化情況,通常我們首選的是在折線圖(或柱狀圖)上顯示實(shí)際數(shù)值,但是這樣很難直觀地估計(jì)連續(xù)變化的幅度和方向。
而瀑布圖(Waterfall charts)可以通過(guò)層疊式布局清晰展示每個(gè)時(shí)間段或階段的數(shù)據(jù)變化,描述數(shù)據(jù)的滾動(dòng)差異,尤其適用于展示增量變化的規(guī)模和方向。
在瀑布圖中,起始值和最終值由第一個(gè)和最后一個(gè)柱狀圖表示。通過(guò)圖表中的連續(xù)變化,可以直觀地觀察到不同階段的貢獻(xiàn)和變化。此外,連續(xù)的更改會(huì)自動(dòng)進(jìn)行顏色編碼,使它們更易于解釋。這樣的設(shè)計(jì)使得瀑布圖成為了一種直觀且清晰地呈現(xiàn)數(shù)據(jù)變化的工具,尤其適用于呈現(xiàn)價(jià)值隨時(shí)間的變化,以及各個(gè)階段對(duì)最終結(jié)果的影響。
凹凸圖(Bump charts)
凹凸圖(Bump charts)是一種用于可視化不同項(xiàng)目隨時(shí)間排名變化的圖表類型。當(dāng)需要呈現(xiàn)多個(gè)類別隨時(shí)間的排名變化時(shí),使用條形圖可能會(huì)導(dǎo)致圖表混亂。在這種情況下,凹凸圖能夠提供更清晰的可視化效果。
凹凸圖通過(guò)將項(xiàng)目的排名以線的形式呈現(xiàn),每條線代表一個(gè)項(xiàng)目隨時(shí)間的排名變化。這種排名變化的可視化方式可以幫助觀察者更直觀地理解不同項(xiàng)目之間的排名變化情況。相較于條形圖,凹凸圖在凸顯排名變化方面更為清晰,減少了圖表混亂的可能性。
雨云圖(Raincloud Plots)
雨云圖(Raincloud Plots)是一種將箱線圖、帶狀圖和核密度估計(jì)(KDE)圖結(jié)合在一起的數(shù)據(jù)可視化工具。它為展示數(shù)據(jù)分布提供了一種簡(jiǎn)潔而全面的方式,并旨在解決使用傳統(tǒng)箱線圖和直方圖時(shí)可能出現(xiàn)的誤導(dǎo)性問(wèn)題。
使用雨云圖,可以:
- 合并多個(gè)圖以避免錯(cuò)誤或誤導(dǎo)性結(jié)論;
- 減少混亂并提高清晰度;
- 改善組間比較;
- 通過(guò)單個(gè)繪圖捕獲數(shù)據(jù)的不同方面。
Hexbin和密度圖
Hexbin圖和密度圖是用于可視化大量數(shù)據(jù)點(diǎn)的替代方案,特別適用于當(dāng)散點(diǎn)圖的數(shù)據(jù)點(diǎn)過(guò)于密集時(shí)難以解釋的情況。
Hexbin圖將圖表區(qū)域劃分為六邊形區(qū)域,并根據(jù)每個(gè)區(qū)域中數(shù)據(jù)點(diǎn)的數(shù)量為其分配一個(gè)顏色強(qiáng)度。這種方式能夠更清晰地展示數(shù)據(jù)點(diǎn)的密度和分布情況,避免了數(shù)據(jù)點(diǎn)過(guò)于密集時(shí)的視覺(jué)混亂。
而密度圖則通過(guò)連接相等密度的點(diǎn)來(lái)創(chuàng)建輪廓,用等高線描繪了二維空間中數(shù)據(jù)點(diǎn)的分布情況。這種表現(xiàn)方式能夠更直觀地展示數(shù)據(jù)的分布情況,幫助觀察者更好地理解數(shù)據(jù)點(diǎn)的密度和分布規(guī)律。
氣泡圖和點(diǎn)圖(Bubble charts and Dot plots)
氣泡圖和點(diǎn)圖是用于替代條形圖的有效可視化工具,特別適用于在大量類別情況下展示數(shù)據(jù)時(shí)避免圖表混亂的情況。
氣泡圖是一種類似于散點(diǎn)圖的圖表,但具有一個(gè)分類軸和一個(gè)連續(xù)軸。通過(guò)使用氣泡的大小來(lái)表示數(shù)據(jù)的值,氣泡圖可以更直觀地展示數(shù)據(jù)隨時(shí)間的變化。
點(diǎn)圖則是另一種替代條形圖的方法,它強(qiáng)調(diào)了我們主要關(guān)心表示總價(jià)值的各個(gè)端點(diǎn),同時(shí)消除了幾乎沒(méi)有用處的長(zhǎng)條。這兩種圖表都有效地解決了當(dāng)條形圖包含太多條形時(shí),觀察者難以關(guān)注到單個(gè)條形的長(zhǎng)度的問(wèn)題。