如何成為數(shù)據(jù)分析師系列(一):可視化圖表初階
簡(jiǎn)述
數(shù)據(jù)可視化-通過(guò)圖表形式展現(xiàn)數(shù)據(jù),幫助用戶快速、準(zhǔn)確理解信息。準(zhǔn)確、快速是可視化的關(guān)鍵,好的可視化會(huì)“講故事”,能向我們揭示數(shù)據(jù)背后的規(guī)律。對(duì)于可視化,有一個(gè)常見誤區(qū):分析師追求過(guò)于復(fù)雜的圖表,反而使得業(yè)務(wù)人員難以理解。其實(shí)越簡(jiǎn)單的圖表,越容易被理解,而快速易懂地理解數(shù)據(jù),正是可視化最重要的目標(biāo)。
大多數(shù)人對(duì)于基礎(chǔ)的數(shù)據(jù)圖表都有一定的認(rèn)知,但卻未必清楚,在哪一種場(chǎng)景使用何種圖表,本文主要給大家介紹基礎(chǔ)圖表的特性,讓大家知道在何種場(chǎng)景使用該類型圖表。
圖表的基本組成元素
一張圖表至少包含:標(biāo)題、橫縱坐標(biāo)軸、數(shù)據(jù)系列、數(shù)據(jù)標(biāo)簽、圖例等部分,每一部分都在圖表中扮演特定的角色表達(dá)特定的信息。當(dāng)然這些元素并不是必須具備的,當(dāng)信息足夠清晰時(shí),你可以精簡(jiǎn)部分元素,使得圖表更加簡(jiǎn)潔。
正確理解維度與指標(biāo)
維度(Dimension)
- 類別型字段、一般是離散的、不可進(jìn)行四則運(yùn)算
- 常常是觀察數(shù)據(jù)的角度,往往是橫坐標(biāo)
度量/指標(biāo)(Measure)
- 數(shù)值型字段、一般是連續(xù)的、可進(jìn)行四則運(yùn)算
- 一般都是數(shù)據(jù)的數(shù)值化衡量,往往是縱坐標(biāo)
下面是4種常見、常用基礎(chǔ)圖表
1. 折線圖“家族”
折線圖的核心思想是 趨勢(shì)變化。
作為信息最明了的圖表,是各種圖表中最容易解讀的圖表,以下是它的幾種變種:
基礎(chǔ)折線圖
- 技巧1:添加關(guān)鍵運(yùn)營(yíng)事件標(biāo)記
- 技巧2:添加趨勢(shì)線,當(dāng)R²>0.6時(shí)可采納該趨勢(shì)線,R²越接近1,趨勢(shì)越可靠
堆積面積圖
面積大小對(duì)應(yīng)該類別數(shù)值大小,反映不同類別占比關(guān)系及其時(shí)間趨勢(shì)變化。以下圖為例,你可看出AppStore和360下載量Top1、2的渠道。
缺點(diǎn):由色塊面積來(lái)表示數(shù)值大小有時(shí)候不直觀。以下圖為例,需仔細(xì)看圖才能知道AppStore和360手機(jī)助手是有做過(guò)投放的
折線圖小結(jié)
- 折線圖是點(diǎn)、線連在一起的圖表,可反映事物的發(fā)展趨勢(shì)和分布情況;
- 適合在單個(gè)數(shù)據(jù)點(diǎn)不那么重要的情況下表現(xiàn)變化趨勢(shì)、增長(zhǎng)幅度。
2. 柱形圖“家族”
柱形圖的核心思想是 對(duì)比
累加柱形圖
適合少量類別的對(duì)比,且對(duì)比信息特別清晰
與堆積面積圖相比,堆積面積圖比累加柱形圖多一時(shí)間維度,它可表達(dá)時(shí)間維度上的趨勢(shì)變化。
多指標(biāo)柱形圖
主要運(yùn)用于多個(gè)指標(biāo)進(jìn)行對(duì)比分析的場(chǎng)景,但類別對(duì)象不宜過(guò)多,當(dāng)超過(guò)5個(gè),不適合使用此圖表
技巧:當(dāng)各對(duì)比指標(biāo)大小相差10倍甚至更大時(shí),可采用標(biāo)準(zhǔn)化,如:對(duì)數(shù)值取自然對(duì)數(shù),既能有效縮小指標(biāo)量度差距,也能保留同指標(biāo)的大小關(guān)系
條形圖
當(dāng)對(duì)比對(duì)象類別>5時(shí),將多指標(biāo)柱形圖更改為單指標(biāo)的條形圖,能有效提高數(shù)據(jù)對(duì)比清晰度
條形圖,必須按照數(shù)值大小降序排列,這是提升條形圖閱讀體驗(yàn)的重要手段
瀑布圖
核心是按維度/指標(biāo)下鉆分解,如:公司收入各用途分解、公司年利潤(rùn)按分公司分解、業(yè)績(jī)按銷售團(tuán)隊(duì)分解;
對(duì)比餅圖的優(yōu)勢(shì)在于,拆解項(xiàng)較多時(shí),瀑布圖通過(guò)數(shù)字的標(biāo)記仍可清洗辨別,而餅圖在分解項(xiàng)>5時(shí)就不易辨別。
柱形圖結(jié)合折線圖
對(duì)比多個(gè)指標(biāo),尤其是對(duì)比指標(biāo)與指標(biāo)的增長(zhǎng)率上非常適用,使得一個(gè)圖表可以表現(xiàn)兩個(gè)層次的信息。(當(dāng)然要盡可能避免信息的重復(fù)。如下圖,折線圖含義如果換成團(tuán)隊(duì)簽約數(shù)占公司總簽約數(shù)比例,則意義不大)
使用雙坐標(biāo)軸,要表明清晰
直方圖
當(dāng)橫坐標(biāo)變成連續(xù)的分組,就可以制作直方圖(與柱形圖主要差別在于,直方圖一般不同數(shù)據(jù)系列沒有間距)
當(dāng)組別劃分***細(xì)化,我們就可以繪制概率分布曲線或者稱為密度曲線,最常見的就是正態(tài)分布,這里不舉例。
柱形圖小結(jié)
- 核心是對(duì)比,柱形圖的目的是將對(duì)比信息放大,直觀呈現(xiàn)出來(lái);
- 由于直觀,柱形圖適合做結(jié)論的表達(dá);
- 柱形圖一般不用在時(shí)間維度的變化;
- 柱形圖的數(shù)據(jù)系列和點(diǎn)不宜過(guò)多,否則建議改變圖表形式;
- 柱形之間的寬度盡量小于柱形本身的寬度。
3. 散點(diǎn)圖“家族”
散點(diǎn)圖的核心思想是 研究
研究型圖表,適合用于發(fā)現(xiàn)變量間的關(guān)系與規(guī)律,不適合用于清晰表達(dá)信息的場(chǎng)景
基礎(chǔ)散點(diǎn)圖
基礎(chǔ)散點(diǎn)圖觀察兩個(gè)指標(biāo)的關(guān)系
氣泡圖
在基礎(chǔ)散點(diǎn)圖上添加一個(gè)維度:用氣泡大小表示新的一個(gè)維度
下圖中,氣泡大小表示配送費(fèi)用
基于散點(diǎn)圖的分類矩陣
分類運(yùn)營(yíng),精準(zhǔn)運(yùn)營(yíng)是現(xiàn)代化運(yùn)營(yíng)的一個(gè)重要課題,通過(guò)分類矩陣進(jìn)行分類是一個(gè)有效手段
- 難點(diǎn)1: 構(gòu)建指標(biāo)可用于分類的橫縱坐標(biāo)軸指標(biāo),這需要很強(qiáng)的業(yè)務(wù)認(rèn)識(shí)
- 難點(diǎn)2: 確定指標(biāo)的分界點(diǎn),同樣需要足夠的業(yè)務(wù)判斷能力
散點(diǎn)圖小結(jié)
- 散點(diǎn)圖作為研究型圖表,經(jīng)常在數(shù)據(jù)分析前期被使用,在報(bào)告中很少見;
- 散點(diǎn)圖不夠直觀,大多時(shí)候不能直接表達(dá)結(jié)論;
- 散點(diǎn)圖對(duì)于業(yè)務(wù)敏感度和數(shù)據(jù)意識(shí)要求較高;
- 散點(diǎn)圖只是入門的鑰匙,發(fā)現(xiàn)規(guī)律只是分析的切入口。
4. 餅圖“家族”
餅圖的核心思想是 分解
基礎(chǔ)餅圖
技巧:將需要突出顯示的部分,置于左上角,順時(shí)針方向
旭日?qǐng)D
旭日?qǐng)D在基礎(chǔ)餅圖上可表達(dá)更多層次的分解關(guān)系,如下圖:有季度分解、月度分解、再到每周,且每個(gè)維度之間可兼容包含
餅圖小結(jié)
- 一般來(lái)說(shuō),數(shù)值***的部分排在最前面,也就是12點(diǎn)鐘方向順時(shí)針;
- 餅圖的細(xì)分項(xiàng)不宜過(guò)多,一般不超過(guò)8項(xiàng);
- 不要制作三維的餅圖,不直觀;
- 切忌將餅圖拉得過(guò)開,若要突出某一塊,可單獨(dú)將其拉開。
其實(shí),個(gè)人覺得餅圖在實(shí)際場(chǎng)景中應(yīng)當(dāng)盡可能少的使用(因人眼對(duì)面積大小不敏感),而且對(duì)指標(biāo)的分解柱形圖同樣能勝任,且遠(yuǎn)遠(yuǎn)清晰于餅圖。
當(dāng)且僅當(dāng),用于反應(yīng)單個(gè)模塊占整體比重時(shí),適合用餅圖,如下圖: