自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

技術(shù)人最不該忽視可視化數(shù)據(jù)分析!

大數(shù)據(jù) 數(shù)據(jù)可視化
在這個(gè)“人人都是數(shù)據(jù)分析師”的時(shí)代,阿里的同學(xué)幾乎都在參與數(shù)據(jù)的采集、加工與消費(fèi)。數(shù)據(jù)可視化作為連接“加工——消費(fèi)”的重要一環(huán),其質(zhì)量至關(guān)重要。優(yōu)秀的可視化能促成卓越洞見(jiàn),糟糕的內(nèi)容則讓所有的努力失去意義。

在這個(gè)“人人都是數(shù)據(jù)分析師”的時(shí)代,阿里的同學(xué)幾乎都在參與數(shù)據(jù)的采集、加工與消費(fèi)。數(shù)據(jù)可視化作為連接“加工——消費(fèi)”的重要一環(huán),其質(zhì)量至關(guān)重要。優(yōu)秀的可視化能促成卓越洞見(jiàn),糟糕的內(nèi)容則讓所有的努力失去意義。今天,阿里高級(jí)產(chǎn)品經(jīng)理沉砂為我們?cè)敿?xì)介紹數(shù)據(jù)可視化工具以及如何選擇有效圖表。

一、前言

我所在的阿里企業(yè)數(shù)據(jù)化管理領(lǐng)域,數(shù)據(jù)可視化水平參差不齊,尤其是在匯報(bào)PPT和報(bào)表制作環(huán)節(jié)...今天,不深度探討具體業(yè)務(wù)問(wèn)題,僅給出一些可視化通用建議。

通過(guò)文章你可以獲得的建議:

  • 挑選順手的工具
  • 加工正確的數(shù)據(jù)
  • 選擇合適的圖表
  • 一個(gè)實(shí)例

二、數(shù)據(jù)可視化工具

在這里首先我想說(shuō)下數(shù)據(jù)可視化追求的三個(gè)目標(biāo):準(zhǔn)確、清晰、優(yōu)雅。符合這三項(xiàng)的圖表被稱為高效的數(shù)據(jù)可視化:

準(zhǔn)確:精準(zhǔn)地反饋數(shù)據(jù)的特征信息(既不遺漏也不冗余,不造成讀者疏漏&誤讀細(xì)節(jié))清晰:獲取圖表特征信息的時(shí)間越短越好優(yōu)雅:美觀(不是酷炫)、協(xié)調(diào)(相同場(chǎng)景的圖表遵循統(tǒng)一規(guī)范)。

除此之外,這三項(xiàng)的重要性也有相對(duì)次序:準(zhǔn)確>清晰>優(yōu)雅,原則上我們?cè)摫M量往這三個(gè)方面靠攏。

問(wèn)題來(lái)了,如何挑選順手的工具幫助達(dá)成目標(biāo)呢?

其實(shí)應(yīng)當(dāng)分情況來(lái)看,高效的數(shù)據(jù)可視化根據(jù)目的差異,大致分為兩種類型(來(lái)自Cole Nussbaumer Knaflic的視頻采訪):

解釋型

  • 已知目標(biāo)數(shù)據(jù)的特征信息或者價(jià)值;
  • 最大目的是傳達(dá)解釋給其他人自身的洞察;
  • 追求極致的細(xì)膩表達(dá)。

探索型

  • 未知目標(biāo)數(shù)據(jù)的特征信息或者價(jià)值;
  • 最大目的是自己分析探索數(shù)據(jù);
  • 追求快速高效的數(shù)據(jù)交互。

大家在開(kāi)始動(dòng)手前,不妨先想一下自己是哪種意圖,通常情況下魚(yú)和熊掌不可兼得,數(shù)據(jù)的靈活變換和細(xì)膩表達(dá)雖然不矛盾,但很難兼顧。這就促成了我們可用的工具都有一定的偏向性,簡(jiǎn)單易上手的BI工具可以幫助我們快速完成可視化,但有可能內(nèi)容差強(qiáng)人意。一些專業(yè)的圖表代碼庫(kù)理論上可以針對(duì)任何細(xì)節(jié)進(jìn)行調(diào)整,但是效率和門檻存在明顯劣勢(shì)。

原則上工具沒(méi)有孰優(yōu)孰劣(事實(shí)上很多工具兩方面都做得很好),只是相對(duì)而言。筆者對(duì)常見(jiàn)種類的典型代表工具做了一個(gè)定性評(píng)估(個(gè)人意見(jiàn)):

??

??

 

這里我將Excel與Tableau高亮了出來(lái),Tableau作為業(yè)界最著名的BI軟件,容易上手,可視化效果也非常棒,有助于你分析探索數(shù)據(jù)。而Excel是一款被大多數(shù)人嚴(yán)重低估的產(chǎn)品,它可以很方便實(shí)現(xiàn)各類圖表微調(diào),畫出漂亮的數(shù)據(jù)圖。

如果你沒(méi)什么傾向性,Excel很適合作為你深入研究的第一款數(shù)據(jù)可視化工具。

三、選擇有效的圖表

3.1 可視化流程

拋開(kāi)一些專業(yè)理論,簡(jiǎn)單來(lái)講,我們制作圖表的步驟分為3步:

1. 選擇要傳達(dá)的數(shù)據(jù)信息2. 尋找可視化方法3. 實(shí)現(xiàn)方法并完善細(xì)節(jié)

對(duì)于步驟1,主要考慮數(shù)據(jù)本身的信息與作者自身的洞察信息,列清楚這些信息,有助于你選擇合適的可視化方法。下文我會(huì)講述一些常用的方法論知識(shí),但不是簡(jiǎn)單給出你要選擇柱形圖or餅圖。至于具體的圖表選用指南可以Google一下。

3.2 視覺(jué)編碼

首先看兩張圖:

??

??

 

由于使用了視覺(jué)編碼(顏色)傳達(dá)信息,人們更容易理解原數(shù)據(jù)的特征了。

又比如普通的柱形圖,我們使用了柱子的“高度”和“相對(duì)位置”傳達(dá)了兩組數(shù)據(jù)信息,而柱形圖往往比沒(méi)進(jìn)行編碼的表格數(shù)據(jù)更容易理解。

我們要來(lái)熟悉兩個(gè)重要概念:“視覺(jué)編碼”&“視覺(jué)通道”。如果把人類大腦看做是一個(gè)信息解碼系統(tǒng),那么可視化就是對(duì)信息(數(shù)據(jù))的編碼過(guò)程,信息通過(guò)視覺(jué)編碼后,將內(nèi)容通過(guò)眼睛傳達(dá)至大腦,大腦解碼信息并獲取知識(shí)。

??

??

 

那么圖形的視覺(jué)通道有這么多,該如何選擇合適的視覺(jué)通道映射數(shù)據(jù)呢?這里需要通過(guò)數(shù)據(jù)的類型以及視覺(jué)通道的表現(xiàn)力進(jìn)行綜合判斷,基礎(chǔ)的學(xué)術(shù)理論有詳細(xì)說(shuō)明,這里我做一下簡(jiǎn)單介紹。

★ 數(shù)據(jù)類型

一般我們數(shù)據(jù)分為“類別型”、“有序型“和“數(shù)值型”三類,蘋果、香蕉屬于類別,幾月幾號(hào)屬于有序,利潤(rùn)5000屬于數(shù)值。在很多可視化商用工具的概念中,將”有序、類別型“的數(shù)據(jù)稱為維度,”數(shù)值型“的數(shù)據(jù)稱之為度量(指標(biāo))。

維度和度量所適用的視覺(jué)通道是有巨大差異的,例如顏色的色調(diào)適用于維度,但不適用于度量。選擇正確的視覺(jué)通道,令信息傳達(dá)更有效率。

★ 數(shù)據(jù)通道的表現(xiàn)力

在浙大教授陳為的著作《數(shù)據(jù)可視化》(陳為 沈則潛 陶煜波. 數(shù)據(jù)可視化[M]. 電子工業(yè)出版社, 2013)中,使用4個(gè)指標(biāo)作為評(píng)判一個(gè)通道的表現(xiàn)力標(biāo)準(zhǔn):

  • 精確性
  • 可辨認(rèn)性
  • 可分離性
  • 視覺(jué)突出

深度理解這些標(biāo)準(zhǔn),有助于我們明白一些可視化圖表修改建議背后的深層次原因。

??

??

 

這組測(cè)量數(shù)據(jù)采用科學(xué)的方法反映了一些制作經(jīng)驗(yàn)的合理性,比如:

  • 一些專業(yè)設(shè)計(jì)師非常反對(duì)使用餅圖——面積&角度與人類的感知聯(lián)系不是線性變化。
  • 使用長(zhǎng)度映射數(shù)據(jù)的柱形圖通常是最佳可視化選擇——長(zhǎng)度與感知是線性變化。
  • 常規(guī)商業(yè)統(tǒng)計(jì)圖表永遠(yuǎn)不要使用3D效果——體積嚴(yán)重影響人類感知的精確性。

??

??

 

可分離性告訴我們不能無(wú)限制的使用多種視覺(jué)通道,每增加一種通道來(lái)映射數(shù)據(jù),都需要考量對(duì)已有編碼方式的影響,尤其是尺寸(size)特別影響其他視覺(jué)通道的效果。

我們結(jié)合柱形圖做一個(gè)舉例,下圖的柱圖使用了寬度(size)映射了一個(gè)度量字段數(shù)據(jù),寬度影響了長(zhǎng)度的有效力,這兩個(gè)通道的同時(shí)使用,使得感知上有趨近面積這一通道,從而影響了整體圖表的效果。

??

??

 

有一次一位業(yè)務(wù)的同學(xué)問(wèn)我為什么不給柱圖的柱子加“圓角”功能,其實(shí)也是這個(gè)原因,過(guò)度的圓角會(huì)使長(zhǎng)度損耗精確性,對(duì)于圖表的整體表現(xiàn)力是破壞。

??

??

 

數(shù)據(jù)的視覺(jué)編碼在學(xué)術(shù)上有一個(gè)冗長(zhǎng)的表現(xiàn)力優(yōu)先級(jí)列表,我在這里簡(jiǎn)化這些概念,只給出一份推薦使用的視覺(jué)通道,理論上這些通道之間都可以組合使用,請(qǐng)根據(jù)實(shí)際情況挑選最佳方案。

另外一個(gè)行之有效的實(shí)踐方式是:不要從頭構(gòu)建可視化的方案,請(qǐng)?jiān)谧罨A(chǔ)的統(tǒng)計(jì)圖類型之上選擇追加視覺(jué)通道,然后不斷嘗試效果。不是什么圖表都可以用所有通道的,例如行政地圖就沒(méi)有長(zhǎng)度通道。

??

??

 

3.3 設(shè)計(jì)原則

設(shè)計(jì)圖表,好的視覺(jué)編碼是最重要的點(diǎn),除此之外,對(duì)數(shù)據(jù)的篩選也是一項(xiàng)挑戰(zhàn),過(guò)大的信息量會(huì)使圖表顯得混亂,造成認(rèn)知負(fù)荷。對(duì)于JavaScript構(gòu)建的可視化內(nèi)容,我們還需要關(guān)注數(shù)據(jù)交互。

★ 認(rèn)知負(fù)荷

一般的可視化文章會(huì)用墨水比這一項(xiàng)指標(biāo)來(lái)衡量負(fù)荷的輕重。設(shè)計(jì)的不合理,會(huì)給受眾過(guò)度、冗余或者毫無(wú)意義的信息傳達(dá)。

首先我們要關(guān)注的是是否呈現(xiàn)了過(guò)多數(shù)據(jù)、濫用了視覺(jué)通道。

??

??

 

其次,我們可以利用格式塔原理精簡(jiǎn)或者優(yōu)化我們的圖表元素,減輕認(rèn)知負(fù)荷。

完整的原理一共有8項(xiàng)內(nèi)容,這里我主要介紹最為重要的臨近原則、相似原則&閉合原則。

★ 臨近原則

人們傾向物理上相近的元素為一個(gè)整體。

我簡(jiǎn)單打出一行點(diǎn):

... ........ .......

你會(huì)很自然地認(rèn)為這是三個(gè)群體。利用這個(gè)心理學(xué)現(xiàn)象,我們構(gòu)建了典型的“分組柱形圖”

??

??

 

也可以用于引導(dǎo)用戶閱讀表格數(shù)據(jù)(來(lái)自Cole Nussbaumer Knaflic的blog):

??

??

 

★ 相似原則

人們傾向?qū)㈩伾?、大小或者形狀等屬性類似的?duì)象看作一個(gè)整體(或者具備關(guān)聯(lián)性)。

這種心理學(xué)現(xiàn)象,疊加顏色色調(diào)的處理,很容易促成視覺(jué)突出,使我們能夠快速注意到被處理的目標(biāo)數(shù)據(jù)。上文視覺(jué)編碼數(shù)“5”的舉例,便是相似原則的一個(gè)案例。

??

??

 

個(gè)人實(shí)踐感覺(jué)顏色是應(yīng)用相似原理最好的視覺(jué)通道,我們能夠通過(guò)“圖例”將圖例標(biāo)注信息與畫圖區(qū)域的內(nèi)容對(duì)應(yīng)起來(lái),簡(jiǎn)單來(lái)說(shuō),也是這一心理學(xué)現(xiàn)象在起作用。

我們可以更進(jìn)一步使用這一效應(yīng)來(lái)幫助用戶解讀圖表

 

 

??

??

 

 

★ 閉合原則

人們傾向物理上被包圍在一起的元素為一個(gè)群體。

??

??

 

閉合原則經(jīng)常被使用在標(biāo)注注釋上,使用少量的“水墨”便能將目標(biāo)區(qū)域的視覺(jué)突出起來(lái),我們拿上面相似原則的案例做進(jìn)一步加工,來(lái)說(shuō)明閉合原則的功效。

??

??

 

靈活利用格式塔原理與視覺(jué)編碼特性,是數(shù)據(jù)可視化在具體圖表之下的更為重要的知識(shí)技巧。篇幅原因,不再一一列舉。

當(dāng)我們看到一副圖表,憑借自己樸素的美學(xué)經(jīng)驗(yàn)指出圖表缺陷時(shí),不妨深入思考下,這個(gè)缺陷是違反了哪一條心理學(xué)原理,還是水墨比(信噪比)不平衡。

3.4 經(jīng)驗(yàn)之談

可視化的實(shí)踐經(jīng)驗(yàn)太多太多,我想再著重強(qiáng)調(diào)一下位置和顏色的巨大影響。

★ 位置

位置是一個(gè)豐富的概念,圖表一切的元素都處于“位置”之中,你不得不謹(jǐn)慎對(duì)待元素的位置屬性。無(wú)論是軸標(biāo)記位置、文本說(shuō)明位置、標(biāo)題位置、圖例位置還是圖形本身的相對(duì)位置。擺正它們,可以使圖表不顯得信息雜亂,可以幫助用戶更容易理解你想傳達(dá)的信息。

  • 對(duì)齊:心理學(xué)的“連續(xù)原則”使得對(duì)齊創(chuàng)造一條看不見(jiàn)的路徑,引導(dǎo)人們更容易解讀信息,任何時(shí)候都要注意對(duì)齊的使用。
  • 排序:任何時(shí)候,我們都需要對(duì)數(shù)據(jù)排序。柱圖的柱子從來(lái)都不該是被隨意擺放的,排序是對(duì)元素的位置屬性最重要的應(yīng)用。沒(méi)有規(guī)律的數(shù)據(jù)表達(dá)會(huì)給用戶帶來(lái)額外的解讀負(fù)擔(dān)。
  • 參照:位置都是相對(duì)的,如果我們想準(zhǔn)確解讀數(shù)據(jù)的位置,就一定需要一個(gè)參照系。這個(gè)參照系可以是X軸Y軸,也可以是兩個(gè)點(diǎn)或者柱子之間的相對(duì)參照,總之你得有一個(gè)。

★ 顏色

顏色是最重要也是最容易被濫用的視覺(jué)編碼方式,顏色具有色調(diào)、飽和度、明度的三重變化,同時(shí)顏色的變化還牽引著人類的情緒,所以顏色的使用需要被數(shù)據(jù)可視化制作者認(rèn)真考慮。在這里再補(bǔ)充一些實(shí)踐上的心得:

1. 盡量避免同時(shí)使用紅色&綠色,色盲的同學(xué)無(wú)法分辨他們,這也是為什么大多數(shù)圖表庫(kù)和軟件的默認(rèn)顏色的第一序列是藍(lán)色;

2. 維度數(shù)據(jù)使用色調(diào),度量(指標(biāo))數(shù)據(jù)使用飽和度和明度;

3. 在保證信息完整傳達(dá)的前提下,使用的顏色越少越好;

4. 顏色在上下文需要保持統(tǒng)一步調(diào),例如之前的圖用“綠色”代表香港,下面的圖就不應(yīng)該使用“黃色”或者“紅色”,“預(yù)測(cè)數(shù)據(jù)”使用綠色,“實(shí)際數(shù)據(jù)”使用藍(lán)色,保持秩序,減輕用戶認(rèn)知負(fù)荷;

5. 顏色能比其他視覺(jué)通道更能引起注意,也就意味著更容易使人疲勞。確保你使用的顏色是“有序”的,五彩斑斕、明暗跳躍的色彩序列并不可取;

6. 設(shè)計(jì)之前,可以參照一些品牌設(shè)計(jì)手冊(cè),一般被叫做visual manual。阿里幾乎每個(gè)BU都會(huì)有類似的材料,可以找你們的UED同學(xué)要。使用品牌色更容易獲得目標(biāo)人群的青睞。但是也不是所有的品牌色都適用,使用前應(yīng)當(dāng)思考下效果。

7. 注意你使用顏色的場(chǎng)合,事實(shí)上由于各國(guó)文化和宗教信仰的不同,相同色彩在不同人群中的情感性質(zhì)很不一樣。比如中國(guó)人喜歡紅色,但是不見(jiàn)得西方國(guó)家喜歡。還有醫(yī)院和金融業(yè),也是典型的顏色敏感行業(yè),給炒股的老板看圖表不要用綠色作為主色調(diào)......

8. 放棄酷炫,我們看數(shù)據(jù)不是為了酷炫。

★ 統(tǒng)計(jì)圖表選擇推薦

這個(gè)網(wǎng)上資料一抓一大把,選擇圖表前,其實(shí)更多的是要想清楚你的數(shù)據(jù)想傳達(dá)的目的。數(shù)據(jù)分析紛紛咋咋,總結(jié)起來(lái),不外乎4個(gè)目的:對(duì)比、聚焦、歸納、演繹?;谶@些初始目的出發(fā),我們?cè)龠x擇實(shí)例化它。

下圖是一張廣為流傳的圖表建議:

??

??

 

四、準(zhǔn)備數(shù)據(jù)

4.1 為可視化調(diào)整數(shù)據(jù)結(jié)構(gòu)

一般來(lái)講,制作數(shù)據(jù)圖表前,或多或少有一系列數(shù)據(jù)的采集加工環(huán)節(jié),以集團(tuán)開(kāi)發(fā)同學(xué)熟悉的ODPS為例,簡(jiǎn)單來(lái)講如下圖流程所示:

??

??

 

多數(shù)數(shù)據(jù)倉(cāng)庫(kù)為了滿足一定的設(shè)計(jì)規(guī)范、維護(hù)能力與健壯性,不會(huì)允許數(shù)倉(cāng)上層應(yīng)用做定制化侵入設(shè)計(jì),而各類應(yīng)用所需要的數(shù)據(jù)格式不盡相同,在可視化領(lǐng)域,為最后的圖表制作,對(duì)數(shù)據(jù)進(jìn)行一些調(diào)整非常常見(jiàn),特別是使用BI軟件進(jìn)行制圖,包括不僅限于以下調(diào)整:

★ 1.行列轉(zhuǎn)換

比如為了進(jìn)行數(shù)據(jù)對(duì)比分析的簇狀柱圖,不同工具配合交互時(shí),有不同的設(shè)置方法。需要對(duì)表中的行列數(shù)據(jù)進(jìn)行靈活轉(zhuǎn)換,以符合軟件要求。

??

??

 

★ 2.可讀性轉(zhuǎn)換

原表數(shù)據(jù)中,很可能只有"ID"、"XXX編碼"、英文內(nèi)容等特征數(shù)據(jù),為了我們最后的可視化加工效果,為了圖表易于解讀,我們需要更多的額外數(shù)據(jù)進(jìn)行關(guān)聯(lián)處理,比如:

  • 找到這張“事實(shí)表”的關(guān)聯(lián)“維表”,拿到ID背后的中文名稱、姓名等信息;
  • 將英文翻譯成對(duì)應(yīng)中文,比如將male與female轉(zhuǎn)換成“男”跟“女”;
  • 找到“短名稱”、“昵稱”等易于識(shí)別的數(shù)據(jù);
  • 從時(shí)間數(shù)據(jù)字段中轉(zhuǎn)換出“季度”、“財(cái)年”、“周”、“交易日”等契合業(yè)務(wù)場(chǎng)景的時(shí)間類型字段。

★ 3.針對(duì)業(yè)務(wù)場(chǎng)景的轉(zhuǎn)換

此類轉(zhuǎn)換需要結(jié)合一定的具體場(chǎng)景,一般來(lái)講,原始表只提供原始數(shù)據(jù),具體場(chǎng)景提供數(shù)據(jù)轉(zhuǎn)換規(guī)則,典型的例如:

  • 將“年齡”分段,原始表只記錄用戶的生日,后期加工成“18~24歲”、“25~30歲”等范圍字段值,這類加工有助于用戶解讀和構(gòu)建可視化內(nèi)容。
  • 新顧客、老顧客。“新”與“老”都是隨著時(shí)間推移的相對(duì)概念,不太會(huì)存儲(chǔ)在數(shù)倉(cāng)的原始數(shù)據(jù)表中,用戶需要根據(jù)當(dāng)前分析的時(shí)間窗口,自助加工出新老顧客的定義字段。

4.2 剔除異常數(shù)據(jù)

原始數(shù)據(jù)中,不免混入異常數(shù)據(jù),我們把錯(cuò)誤數(shù)據(jù)(臟數(shù)據(jù)、測(cè)試數(shù)據(jù))和不合理數(shù)據(jù)統(tǒng)稱為異常數(shù)據(jù)。這些數(shù)據(jù)不剔除,會(huì)直接影響可視化最終的展現(xiàn)效果,從而影響分析效果和決策效能。我們?cè)谥谱鲌D表前,一定要做這一環(huán)的處理。

不合理數(shù)據(jù)也是相對(duì)于具體的分析場(chǎng)景而言的,例如,我們?yōu)楹饬侩娫挔I(yíng)銷人員的表現(xiàn)設(shè)定了一個(gè)數(shù)據(jù)指標(biāo)——平均每周成功3單推銷即為優(yōu)秀員工,這里就需要結(jié)合場(chǎng)景將“實(shí)習(xí)期員工”剔除,或者說(shuō),將工作年限過(guò)短的樣本數(shù)據(jù)剔除。

4.3 對(duì)特殊值做精細(xì)化處理

為了可視化效果,我們需要關(guān)注那些含義不明的數(shù)據(jù)和“極端數(shù)據(jù)”,這些數(shù)據(jù)的存在有時(shí)候會(huì)直接影響我們的內(nèi)容展現(xiàn)。

★ 空、null、0

這3個(gè)數(shù)據(jù)值是典型的“含義不明“數(shù)據(jù),有些場(chǎng)景下,他們表達(dá)的意思相同,有些則代表了截然不同的信息。我拿”考試“作為一個(gè)case來(lái)比喻這三者的區(qū)別:

  • 0:小明參加了語(yǔ)文考試,得了0分;
  • 空:小明沒(méi)參加語(yǔ)文考試;
  • null:小明沒(méi)有語(yǔ)文這門考試。

在進(jìn)行可視化表達(dá)時(shí),一定要注意對(duì)數(shù)據(jù)的準(zhǔn)確表達(dá)。

★ 極端數(shù)據(jù)

極端數(shù)據(jù)指一種樣本數(shù)據(jù)極端分布不均勻的情況,比如“100條某產(chǎn)品的銷量分布,1條記錄10W,其余99條記錄在0~1000之間,“如實(shí)”反應(yīng)數(shù)據(jù)的圖表將很難看出**大部分樣本數(shù)據(jù)的特征信息**。需要結(jié)合業(yè)務(wù)場(chǎng)景,做應(yīng)對(duì)處理(比如剔除&“矮化”極端數(shù)據(jù),并做對(duì)應(yīng)的文本解釋)

??

??

 

4.4 匯聚數(shù)據(jù)到合理程度

在使用BI工具進(jìn)行可視化展示的時(shí)候,需要注意原始數(shù)據(jù)的數(shù)據(jù)量大小。通常軟件服務(wù)所在的服務(wù)器性能不是無(wú)限的,合適大小的數(shù)據(jù)量有助于取得交互展示的最佳表現(xiàn)。

當(dāng)原始數(shù)據(jù)過(guò)大,我們可以根據(jù)實(shí)際場(chǎng)景,剔除某些字段,對(duì)數(shù)據(jù)進(jìn)行匯聚。

另外,大部分工具都支持“派生字段”,盡量在“物化”或者“實(shí)體表”階段固化這些派生數(shù)據(jù),也有助于性能表現(xiàn)。對(duì)于BI軟件需要計(jì)算的派生數(shù)據(jù)而言,計(jì)算發(fā)生的環(huán)節(jié)決定其性能表現(xiàn):

計(jì)算在加速數(shù)據(jù)環(huán)節(jié) > 計(jì)算下放計(jì)算引擎 > 內(nèi)存計(jì)算 > 發(fā)生內(nèi)外存交換的計(jì)算

五、一個(gè)實(shí)踐案例

本文粗淺介紹了一些數(shù)據(jù)可視化的技巧,但是遠(yuǎn)遠(yuǎn)談不上完整。要做到“可視化最佳實(shí)踐”還需要大量知識(shí)補(bǔ)充,并且加以靈活應(yīng)用。

在這里介紹一個(gè)可視化圖表優(yōu)化的優(yōu)秀案例,原始材料來(lái)自Cole Nussbaumer的英文blog,有興趣的同學(xué)可以翻翻她的博客,會(huì)獲益良多。同樣D3作者M(jìn)ike Bostock也產(chǎn)出了大量高質(zhì)量的可視化內(nèi)容,非常值得借鑒。

案例:對(duì)資本預(yù)算數(shù)據(jù)的可視化改進(jìn)

★ 1. 原始圖表

??

??

 

咋一看這圖也沒(méi)啥錯(cuò),但是博客作者看到了一些改進(jìn)點(diǎn):

  • Y軸標(biāo)簽的可讀性
  • X軸未區(qū)分過(guò)去與未來(lái)的區(qū)別

其實(shí)還有其他隱藏改進(jìn)信息未指出:

  • 上文講述過(guò)視覺(jué)通道會(huì)相互影響有效性,這里圖例中的小正方形尺寸過(guò)小,影響了顏色的解讀,這就使得藍(lán)色的major projects和淺藍(lán)色的proposed allowance難以區(qū)分。(試想一下你在平常遇到的更極端的圖例解讀困境);
  • 軸的黑色標(biāo)簽的顏色飽和度太高,影響了圖本身的視覺(jué)突出。(稍微淺色一點(diǎn)的label更容易將用戶引導(dǎo)至關(guān)注數(shù)據(jù)本身);
  • 缺少度量數(shù)據(jù)說(shuō)明。

★ 2. 改進(jìn)版本一

??

??

 

這里作者取消了圖例的點(diǎn)標(biāo)記,將文本著色,解決了圖例識(shí)別的問(wèn)題。

此刻作者遇到了困境,不知該如何進(jìn)一步改進(jìn)。不過(guò)能夠顯而易見(jiàn)的是,改進(jìn)版本一的水墨比過(guò)重,用了較多鮮艷的色調(diào),并且同時(shí)使用了色調(diào)、圖案兩項(xiàng)視覺(jué)通道。著墨過(guò)多,但又沒(méi)有明顯傳達(dá)更多數(shù)據(jù)信息。

于是作者在改進(jìn)版本二中做了各項(xiàng)分析,下圖將圖表黑白化去除干擾的做法非常值得學(xué)習(xí),對(duì)于一些設(shè)計(jì)同學(xué)可能這種做法很熟悉,色彩會(huì)干擾設(shè)計(jì)師的判斷(PD一般畫原型的時(shí)候是黑白的)

★ 3. 改進(jìn)版本二

三個(gè)主要項(xiàng)目的預(yù)算從2018年到2019年顯著下降,然后隨著時(shí)間的推移緩慢下降:

??

??

 

其他項(xiàng)目也有下降的趨勢(shì):

??

??

 

新項(xiàng)目的預(yù)算則在顯著增加:

??

??

 

其他兩項(xiàng)的分析類似:

??

??

??

??

 

作者在改進(jìn)版本二中分析出了一些數(shù)據(jù)特征,顯然這些特征還沒(méi)有在可視化中表達(dá)出來(lái),圖表還有改進(jìn)空間。

★ 4. 改進(jìn)版本三

??

??

 

在改進(jìn)版本三種,作者使用了客戶的品牌色(這種手段通常很好用,除非客戶的品牌色“大紅大紫”)

并且將用戶的視角引導(dǎo)到了建議配合與現(xiàn)有配額上來(lái)。

??

??

 

很明顯,我們看到了兩組數(shù)據(jù)的規(guī)律,那么如何通過(guò)可視化將這個(gè)規(guī)律更加簡(jiǎn)明易懂的傳達(dá)給用戶呢,作者改進(jìn)了圖表的標(biāo)記形式。

★ 5. 改進(jìn)版本四

??

??

 

到了這一步,改進(jìn)已經(jīng)相當(dāng)成功,仿佛我們把之前的信息補(bǔ)全就大功告成,而作者進(jìn)行了更多思考:用戶應(yīng)該關(guān)注兩條線之間的相對(duì)變化,并更新了改進(jìn)版本:

★ 6. 改進(jìn)版本五

??

??

 

接下來(lái)是最后加工:將自己的見(jiàn)解和洞察以合適的方式放入圖表中。

??

??

 

★ 7. 最終版本

將之前被忽略的數(shù)據(jù)重新以合適的方式放入圖表中,并且注解文字的使用也遵循了相似原則,來(lái)建立圖形與文字的關(guān)聯(lián)性。

??

??

 

責(zé)任編輯:武曉燕 來(lái)源: 51CTO專欄
相關(guān)推薦

2017-01-12 17:28:59

數(shù)據(jù)分析數(shù)據(jù)可視化可視化

2017-03-09 09:54:13

分析數(shù)據(jù)可視化

2018-12-03 16:50:23

數(shù)據(jù)可視化數(shù)據(jù)分析薪水

2020-05-14 10:19:23

Python可視化分析

2017-09-15 10:23:06

可視化Bug數(shù)據(jù)分析

2017-04-18 11:01:14

數(shù)據(jù)分析數(shù)據(jù)可視化

2020-03-11 14:39:26

數(shù)據(jù)可視化地圖可視化地理信息

2017-02-23 09:42:53

大數(shù)據(jù)數(shù)據(jù)可視化技術(shù)誤區(qū)

2023-08-28 16:19:32

2023-11-24 14:02:00

Python數(shù)據(jù)分析

2020-12-22 14:14:25

大數(shù)據(jù)數(shù)據(jù)可視化

2019-04-15 14:15:59

2024-07-01 08:51:19

可視化數(shù)據(jù)分析漏斗

2017-10-14 13:54:26

數(shù)據(jù)可視化數(shù)據(jù)信息可視化

2020-12-07 05:51:49

數(shù)據(jù)分析數(shù)據(jù)可視化數(shù)據(jù)科學(xué)

2016-08-11 16:30:14

數(shù)據(jù)分析 BI 數(shù)據(jù)分析工具

2020-10-09 09:35:17

數(shù)據(jù)分析可視化

2018-12-26 16:31:39

圖表數(shù)據(jù)可視化進(jìn)階

2016-12-29 20:05:56

數(shù)據(jù)可視化大數(shù)據(jù)產(chǎn)品分析

2019-12-18 14:40:09

數(shù)據(jù)可視化后端技術(shù)Python
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)