自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

提高數(shù)據(jù)可視化效果的五個(gè)原則

大數(shù)據(jù) 數(shù)據(jù)可視化
每當(dāng)我對(duì)數(shù)據(jù)進(jìn)行可視化時(shí),不管是靜態(tài)圖、動(dòng)態(tài)圖,還是報(bào)告、博客中的一部分,甚至是 Twitter的配圖,我都會(huì)遵循以下五個(gè)原則。

每當(dāng)我對(duì)數(shù)據(jù)進(jìn)行可視化時(shí),不管是靜態(tài)圖、動(dòng)態(tài)圖,還是報(bào)告、博客中的一部分,甚至是 Twitter的配圖,我都會(huì)遵循以下五個(gè)原則。 

  1. ?展示數(shù)據(jù)。 
  2. 減少混亂。
  3. 圖文結(jié)合。
  4. 避免使用意面圖。
  5. 從灰色開始。 ?

展示數(shù)據(jù)和減少混亂意味著減少多余的網(wǎng)格線、標(biāo)記和陰影,這些都會(huì)干擾實(shí)際數(shù)據(jù)。

有力的標(biāo)題、更好的標(biāo)簽和有用的注釋將使圖表與其周圍的文本相結(jié)合。

當(dāng)圖表有許多數(shù)據(jù)系列時(shí), 可以策略性地使用顏色突出顯示感興趣的系列,或者將一個(gè)密集的圖表拆分成多個(gè)小圖表。

總之,這五個(gè)原則會(huì)提醒我關(guān)注受眾的需求,以及如何用可視化的數(shù)據(jù)講故事。

原則1:展示數(shù)據(jù)

讀者只有看到你的數(shù)據(jù),才能理解你的重點(diǎn)、觀點(diǎn)或故事。這并不意味著你要展示所有的數(shù)據(jù),但你要突出顯示那些支撐觀點(diǎn)的數(shù)據(jù)。作為圖表的創(chuàng)建者,我們面臨的挑戰(zhàn)是要呈現(xiàn)多少數(shù)據(jù),以及呈現(xiàn)的最佳方式。

這張美國的點(diǎn)密度圖,使用了自2010年起,美國十年一次的人口普查數(shù)據(jù),每一個(gè)點(diǎn)代表一個(gè)人,這是全國3.08億居民在人口普查區(qū)(一個(gè)人口普查區(qū)相當(dāng)于一個(gè)街區(qū))的分布情況。注 意,這張圖除了數(shù)據(jù)什么都沒有,沒有州界,沒有道路,沒有城市標(biāo)志,也沒有湖泊和河流的標(biāo) 記。但我們?nèi)匀荒芸闯鲞@是美國,因?yàn)槿藗兺钤谶吘澈脱睾5貐^(qū),這些數(shù)據(jù)痕跡勾勒出了整個(gè)國家的形狀。

這并不意味著我們必須一直顯示所有的數(shù)據(jù)。有時(shí)圖表顯示的數(shù)據(jù)太多,很難看出哪些數(shù)據(jù)更重要。比如這兩張折線圖,都顯示了世界上50個(gè)國家的平均受教育年限。

在左邊的圖表中,每個(gè)國家都用不同顏色的折線表示。這導(dǎo)致整張圖表非?;靵y,無法看出任何一個(gè)國家的趨勢(shì)。

而在右邊的圖表中,突出顯示了六個(gè)重點(diǎn)關(guān)注的國家,其他國家全部被設(shè)置為灰色,把它們當(dāng)成背景信息。

這樣,讀者一眼就能看出我們想要強(qiáng)調(diào)的國家。這不是說我們要顯示最少的數(shù)據(jù),而是說要顯示最重要的數(shù)據(jù)。

圖片

只突顯幾個(gè)國家(右圖),這樣圖表更容易閱讀

原則2:減少混亂

使用不必要的視覺元素會(huì)分散讀者的注意力,并使頁面變得混亂。

有很多導(dǎo)致圖表混亂的陷阱需要避開。有一些基本元素,比如太粗的刻度線和網(wǎng)格線,幾乎都可以直接刪除。

有些圖表會(huì)使用數(shù)據(jù)標(biāo)記(如正方形、圓形和三角形)來區(qū)分序列,但當(dāng)標(biāo)記重疊時(shí),它們會(huì)讓圖表看上去亂糟糟的。

當(dāng)使用簡(jiǎn)單的、純色的圖表效果也很好時(shí),千萬不要做紋理或漸變填充。當(dāng)使用不必要的3D(立體)效果時(shí),會(huì)使數(shù)據(jù)失真。

還有一些圖表包含太多的文本和標(biāo)簽,使得整個(gè)空間變得混亂而擁擠。

就拿這張美國和德國的平均受教育年限的三維柱狀圖來說。

你之前應(yīng)該也見過這種3D圖表——分散注意力、難以閱讀及數(shù)據(jù)失真

如果你認(rèn)為沒有人會(huì)設(shè)計(jì)這么奇怪的圖表,那么你就錯(cuò)了。

這是直接復(fù)制過來的圖表,包括它的漸變樣式。三維的柱形和閃爍的條紋,不匹配的數(shù)據(jù)和軸標(biāo)簽,用大量的小數(shù)表明數(shù)據(jù)的精確度,但實(shí)際上并沒有這種效果——所有這些混在一起形成了一張很難閱讀的圖表,老實(shí)地說,看起來很不舒服。

同時(shí),三維圖形會(huì)讓數(shù)據(jù)失真。出現(xiàn)這種失真,是因?yàn)槭褂昧瞬槐匾娜S透視效果。通過擯棄這些無關(guān)的、分散注意力的元素來簡(jiǎn)化圖表,可以讓你的觀點(diǎn)更加清晰、易懂。

雖然我們對(duì)感知,以及眼睛和大腦如何工作的理解大多根植于科學(xué)研究,但決定使用什么視 覺效果往往是主觀的。比如使用哪種圖表、在哪里放置標(biāo)簽和注釋、使用什么顏色和字體等。

使用基礎(chǔ)的柱狀圖就能消除3D效果導(dǎo)致的混亂和失真,因此圖表更容易閱讀和理解

在有些情況下,使用某種圖表客觀上就是錯(cuò)誤的,但在大多數(shù)情況下,需要靠你的主觀判斷。隨著你創(chuàng)建和閱讀可視化圖表的數(shù)量越來越多,你將拓寬視野,提高審美能力,并找到藝 術(shù)和科學(xué)之間的平衡。

原則3:圖文結(jié)合

盡管我們主要關(guān)注創(chuàng)建可視化圖表的元素,比如條形、點(diǎn)或折線,但對(duì)圖表的文字說明同樣重要。我們常常將文本和注釋視為事后才思考的內(nèi)容,但這些元素可以幫助讀者來理解圖表所包含的內(nèi)容,以及圖表本身。

《紐約時(shí)報(bào)》的數(shù)據(jù)編輯阿曼達(dá)·考克斯(Amanda Cox)曾經(jīng)說過,“注釋部分是最重要的……否則就相當(dāng)于說‘都在這兒,你自己去搞明白’。” 

為圖表添加正確的注釋,從幫助讀者理解的角度來說,至關(guān)重要。

有三種方法可以讓圖表和視覺效果融為一體:刪除圖例、創(chuàng)建有吸引力的標(biāo)題和添加一些細(xì)節(jié)。

1.盡可能去掉圖例,直接標(biāo)注數(shù)據(jù) 

圖片

將標(biāo)簽直接放置在圖表上,讀者能更輕松地找到對(duì)應(yīng)的數(shù)據(jù)

2.把標(biāo)題寫得像報(bào)紙的標(biāo)題一樣 

好的標(biāo)題需要能抓住圖表的要點(diǎn),告訴讀者從中可以得出什么結(jié)論。我把這些稱為“有力的標(biāo) 題”或“報(bào)紙式標(biāo)題”。

這張來自皮尤研究中心的圖表的標(biāo)題準(zhǔn)確地告訴你應(yīng)該從中學(xué)習(xí)什么

3.添加注釋 

一旦圖表制作完成,標(biāo)題確定下來后,不妨問問自己,如果再添加一些文字說明,會(huì)更有幫助嗎?

有時(shí)數(shù)據(jù)里有峰值或谷值、離散值或波動(dòng)值需要解釋。在圖表中添加細(xì)節(jié)說明,有助于大 家推導(dǎo)出你的論點(diǎn)或關(guān)鍵點(diǎn)。如果使用的是非標(biāo)準(zhǔn)圖表,則還要解釋如何閱讀它。

圖片

右圖中簡(jiǎn)短的說明解釋了數(shù)據(jù)的一些基本特征

原則4:避免使用意面圖

意面圖(Spaghetti Chart)是制造業(yè)里的一個(gè)術(shù)語,這里作者用來泛指那種容納了大量數(shù)據(jù)的圖表。

很明顯,當(dāng)某張圖表包含太多的信息時(shí)——折線圖看起來就像一堆意大利面條,還有幾十種顏色和圖標(biāo)的地圖,或者一個(gè)接一個(gè)的條形布滿整個(gè)頁面。當(dāng)一張圖表中包含大量的數(shù)據(jù)時(shí),這的確是一個(gè)挑戰(zhàn),但我們不需要將所有數(shù)據(jù)都放到一張圖表中。

圖片

小型序列圖(small multiples)的兩個(gè)示例。左圖來自Zeit Online,顯示了德國過去140年的平均氣溫。右圖來自疾病控制和預(yù)防中心,顯示了面部毛發(fā)如何影響呼吸器的安裝。格式塔的連接原理可以幫助我們追蹤圖中的變化

我們可以將一張圖表分解成多張圖表。這被稱為網(wǎng)格圖或面板圖,也叫格柵圖,或小型序列圖。這些較小的圖表使用相同的比例、坐標(biāo)軸和范圍,但將數(shù)據(jù)分布在多張圖表上。換句話說,不要把所有的數(shù)據(jù)都放在一張圖表中,而是在基礎(chǔ)數(shù)據(jù)上創(chuàng)建多個(gè)更小的版本。 

小型序列圖不是一種新的或革命性的數(shù)據(jù)表達(dá)方式。1878年,攝影師埃德維德·穆布里 奇(Eadweard Muybridge)要確定一匹馬在飛奔時(shí)是否完全騰空。穆布里奇開發(fā)了一種技術(shù)來 拍攝一匹疾馳的馬,它可以拍攝一系列快速動(dòng)作的照片(我們現(xiàn)在稱之為定格)。他的照片證 明,馬在飛奔時(shí)確實(shí)完全離開了地面。圖像序列,也給人一種動(dòng)態(tài)感,這是小型序列圖早期的 例子。

攝影師埃德維德·穆布里奇早在1878年就采用了小型序列圖的方式來確定馬在飛奔時(shí)是否完全騰空

小型序列圖至少有三個(gè)優(yōu)點(diǎn)。

  • 首先,一旦讀者知道如何閱讀其中的一張圖表,就會(huì)閱讀其 他圖表了。
  • 其次,你可以顯示大量的信息,而不會(huì)讓讀者感到困惑。
  • 第三,讀者可以跨多個(gè)變量進(jìn)行比較。

《衛(wèi)報(bào)》(Guardian)的這個(gè)例子顯示,2016年英國脫歐決議案在六個(gè)不同人口 統(tǒng)計(jì)學(xué)變量上的投票結(jié)果。橫軸保持不變,可以很容易看到每個(gè)人口統(tǒng)計(jì)指標(biāo)的關(guān)系方向。

圖片

《衛(wèi)報(bào)》的多張小型散點(diǎn)圖顯示了投票選擇與六個(gè)人口統(tǒng)計(jì)學(xué)變量之間的關(guān)系。格式塔的相似原理 讓我們很容易看到每張散點(diǎn)圖中的兩類數(shù)據(jù)

但這種序列圖也存在一些缺陷,如果不加以避免,圖表會(huì)很混亂。

首先,圖表應(yīng)該按邏輯順序排列。不要讓讀者到處瀏覽整個(gè)頁面,而是應(yīng)該使用直觀的排序方式,比如地理位置或字母順序。 

其次,圖表應(yīng)該使用相同的布局、大小、字體和顏色。請(qǐng)記住,我們正在將一張圖表分 解為多張圖表,因此它應(yīng)該看起來像一張圖表被復(fù)制了多次??v軸和橫軸也許會(huì)改變,但你不 能用藍(lán)點(diǎn)在一張圖表中代表“否”,而在另一張圖表中代表“是”。

第三,序列圖應(yīng)該相對(duì)容閱讀。你不必要求讀者放大,并詳細(xì)解讀圖表中的所有細(xì)節(jié),你的目的是給他們一種整體模式。這些圖表的尺寸很小,因此,包含注釋和標(biāo)簽,或重復(fù)冗長(zhǎng)的軸標(biāo)簽和數(shù)據(jù)標(biāo)記,都會(huì)讓讀者不知所措。 

原則5:從灰色開始

我用一個(gè)實(shí)用的技巧來結(jié)束這一節(jié),這是創(chuàng)建清晰、易懂的可視化效果的一個(gè)簡(jiǎn)單步驟:從灰色開始。無論何時(shí)繪制圖表,都從全灰色元素開始。這樣,會(huì)迫使你在使用顏色、標(biāo)簽和其他元素時(shí)更有目的性和策略性。 

我們以一張簡(jiǎn)單的平均受教育年限的圖表為例,這次只顯示10個(gè)國家。有了顏色和標(biāo)簽 (左上角的圖表),我可以把這張圖表放到我的報(bào)告或講義中,稍做加工,再添加一個(gè)有吸引 力的標(biāo)題,讀者就可以知道哪些標(biāo)簽對(duì)應(yīng)于哪些折線。但是,如果把所有的折線都變成灰色的 (右上角的圖表),讀者就無法完成同樣的任務(wù),因?yàn)椴恢滥臈l折線對(duì)應(yīng)于哪個(gè)國家。

將所有數(shù)據(jù)先全部設(shè)置為灰色,這會(huì)迫使你思考你的目的,以及你到底想要將讀者的注意力引向何處

現(xiàn)在我可以有目的地調(diào)整這張圖表。

我可以添加顏色,改變線條的粗細(xì),以便更好地突 出顯示想要強(qiáng)調(diào)的信息,比如其中的兩個(gè)國家。

左下角的圖表,把所有的標(biāo)簽都放在圖表上, 而右下角的圖表,只是直接標(biāo)明兩個(gè)國家,可以明顯地看出,右下角的圖表能更有效地傳遞信息。

從灰色開始,能迫使我們有目的地選擇在前景中放置哪些元素。

責(zé)任編輯:華軒 來源: Python爬蟲與數(shù)據(jù)挖掘
相關(guān)推薦

2015-08-20 09:45:56

可視化

2020-03-11 14:39:26

數(shù)據(jù)可視化地圖可視化地理信息

2017-07-18 15:15:57

數(shù)據(jù)可視化細(xì)節(jié)層次分析

2025-03-04 00:22:31

2017-07-13 09:21:05

大數(shù)據(jù)數(shù)據(jù)可視化

2017-10-14 13:54:26

數(shù)據(jù)可視化數(shù)據(jù)信息可視化

2025-04-01 08:30:00

Plotly數(shù)據(jù)可視化數(shù)據(jù)分析

2024-05-22 16:03:49

2015-11-11 14:26:31

數(shù)據(jù)可視化術(shù)語

2014-08-19 10:47:11

數(shù)據(jù)可視化大數(shù)據(jù)

2017-06-19 08:30:35

大數(shù)據(jù)數(shù)據(jù)可視化報(bào)表

2025-02-10 00:45:00

pairplotheatmaplmplot

2020-07-22 10:30:54

數(shù)據(jù)可視化分析平臺(tái)分析工具

2015-10-28 13:28:57

2021-11-07 07:53:18

數(shù)據(jù)可視化圖形數(shù)據(jù)

2017-07-28 14:43:49

大數(shù)據(jù)數(shù)據(jù)可視化秘密

2017-02-23 09:42:53

大數(shù)據(jù)數(shù)據(jù)可視化技術(shù)誤區(qū)

2015-09-21 09:21:07

2022-05-16 11:39:46

云架構(gòu)云可視化CROPS

2018-10-16 15:12:48

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)