自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

帶你一文讀懂?dāng)?shù)據(jù)可視化

大數(shù)據(jù) 數(shù)據(jù)可視化
我們現(xiàn)在生活的每一秒都在產(chǎn)生著數(shù)據(jù),比如你現(xiàn)在看這篇文章的時(shí)候。用的什么手機(jī),型號(hào),你所在地點(diǎn),點(diǎn)開這篇文章的時(shí)間,花了多久看的文章……都是被收集的數(shù)據(jù)。

我們現(xiàn)在生活的每一秒都在產(chǎn)生著數(shù)據(jù),比如你現(xiàn)在看這篇文章的時(shí)候。用的什么手機(jī),型號(hào),你所在地點(diǎn),點(diǎn)開這篇文章的時(shí)間,花了多久看的文章……都是被收集的數(shù)據(jù)。

當(dāng)同類的數(shù)據(jù)集合在一起,甚至于縱向的其他數(shù)據(jù)展開聯(lián)系時(shí),都可以成為大數(shù)據(jù)。取決于是誰用這些數(shù)據(jù),以及使用目的,大數(shù)據(jù)沒有嚴(yán)格意義上的類型界定。但是當(dāng)你有了龐大的數(shù)據(jù)后,如何最直接的反應(yīng)數(shù)據(jù)情況?如何以最快的速度發(fā)現(xiàn)需要進(jìn)一步分析的數(shù)據(jù)?做了一系列分析得出結(jié)果后,如何如何簡(jiǎn)單快速的說服你的讀者或者領(lǐng)導(dǎo)?

我們本身可能就是大數(shù)據(jù)的生產(chǎn)者。也會(huì)是使用者。

什么是數(shù)據(jù)可視化?

其實(shí)大數(shù)據(jù)是一個(gè)很空洞的概念,具體的意義針對(duì)不同的人有不同的含義。大數(shù)據(jù)的基本流程鏈包括:數(shù)據(jù)挖掘,數(shù)據(jù)清理,數(shù)據(jù)存儲(chǔ),數(shù)據(jù)分析,數(shù)據(jù)展示。

數(shù)據(jù)可視化就是這樣一種,貫穿數(shù)據(jù)分析整個(gè)時(shí)期,在前期助數(shù)據(jù)分析人員通過迅速呈現(xiàn)整體數(shù)據(jù),發(fā)現(xiàn)可能的問題點(diǎn),后期通過可視化,后期將數(shù)據(jù)分析結(jié)果更快速的呈現(xiàn)在讀者面前。數(shù)據(jù)可視化可以通過使用圖形、圖標(biāo)、色彩變化等各種組合對(duì)數(shù)據(jù)進(jìn)行解讀,從而使人們快速理解一組或多組數(shù)據(jù)中的復(fù)雜關(guān)系。通過數(shù)據(jù)可視化,人們可以從中辨別出趨勢(shì),固定模式,發(fā)現(xiàn)特定問題,甚至可以為決策提供依據(jù)。

拿最近新冠的例子來說,你一定很熟悉下面的這些圖了:

帶你一文讀懂?dāng)?shù)據(jù)可視化
全國(guó)新增新冠確診人數(shù)(圖片來源:丁香園)
帶你一文讀懂?dāng)?shù)據(jù)可視化
全國(guó)現(xiàn)存累計(jì)確診人數(shù)分布(圖片來源:丁香園)
帶你一文讀懂?dāng)?shù)據(jù)可視化
國(guó)內(nèi)新增確診數(shù)據(jù)(圖片來源:丁香園)

第一第二張圖就是數(shù)據(jù)可視化的例子。折線圖和地圖很直觀的將第三張圖的新冠肺炎每日新增人數(shù),以及分布,很直觀的用圖像表現(xiàn)出來,而省去讀者對(duì)第三張圖標(biāo)具體數(shù)字的解讀和處理。當(dāng)讀者需要進(jìn)一步了解圖形背后的具體數(shù)字時(shí),讀者可以去第三張圖標(biāo)進(jìn)行研讀。而這僅僅是最簡(jiǎn)單的例子。

我們?yōu)槭裁葱枰獢?shù)據(jù)可視化?

通過上面的例子,如果說大數(shù)據(jù)可以幫助我們找到規(guī)律和趨勢(shì),那數(shù)據(jù)可視化是一種將數(shù)據(jù)直觀呈現(xiàn)出來的方式。數(shù)據(jù)可視化貫穿數(shù)據(jù)清理,數(shù)據(jù)整合的一個(gè)步驟。比如說你是一名銷售人員要向上一級(jí)匯報(bào)銷售成果。你涉及的數(shù)據(jù)可能包括客戶姓名,客戶地址,購(gòu)買產(chǎn)品,購(gòu)買型號(hào),購(gòu)買數(shù)量,購(gòu)買日期,購(gòu)買單號(hào),發(fā)貨時(shí)間,發(fā)貨方式,銷售金額,折扣數(shù)目,利潤(rùn)率……你應(yīng)該從何種角度下手處理你的數(shù)據(jù),你得出需要加強(qiáng)某個(gè)產(chǎn)品的宣傳的結(jié)論時(shí),覺得你的領(lǐng)導(dǎo)是更愿意直觀的了解到結(jié)果,還是愿意花15分鐘一頁(yè)一頁(yè)研讀你的分析? 

帶你一文讀懂?dāng)?shù)據(jù)可視化

美國(guó)民眾對(duì)新冠病毒看法的變化,用圖像的形式比用電子表格或者文字的形式,更加具體直接。(圖源:538)

所以數(shù)據(jù)可視化可以簡(jiǎn)化人腦處理信息,并得到結(jié)論的一種有效手段。我們?nèi)四X更容易通過圖像等視覺上的呈現(xiàn)來得出一定的結(jié)論。就算一些分析人員可以通過復(fù)雜的演算,模型設(shè)計(jì)得出某些結(jié)論,但這些結(jié)論遠(yuǎn)遠(yuǎn)沒有比直接用圖形來總結(jié)來的更直觀。

拿個(gè)最簡(jiǎn)單的例子來說,北京上海的地鐵公交圖就可以稱為一種數(shù)據(jù)可視化。縱橫交錯(cuò)的軌道交通,不同的線路站點(diǎn),相交的換乘點(diǎn),如果通過文字或者表格來呈現(xiàn)遠(yuǎn)遠(yuǎn)不及軌交地圖來的直觀明了 

帶你一文讀懂?dāng)?shù)據(jù)可視化
上海軌交地圖(圖片來源:TravelChinaGuide)

既然連軌交地圖都是數(shù)據(jù)可視化的一種,那你可以放開了聯(lián)想,其實(shí)生活中很多方面,我們都涉及數(shù)據(jù)可視化。

數(shù)據(jù)可視化和數(shù)據(jù)分析有什么區(qū)別?

數(shù)據(jù)可視化很容易和數(shù)據(jù)分析相混淆,誠(chéng)然兩者有相似之處——數(shù)據(jù)可視化和數(shù)據(jù)分析都是在可視界面中展示數(shù)據(jù)。 

帶你一文讀懂?dāng)?shù)據(jù)可視化

多組可視化合在一起時(shí),可以展示更多的信息甚至可以講述一個(gè)完整時(shí)間(圖源:Center for Data Innovation)

是兩者還有很多方面有不同。數(shù)據(jù)分析是一個(gè)探索性的過程。因?yàn)楹芏鄶?shù)據(jù)分析人員拿到數(shù)據(jù)后,通常有一個(gè)特定問題需要去發(fā)現(xiàn),圍繞著這個(gè)問題,要進(jìn)行不同測(cè)試,需要足夠的耐心才能發(fā)現(xiàn)使用某個(gè)手段,集中分析某些數(shù)據(jù),才能體現(xiàn)出某些關(guān)系,并且回答最初的問題。而數(shù)據(jù)可視化是數(shù)據(jù)分析中的一部分,前期后期都可以通過數(shù)據(jù)可視化,做到更有效的數(shù)據(jù)分析,以及更清楚的呈現(xiàn)最終分析結(jié)果。大致概括如下:

使用目的不同。數(shù)據(jù)分析可以發(fā)現(xiàn)某些潛在的模型,或者趨勢(shì),可以幫助預(yù)測(cè)某些將來發(fā)生的事件。數(shù)據(jù)分析所使用的前期或后期的數(shù)據(jù),可以作為數(shù)據(jù)可視化的數(shù)據(jù)源。而數(shù)據(jù)可視化能夠更直觀的呈現(xiàn)某一局部特征,更明確的展現(xiàn)出某個(gè)變量的影響,前期是幫助數(shù)據(jù)分析人員了解大體數(shù)據(jù)情況,發(fā)現(xiàn)異常值。后期通過可是后分析的數(shù)據(jù),更好的展現(xiàn)分析結(jié)果。

兩者之間關(guān)系不同。數(shù)據(jù)分析是將分析和可視化相結(jié)合,去找出某些結(jié)論。有時(shí)候,數(shù)據(jù)分析是數(shù)據(jù)可視化的前端,數(shù)據(jù)可視化呈現(xiàn)的就是數(shù)據(jù)分析的結(jié)果。

使用工具不同。數(shù)據(jù)分析一般通過規(guī)范分析(prescriptive analytics)和預(yù)測(cè)分析(predictive analytics),診斷分析(diagnostic analytics)。數(shù)據(jù)分析所使用的工具有Excel ,hive, Ploybase,SAP Business Intelligence,Presto, Trifacta,Clear Analytics,等等。而數(shù)據(jù)可視化可以是靜態(tài)展示也可以是互動(dòng)展示數(shù)據(jù),所使用的工具有:Plotly,DataHero,Tableau,QlikView,ZingCHhart 等等 

帶你一文讀懂?dāng)?shù)據(jù)可視化
Tableau的互動(dòng)式可是數(shù)據(jù)化。(圖源:TABLEAU)
數(shù)據(jù)可視化能夠如何幫助數(shù)據(jù)分析,并達(dá)到哪些目的?

數(shù)據(jù)可視化有很多用途,每種類型的數(shù)據(jù)可視化可以有不同的用途。這里就說一下數(shù)據(jù)可視化的最常見的情況。

  • 時(shí)間變化。使用時(shí)間變化展現(xiàn)另一個(gè)變量的變化的形式是最基本和最常見的方法。但是請(qǐng)注意,這并不代表這樣的可視化沒有價(jià)值。這種類型的數(shù)據(jù)可視化之所以常見,是因?yàn)榇蠖鄶?shù)的數(shù)據(jù)都涉及到時(shí)間因素。因此,許多數(shù)據(jù)分析的第一步就是查看數(shù)據(jù)是如何隨著時(shí)間變化而變化的。
  • 確定頻率。確定頻率也是數(shù)據(jù)可視化的基本用途之一。因?yàn)樗策m用于設(shè)計(jì)涉及時(shí)間的數(shù)據(jù)。如果涉及時(shí)間的話,除了檢查數(shù)據(jù)如何隨時(shí)間變化,還要查看在某一單位時(shí)間內(nèi),相關(guān)事件隨時(shí)間發(fā)生的頻率是否合乎邏輯。
  • 確定數(shù)據(jù)之間的關(guān)系(關(guān)聯(lián))。識(shí)別數(shù)據(jù)之間的關(guān)聯(lián)是數(shù)據(jù)可視化非常有價(jià)值的用途之一。了解數(shù)據(jù)中的關(guān)系非常重要,但是如果沒有可視化,就很難確定兩個(gè)變量之間的關(guān)系了。
  • 檢查整個(gè)數(shù)據(jù)。在市場(chǎng)研究中,經(jīng)常可以使用數(shù)據(jù)可視化檢查數(shù)據(jù)整體的例子。因?yàn)槭袌?chǎng)和銷售人員需要知道他們的消息針對(duì)于何種群體,因此他們需要分析整個(gè)市場(chǎng)的受眾群體,以及群體中的集群與集群之間的關(guān)聯(lián),集群中有影響力的人以及異常值。
  • 時(shí)間規(guī)劃。在做一項(xiàng)非常復(fù)雜的項(xiàng)目或者計(jì)劃表的時(shí)候,通常涉及不同部門,不同人員,不同項(xiàng)目細(xì)節(jié),會(huì)讓人非常困惑。甘特圖(Gantt Chart) 可以通過清楚說明項(xiàng)目中的每個(gè)任務(wù),以及所需完成的時(shí)間來解決這個(gè)問題。
  • 分析價(jià)值和確定風(fēng)險(xiǎn)。由于分析價(jià)值和風(fēng)險(xiǎn)這類指標(biāo)有很多相關(guān)因素,要考慮很多不同的變量,那么使用各種變量的普通電子表格,很難準(zhǔn)確有效的一眼將價(jià)值和風(fēng)險(xiǎn)看出。數(shù)據(jù)可視化可以像對(duì)公式進(jìn)行顏色編碼一樣,以顯示哪些機(jī)會(huì)有價(jià)值,哪些機(jī)會(huì)有風(fēng)險(xiǎn)。 
帶你一文讀懂?dāng)?shù)據(jù)可視化
四種基本的數(shù)據(jù)可視化圖形(圖源:The Coding Room)

數(shù)據(jù)可視化有哪些類型?

可視化圖類型有多種多樣,這里我列舉了大多數(shù)市面上能見到的可視化類型圖。

折線圖 (Line chart) 

帶你一文讀懂?dāng)?shù)據(jù)可視化
折線圖(圖源:New Zealand Census)

面積圖 (Area chart) 

帶你一文讀懂?dāng)?shù)據(jù)可視化
面積圖(圖源:Wikepedia)

條形圖(Bar chart) 

帶你一文讀懂?dāng)?shù)據(jù)可視化
條形圖(圖源:Naomi Robbins|Forbes)

直方圖(Histogram) 

帶你一文讀懂?dāng)?shù)據(jù)可視化
直方圖(圖源:Naomi Robbins|Forbes)

值得注意的是條形圖和直方圖是有區(qū)別的。條形圖的寬度表示類別且固定,長(zhǎng)度表示頻數(shù)。直方圖用“面積”表示各組頻數(shù),舉行高度表示每一組的頻數(shù),寬度表示組距,因此高度與寬度均有意義。直方圖為X軸為連續(xù)數(shù)列,且連續(xù)排列。條形圖X軸為分類數(shù)據(jù),分開排列。

散點(diǎn)圖(Scatterplot) 

帶你一文讀懂?dāng)?shù)據(jù)可視化
散點(diǎn)圖(圖源:Wikimedia)

箱型圖(Box Plot) 

帶你一文讀懂?dāng)?shù)據(jù)可視化
箱型圖(圖源:Wikimedia)

氣泡圖(bubble chart) 

帶你一文讀懂?dāng)?shù)據(jù)可視化
氣泡圖(圖源:Tony Hirst | Flickr)

餅圖(Pie chart) 

帶你一文讀懂?dāng)?shù)據(jù)可視化
餅圖(圖源:Wikimedia)

量規(guī)圖(gauge) 

帶你一文讀懂?dāng)?shù)據(jù)可視化
量規(guī)圖(圖源Ken Flerlage | The FlerlageTwins)

地圖(Maps) 

帶你一文讀懂?dāng)?shù)據(jù)可視化
地圖

此處特別推薦哈佛大學(xué)地理分析中心(Center for Geographic Analysis - Harvard University)

  • https://gis.harvard.edu/researchhttp://worldmap.harvard.edu/africamap/

以及哈佛大學(xué)做的非洲地圖:

  • http://worldmap.harvard.edu/africamap/ 這張互動(dòng)地圖包括了經(jīng)濟(jì),宗教,社會(huì),人口,歷史,交通等方方面面。

熱圖(Heat map)

這就有很多種了。這里就放一個(gè)我曾使用過的眼動(dòng)儀(eye tracking)所產(chǎn)生的熱圖 

帶你一文讀懂?dāng)?shù)據(jù)可視化
眼動(dòng)儀其中的熱圖功能(圖源:Rosenfeld Media | Flickr

框架圖(Frame diagram) 

帶你一文讀懂?dāng)?shù)據(jù)可視化
通??蚣軋D指的是樹圖(圖源:Wikimedia)

瀑布圖 (Waterfall chart) 

帶你一文讀懂?dāng)?shù)據(jù)可視化
瀑布圖(圖源:Wikipedia)

漏斗圖(Funnel chart) 

帶你一文讀懂?dāng)?shù)據(jù)可視化
使用R創(chuàng)建的漏斗圖(圖源:Neha Kuma | Sisense)

雷達(dá)圖或蜘蛛圖(Radar or Spider Chart) 

帶你一文讀懂?dāng)?shù)據(jù)可視化
雷達(dá)圖(圖源:middlebury.edu)

這些就是市面上你可以見到的數(shù)據(jù)可視化圖形。當(dāng)然還有其它形式的,以及圖形與圖形之間的疊加組合,比如折線圖與直方圖的組合等等,我就不一一列舉了。

因此數(shù)據(jù)可視化并非那么神秘,我們常用的EXCEL就可以做出上述可視化圖形中的好幾種。除了Excel,Tableau可以創(chuàng)建其中絕大部分的數(shù)據(jù)可視化,而且通過使用其中的Dashboard可以創(chuàng)建互動(dòng)式的數(shù)據(jù)可視化,story功能實(shí)現(xiàn)圖組創(chuàng)建故事講述功能。最最重要的是Tableau提供免費(fèi)版本,使用Tableau的一切功能。免費(fèi)版本和付費(fèi)版本的區(qū)別在于保存,付費(fèi)版本可以保存在本地,而免費(fèi)版本可以上傳到Tableau的公共資源網(wǎng)上,和別人分享你所創(chuàng)建的數(shù)據(jù)可視化,同時(shí)還能查看別人創(chuàng)建的各種出色的可視化。

 

責(zé)任編輯:未麗燕 來源: 今日頭條
相關(guān)推薦

2017-06-02 15:32:09

大數(shù)據(jù)數(shù)據(jù)可視化

2021-09-13 22:34:56

區(qū)塊鏈新基建數(shù)字化轉(zhuǎn)型

2019-06-13 21:31:19

AI

2017-04-19 08:32:50

大數(shù)據(jù)數(shù)據(jù)可視化編程工具

2022-10-20 08:01:23

2021-03-05 09:10:19

base64編碼

2018-11-16 10:04:14

云存儲(chǔ)磁帶存儲(chǔ)RAID

2022-08-27 10:37:48

電子取證信息安全

2021-03-30 18:05:10

數(shù)字化轉(zhuǎn)型計(jì)算機(jī)技術(shù)

2022-02-15 08:07:17

測(cè)試軟件開發(fā)

2023-12-22 19:59:15

2021-08-04 16:06:45

DataOps智領(lǐng)云

2024-02-29 14:27:37

人工智能機(jī)器學(xué)習(xí)物聯(lián)網(wǎng)

2022-05-04 17:43:28

元數(shù)據(jù)大數(shù)據(jù)

2018-04-03 13:08:31

2023-06-19 13:57:00

數(shù)據(jù)系統(tǒng)

2022-07-05 06:30:54

云網(wǎng)絡(luò)網(wǎng)絡(luò)云原生

2023-05-20 17:58:31

低代碼軟件

2023-11-27 17:35:48

ComponentWeb外層

2021-12-29 18:00:19

無損網(wǎng)絡(luò)網(wǎng)絡(luò)通信網(wǎng)絡(luò)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)