數(shù)據(jù)分析師的能力和工具體系
之前我在回答里寫過,數(shù)據(jù)分析師和圣騎士職業(yè)很相似,都需要“門門通”。最近,我嘗試對數(shù)據(jù)分析師的能力和工具體系進(jìn)行梳理,以下內(nèi)容為一家之言,僅供參考。
數(shù)據(jù)分析師的能力體系
如下圖:

數(shù)學(xué)知識
數(shù)學(xué)知識是數(shù)據(jù)分析師的基礎(chǔ)知識。
對于初級數(shù)據(jù)分析師,了解一些描述統(tǒng)計相關(guān)的基礎(chǔ)內(nèi)容,有一定的公式計算能力即可,了解常用統(tǒng)計模型算法則是加分。
對于高級數(shù)據(jù)分析師,統(tǒng)計模型相關(guān)知識是必備能力,線性代數(shù)(主要是矩陣計算相關(guān)知識)***也有一定的了解。
而對于數(shù)據(jù)挖掘工程師,除了統(tǒng)計學(xué)以外,各類算法也需要熟練使用,對數(shù)學(xué)的要求是***的。
分析工具
對于初級數(shù)據(jù)分析師,玩轉(zhuǎn)Excel是必須的,數(shù)據(jù)透視表和公式使用必須熟練,VBA是加分。另外,還要學(xué)會一個統(tǒng)計分析工具,SPSS作為入門是比較好的。
對于高級數(shù)據(jù)分析師,使用分析工具是核心能力,VBA基本必備,SPSS/SAS/R至少要熟練使用其中之一,其他分析工具(如Matlab)視情況而定。
對于數(shù)據(jù)挖掘工程師……嗯,會用用Excel就行了,主要工作要靠寫代碼來解決呢。
編程語言
對于初級數(shù)據(jù)分析師,會寫SQL查詢,有需要的話寫寫Hadoop和Hive查詢,基本就OK了。
對于高級數(shù)據(jù)分析師,除了SQL以外,學(xué)習(xí)Python是很有必要的,用來獲取和處理數(shù)據(jù)都是事半功倍。當(dāng)然其他編程語言也是可以的。
對于數(shù)據(jù)挖掘工程師,Hadoop得熟悉,Python/Java/C++至少得熟悉一門,Shell得會用……總之編程語言絕對是數(shù)據(jù)挖掘工程師的最核心能力了。
業(yè)務(wù)理解
業(yè)務(wù)理解說是數(shù)據(jù)分析師所有工作的基礎(chǔ)也不為過,數(shù)據(jù)的獲取方案、指標(biāo)的選取、乃至最終結(jié)論的洞察,都依賴于數(shù)據(jù)分析師對業(yè)務(wù)本身的理解。
對于初級數(shù)據(jù)分析師,主要工作是提取數(shù)據(jù)和做一些簡單圖表,以及少量的洞察結(jié)論,擁有對業(yè)務(wù)的基本了解就可以。
對于高級數(shù)據(jù)分析師,需要對業(yè)務(wù)有較為深入的了解,能夠基于數(shù)據(jù),提煉出有效觀點,對實際業(yè)務(wù)能有所幫助。
對于數(shù)據(jù)挖掘工程師,對業(yè)務(wù)有基本了解就可以,重點還是需要放在發(fā)揮自己的技術(shù)能力上。
邏輯思維
這項能力在我之前的文章中提的比較少,這次單獨拿出來說一下。
對于初級數(shù)據(jù)分析師,邏輯思維主要體現(xiàn)在數(shù)據(jù)分析過程中每一步都有目的性,知道自己需要用什么樣的手段,達(dá)到什么樣的目標(biāo)。
對于高級數(shù)據(jù)分析師,邏輯思維主要體現(xiàn)在搭建完整有效的分析框架,了解分析對象之間的關(guān)聯(lián)關(guān)系,清楚每一個指標(biāo)變化的前因后果,會給業(yè)務(wù)帶來的影響。
對于數(shù)據(jù)挖掘工程師,邏輯思維除了體現(xiàn)在和業(yè)務(wù)相關(guān)的分析工作上,還包括算法邏輯,程序邏輯等,所以對邏輯思維的要求也是***的。
數(shù)據(jù)可視化
數(shù)據(jù)可視化說起來很高大上,其實包括的范圍很廣,做個PPT里邊放上數(shù)據(jù)圖表也可以算是數(shù)據(jù)可視化,所以我認(rèn)為這是一項普遍需要的能力。
對于初級數(shù)據(jù)分析師,能用Excel和PPT做出基本的圖表和報告,能清楚的展示數(shù)據(jù),就達(dá)到目標(biāo)了。
對于高級數(shù)據(jù)分析師,需要探尋更好的數(shù)據(jù)可視化方法,使用更有效的數(shù)據(jù)可視化工具,根據(jù)實際需求做出或簡單或復(fù)雜,但適合受眾觀看的數(shù)據(jù)可視化內(nèi)容。
對于數(shù)據(jù)挖掘工程師,了解一些數(shù)據(jù)可視化工具是有必要的,也要根據(jù)需求做一些復(fù)雜的可視化圖表,但通常不需要考慮太多美化的問題。
協(xié)調(diào)溝通
對于初級數(shù)據(jù)分析師,了解業(yè)務(wù)、尋找數(shù)據(jù)、講解報告,都需要和不同部門的人打交道,因此溝通能力很重要。
對于高級數(shù)據(jù)分析師,需要開始獨立帶項目,或者和產(chǎn)品做一些合作,因此除了溝通能力以外,還需要一些項目協(xié)調(diào)能力。
對于數(shù)據(jù)挖掘工程師,和人溝通技術(shù)方面內(nèi)容偏多,業(yè)務(wù)方面相對少一些,對溝通協(xié)調(diào)的要求也相對低一些。
快速學(xué)習(xí)
無論做數(shù)據(jù)分析的哪個方向,初級還是高級,都需要有快速學(xué)習(xí)的能力,學(xué)業(yè)務(wù)邏輯、學(xué)行業(yè)知識、學(xué)技術(shù)工具、學(xué)分析框架……數(shù)據(jù)分析領(lǐng)域中有學(xué)不完的內(nèi)容,需要大家有一顆時刻不忘學(xué)習(xí)的心。
以上,就是我對數(shù)據(jù)分析師能力的總結(jié)。
數(shù)據(jù)分析師的工具體系
一圖說明問題

可以從圖上看到,Python在數(shù)據(jù)分析中的泛用性相當(dāng)之高,流程中的各個階段都可以使用Python。所以作為數(shù)據(jù)分析師的你如果需要學(xué)習(xí)一門編程語言,那么強(qiáng)力推薦Python~