如何成為一名數(shù)據(jù)分析師:必備技能 TOP5
什么是數(shù)據(jù)分析師(Data Analyst)?
數(shù)據(jù)分析師指的是不同行業(yè)中,專門從事行業(yè)數(shù)據(jù)搜集、整理、分析,并依據(jù)數(shù)據(jù)做出行業(yè)研究、評(píng)估和預(yù)測(cè)的專業(yè)人員。
他們知道如何提出正確的問(wèn)題,善于數(shù)據(jù)分析,數(shù)據(jù)可視化和數(shù)據(jù)呈現(xiàn);輔助公司商業(yè)決策,幫助降低成本,提高收益,改進(jìn)產(chǎn)品,留住客戶,發(fā)現(xiàn)新的商業(yè)機(jī)會(huì)等??偟膩?lái)說(shuō),根據(jù)數(shù)據(jù)分析師的級(jí)別,他們主要的工作內(nèi)容可能包括以下:
- 與IT部門,管理部門,數(shù)據(jù)科學(xué)家(Data Scientist)合作,決定整個(gè)公司的團(tuán)隊(duì)目標(biāo)
- 從primary research和secondary research中收集提取數(shù)據(jù)
- 清理和選取數(shù)據(jù),去除無(wú)關(guān)信息
- 熟悉使用統(tǒng)計(jì)軟件和其他技術(shù)分析和解讀數(shù)據(jù)
- 總結(jié)數(shù)據(jù)里的趨勢(shì)或相關(guān)性
- 為過(guò)程改進(jìn)發(fā)現(xiàn)潛在機(jī)會(huì)并提出可行建議
- 提供準(zhǔn)確的數(shù)據(jù)分析和可視化報(bào)告
- 創(chuàng)建并管理維持?jǐn)?shù)據(jù)庫(kù)
- 修改代碼相關(guān)的問(wèn)題
數(shù)據(jù)分析師的就業(yè)前景怎樣?
隨著科技的發(fā)展,人類社會(huì)產(chǎn)生的數(shù)據(jù)規(guī)模呈指數(shù)級(jí)增長(zhǎng)。每時(shí)每刻都有大量數(shù)據(jù)被產(chǎn)生存儲(chǔ)下來(lái),尤其在電子商務(wù)、網(wǎng)絡(luò)游戲、社交網(wǎng)站、旅游、在線教育等領(lǐng)域?,F(xiàn)在,全世界每天產(chǎn)生的新數(shù)據(jù)超過(guò)400萬(wàn)TB。數(shù)據(jù)分析師則成為當(dāng)前炙手可熱的職業(yè)之一。
必備技能
要成為一名成功的數(shù)據(jù)分析師,需要的技能主要有兩大塊:硬技能(包括掌握一些數(shù)據(jù)分析的軟件等)和軟技能(良好的溝通技能,PPT技能)。
硬技能(Hard Skills)
知識(shí)體系
統(tǒng)計(jì)學(xué)的基本知識(shí)和對(duì)machine learning的了解:大部分對(duì)消費(fèi)者的分析都離不開描述統(tǒng)計(jì)方法(平均數(shù),中位數(shù),顯著性等等)
計(jì)算機(jī)軟件
對(duì)于數(shù)據(jù)分析師來(lái)說(shuō),可能每個(gè)項(xiàng)目的70%到80%的時(shí)間都是在收集和處理數(shù)據(jù),他們需要首先想好需要什么樣的數(shù)據(jù),比如timeframe是一年還是十年。選定好需要的數(shù)據(jù)后要進(jìn)入一個(gè)或多個(gè)數(shù)據(jù)庫(kù)去收集數(shù)據(jù),最后需要對(duì)數(shù)據(jù)進(jìn)行一些處理,看看是不是有missing value或者outliers等等。
這個(gè)過(guò)程之后得到了可靠的數(shù)據(jù),然后便進(jìn)入到核心的數(shù)據(jù)分析。為了能更好的從數(shù)據(jù)里提取到需要的信息,以下這些軟件就是數(shù)據(jù)分析師們常用的。Querying language和statistical language主要是用來(lái)做一些初步的數(shù)據(jù)分析,例如可以出一些圖表,看一下數(shù)據(jù)的分布,從而對(duì)數(shù)據(jù)有個(gè)了解。而scripting language則可以用于建?;蛘邷y(cè)試一下hypothesis。因此總的來(lái)說(shuō),這些軟件對(duì)于數(shù)據(jù)分析師來(lái)說(shuō)就像廚師的刀,是必不可少的工具。
- 查詢語(yǔ)言(Querying Language):SQL; Hive; Pig
- 腳本編程語(yǔ)言(Scripting Language):Python; Matlab
- 統(tǒng)計(jì)語(yǔ)言(Statistical Language):R; SAS; SPSS
- 數(shù)據(jù)表(Spreadsheet):Excel
軟技能(Soft Skills)
明確問(wèn)題(Defining the Problem)
將分析范圍縮小是很重要的技能。如何將復(fù)雜的問(wèn)題去掉細(xì)枝末節(jié),抓住重點(diǎn)需要良好的溝通能力和對(duì)商業(yè)需求的充分理解能力。注意:避免向客戶遞交太多對(duì)解決核心問(wèn)題無(wú)用的信息。另外,對(duì)公司和行業(yè)的了解也會(huì)使得這個(gè)過(guò)程更加得心應(yīng)手。
了解聽眾(Knowing the Audience)
通常來(lái)說(shuō)一個(gè)數(shù)據(jù)分析師需要面對(duì)PM和CEO。因此,在準(zhǔn)備presentation時(shí),要注意回答這兩方關(guān)心的不同的問(wèn)題。對(duì)于PM來(lái)說(shuō),需要的是簡(jiǎn)單無(wú)修飾,多干貨介紹在各種情況下如何進(jìn)行協(xié)作交互。而面對(duì)CEO,需要展示的是稍加修飾的PPT和最重要提供具體的建議。
另外很需要注意的一點(diǎn)是communication。很有可能數(shù)據(jù)分析師們面對(duì)的聽眾并不是有technical的背景,如何將很專業(yè)的術(shù)語(yǔ)轉(zhuǎn)化為商業(yè)語(yǔ)言是十分重要的。而掌握一定的data visualization的技能便會(huì)在此時(shí)讓展示更為有效。
強(qiáng)調(diào)結(jié)果(Delivery)
一定要有研究成果的展示,如果只是分析內(nèi)容的步驟,而缺乏最后對(duì)成果的總結(jié),將很有可能延滯項(xiàng)目的推進(jìn)。對(duì)于公司或項(xiàng)目的管理者來(lái)說(shuō),分析的過(guò)程并不是他們最看重的,而分析的結(jié)果和針對(duì)這個(gè)結(jié)果有什么合理的建議或解決方法才是最讓他們關(guān)注的,因此為了更為有效地推進(jìn)項(xiàng)目,重點(diǎn)強(qiáng)調(diào)結(jié)果是十分必要的。36大數(shù)