一套通用的數(shù)據(jù)分析學習指南,入門必看!
最近收到了不少朋友的問題:我是做運營的想入門數(shù)據(jù)分析應該怎么學?新手做數(shù)據(jù)分析有哪些好用的工具?會用Excel但是做分析總是沒思路怎么辦?做數(shù)據(jù)分析有哪些方法等等一系列的問題,今天我就用這篇文章統(tǒng)一回答關于數(shù)據(jù)分析入門的問題。
數(shù)據(jù)分析是什么?
很多人都沒有搞懂數(shù)據(jù)分析是什么,包括一些公司和企業(yè)也沒搞清楚數(shù)據(jù)分析的定義。經常聽到有人說投了數(shù)據(jù)分析的崗位,結果入職之后每天干的活就是取數(shù)給業(yè)務用,感覺自己就像個取數(shù)機。這樣的工作根本不能叫做數(shù)據(jù)分析。
什么是數(shù)據(jù)分析,用我自己的話來說就是針對某個問題,將獲取后的數(shù)據(jù)用分析手段加以處理,并發(fā)現(xiàn)業(yè)務價值的過程。這一句話也基本涵蓋了數(shù)據(jù)分析的流程:目標確定——數(shù)據(jù)獲取、清洗、整理——數(shù)據(jù)分析——結果呈現(xiàn)
數(shù)據(jù)分析需要哪些能力
數(shù)據(jù)分析師需要會哪些技能,圍繞上面數(shù)據(jù)分析的基本流程,我把數(shù)據(jù)分析師的能力分為這樣三大部分:基礎知識、工具技能、分析方法與思維
以下師數(shù)據(jù)分析的技能大綱,圖中標記了能力等級,大家根據(jù)自己的情況對應學習:
數(shù)據(jù)分析基礎知識
數(shù)據(jù)分析理論知識這方面,需要掌握是統(tǒng)計學和機器學習相關知識。
1、統(tǒng)計學
毫不夸張的說統(tǒng)計學是整個數(shù)據(jù)分析的靈魂。判別一個數(shù)據(jù)分析師強弱的一個重要方法就是,看他對統(tǒng)計規(guī)律的敏感度。這里我們需要從基礎的統(tǒng)計理論(描述性統(tǒng)計、區(qū)間估計、假設檢驗等)出發(fā),到基本的統(tǒng)計分析(T 檢驗、方差分析等),最后到商業(yè)常用的模型(回歸分析、方差分析等),學習數(shù)據(jù)分析背后的邏輯,掌握實用統(tǒng)計學的概念和會利用統(tǒng)計的思維去思考問題。推薦書籍:《深入淺出數(shù)據(jù)分析》、《統(tǒng)計學習方法》李航
《深入淺出數(shù)據(jù)分析》這本書非常推薦作為小白的入門書籍,特別是之前沒有接觸過數(shù)據(jù)分析的。特點和書名一樣深入淺出,而且圖多。里面沒有那么多公式和理論,但其中對于統(tǒng)計的基本原理以及統(tǒng)計問題的來源場景介紹的非常通透,非常符合深入淺出系列定位。如果有之前有一定基礎,建議略過。
2、機器學習
對于想要進階成為高級數(shù)據(jù)分析師的朋友來說,就要掌握機器學習相關的知識:特征工程的基礎:如何統(tǒng)計數(shù)據(jù)特征、選用不同的特征,做模型的優(yōu)化;基本的分類算法:決策樹、隨機森林等;基本的聚類算法、數(shù)據(jù)挖掘、常見的機器學習算法的了解等等機器學習相關的知識學習成本會比較高,對某些同學來說可能會有一定難度,但對于業(yè)務型數(shù)據(jù)分析師來說,一般不會要求你去推導算法公式,能做到明白不同算法的適用場景、優(yōu)缺點、原理大概懂就基本可以了。推薦學習書籍:《機器學習》周志華,網上也有不少學習視頻,入門的話我推薦吳恩達的coursera機器學習課
數(shù)據(jù)分析工具學習
1、PPT
為什么把PPT放在第一,原因很簡單,我們做數(shù)據(jù)分析的目的是什么?當然是為了展示給客戶、上級,供他們做決策。所以PPT作為主流匯報、展示工具,是將分析關鍵結果傳遞給其他的重要手段。學好PPT可以提升溝通和消息傳遞效率,也是數(shù)據(jù)分析師必備的技能,具體學習書目我就不做推薦了。
2、EXCEL
EXCEL應該是數(shù)據(jù)分析師最常用的統(tǒng)計分析工具了,原因是因為方便,所見即所得,而且具有方便的可視化功能。應該說只有學會了Vlookup,數(shù)據(jù)透視和基本公式才算EXCEL入門,其次EXCEL最大的驚喜是數(shù)據(jù)可視化,擁有大量的圖表模板,可以減輕我們很多工作。這里我推薦《誰說菜鳥不會數(shù)據(jù)分析》這本書作為EXCEL入門。這本書如果作為數(shù)據(jù)分析入門書籍是不合格的,因為它有太多內容是關于EXCEL基本操作的,關于數(shù)據(jù)分析的內容反而很少,但是實事求是的講這本書里面關于EXCEL數(shù)據(jù)分析常用公式、數(shù)據(jù)可視化的內容還是不錯的,可以當成一本入門書籍。
3、ACCESS
為什么把ACCESS作為中級數(shù)據(jù)分析師必備技能,原因很簡單,當數(shù)據(jù)太大,EXCEL又處理不了,又沒有很強的編程基礎怎么辦?ACCESS的優(yōu)勢就體現(xiàn)出來了,它可以在不用掌握很高深編程語言的條件下,處理Excel所不能承載的大存儲量的數(shù)據(jù)原始文件,速度奇快,且易學易用。作為入門,我推薦《表哥的Access入門》這本書。通過一個簡單的小飯館數(shù)據(jù)庫管理程序的開發(fā)過程,對理解數(shù)據(jù)庫和學習一些基本的ACCESS很有幫助。
4、SQL
作為數(shù)據(jù)分析人員,要想獲取數(shù)據(jù),肯定就要和數(shù)據(jù)庫打交道,因此sql肯定是要掌握的,在招聘要求中,sql也是很多數(shù)據(jù)分析崗位的能力要求之一。學習SQL最快的方法是能自己下載數(shù)據(jù)庫管理工具,找些數(shù)據(jù)練習,主要了解一些數(shù)據(jù)庫查詢語言,where,group by,orderby,having,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的邏輯,時間轉換函數(shù)等。這里推薦《MYSQL必知必會》
5、Python
Python作為目前最火的編程軟件之一,確實在數(shù)據(jù)分析、數(shù)據(jù)挖掘上有著獨特優(yōu)勢。是否具備編程能力,也是初級數(shù)據(jù)分析和高級數(shù)據(jù)分析的分水嶺。以下以python的學習路線圖:
看起來要學習的內容挺多的,但其實python最大的優(yōu)勢就是語言簡約,非常易于讀寫,如果之前有一定的編程基礎,上手很快。推薦書籍《Python編程快速上手》,新手可以跟著書里的內容一步步做,把里面的項目做完,差不多就入門了
6、商業(yè)數(shù)據(jù)分析軟件
excel做數(shù)據(jù)分析難以解決大數(shù)據(jù)量的問題,對沒有編程基礎的人來說上手python又比較難,這時候可以選擇利用數(shù)據(jù)分析軟件來做數(shù)據(jù)分析,現(xiàn)在市場上的數(shù)據(jù)分析軟件基本都涵蓋來數(shù)據(jù)采集、處理、分析到可視化展現(xiàn)的過程,操作簡單,可視化效果很棒,比較適合新手入門。比較好用的有FineBI、tableau 等等
數(shù)據(jù)分析方法
學習數(shù)據(jù)分析肯定有人上網百度了不少數(shù)據(jù)分析方法,什么漏斗分析法,PEST,SWOT模型、杜邦分析法等等。并且由于不同版本的演繹,造成了分析方法種類繁多,令人眼花繚亂,關于分析方法值得一說的就是一定要結合行業(yè)特點,特別是對業(yè)務的掌握,這樣才能事半功倍。下面簡單列幾個比較通用的分析方法:
1、對比分析法
對比分析法常用的基礎分析方法,雖然方法特別簡單,但幾乎所有的分析報告中,都會采取對比分析方法。比如去年同期相比、上個月環(huán)比、目標和實際達成相比、各個部門和業(yè)務線相比、行業(yè)內競品比較、營銷效果對比,等等。這里需要注意的是我們不管是橫向比較還是縱向比較,比較的雙方一定要有可比性,并且在同一個維度、粒度上去比較,要不是毫無意義的。
2、5W2H分析法
這個方法主要應用于用戶行為研究和專項問題分析,從時間、地點、人物、事情、原因、方式、價格等7個方面對一個問題進行刻畫研究。
3、SWOT
明確資源優(yōu)勢(Strengths)、競爭劣勢(Weaknesses)、外部環(huán)境變化帶來的機會(Opportunities)和威脅(Threats)等,將這些因素有機結合起來,以此確定企業(yè)經營戰(zhàn)略。
4、PEST
從政治(Politics)、經濟(Economics)、社會(Society)、技術(Technology)4個視角分析外部環(huán)境。
5、杜邦分析法
杜邦分析法是一種用來評價公司盈利能力和股東權益回報水平,從財務角度評價企業(yè)績效的一種經典方法。其基本思想是將企業(yè)凈資產收益率逐級分解為多項財務比率乘積,這樣有助于深入分析比較企業(yè)經營業(yè)績。
數(shù)據(jù)分析思維
分析思維是數(shù)據(jù)分析師最最核心的競爭力,上面所學習的python、sql、機器學習知識等都是在工具層面,要想使用好他們,還需要分析思維的駕馭。對于分析思維的學習,我建議新人也是從讀書開始,我看過的且比較推薦的書包括:
數(shù)據(jù)分析類《精益數(shù)據(jù)分析》、《增長黑客》、《數(shù)據(jù)化管理:洞悉零售及電子商務運營》、《數(shù)據(jù)挖掘與數(shù)據(jù)化運營實戰(zhàn) 思路、方法、技巧與應用》
產品思維類如果是想要從事互聯(lián)網行業(yè)的數(shù)據(jù)分析師的話,產品思維也是必須要具備的,面試考察點之一,推薦《從點子到產品:產品經理的價值觀與方法論》、《俞軍產品方法論》、《產品思維》
邏輯思維類在面試中邏輯清晰的回答面試官的問題,會為你大大的加分,推薦《金字塔原理》、《學會提問》、《麥肯錫思維》
本文轉載自微信公眾號「數(shù)據(jù)分析不是個事兒」