自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

關(guān)于數(shù)據(jù)分析技能的思考

大數(shù)據(jù) 數(shù)據(jù)分析
師兄之前和大家聊了聊找工作面試的要點(diǎn)。看了大家在后臺(tái)留言,想了解下數(shù)據(jù)分析都需要懂什么工具,知道什么數(shù)學(xué)原理。今天我們就來(lái)聊聊關(guān)于數(shù)據(jù)分析的技能。

 師兄之前和大家聊了聊找工作面試的要點(diǎn)??戳舜蠹以诤笈_(tái)留言,想了解下數(shù)據(jù)分析都需要懂什么工具,知道什么數(shù)學(xué)原理。今天我們就來(lái)聊聊關(guān)于數(shù)據(jù)分析的技能。

首先說(shuō)結(jié)論:業(yè)務(wù)是第一位,其次才是工具和數(shù)學(xué)原理。為什么這么說(shuō)?因?yàn)閿?shù)據(jù)分析是為了解決業(yè)務(wù)問(wèn)題,如果脫離了業(yè)務(wù),什么都不是。

比如:80%,單看這個(gè)數(shù)字是沒(méi)有什么意義的。但是如果我們說(shuō)某APP的次留是80%,就將這個(gè)單獨(dú)的數(shù)字賦予了業(yè)務(wù)意義。

所以,數(shù)據(jù)分析一定是與業(yè)務(wù)強(qiáng)相關(guān)的。下面我們就來(lái)說(shuō)說(shuō)數(shù)據(jù)分析所需要的技能。

工具類技能

工具,必須要學(xué)習(xí)一下 SQL 和 Excel。

數(shù)據(jù)分析一定是和業(yè)務(wù)強(qiáng)相關(guān)。所有數(shù)據(jù)都是為業(yè)務(wù)服務(wù)。但是前提是,你得拿到數(shù)據(jù)對(duì)吧。所以,SQL是必須會(huì)的技能。這個(gè)是我們拿到數(shù)據(jù)的主要工具。

那拿到數(shù)據(jù)了,我們肯定還需要對(duì)數(shù)據(jù)進(jìn)行一定的作圖,對(duì)比,處理。這里常用的就是Excel。

其次,大家肯定還會(huì)想到Python,R語(yǔ)言。這些就是偏進(jìn)階的工具了。后期建議大家學(xué)習(xí)Python,更通用一些。

我們分別來(lái)說(shuō)下這幾個(gè)工具所需要了解的基礎(chǔ)能力:EXCEL:常用函數(shù)vlookup,match,index等,數(shù)據(jù)透視表功能,圖表功能。SQL:聚合函數(shù),窗口函數(shù),表格關(guān)聯(lián),數(shù)據(jù)傾斜優(yōu)化等。Python:循環(huán)、字典、字符串、pandas、numpy等常用包的使用。

理論類技能

關(guān)于理論,如果要?jiǎng)澐忠粋€(gè)常用的范圍,那么就是數(shù)理統(tǒng)計(jì)和概率論。

數(shù)據(jù)有兩種指標(biāo)。一種是均值型指標(biāo),比如日活,NU,GMV;一種是比值型指標(biāo),比如注冊(cè)率,滲透率。這些指標(biāo),在AB測(cè)試中,所需要的檢驗(yàn)方式也是不同的。這些就需要統(tǒng)計(jì)學(xué)的基礎(chǔ)。

我們?cè)谝罁?jù)歷史數(shù)據(jù)預(yù)測(cè)未來(lái)數(shù)據(jù)時(shí),會(huì)需要一些概率和數(shù)理統(tǒng)計(jì)的知識(shí)。比如,某功能的滲透率是70%,如果我們想要提升至80%,可以選擇哪些用戶進(jìn)行推廣。這里,我們就需要計(jì)算不同用戶組合下的滲透的概率。這時(shí),我們就需要運(yùn)用概率論,數(shù)理統(tǒng)計(jì)。

我們來(lái)說(shuō)說(shuō)統(tǒng)計(jì)學(xué)和概率論的基礎(chǔ)知識(shí):

1、統(tǒng)計(jì)推斷:置信區(qū)間、置信度、假設(shè)檢驗(yàn)(t檢驗(yàn)、z檢驗(yàn)、卡方檢驗(yàn)),以及這些檢驗(yàn)適用的數(shù)據(jù)類型及樣本情況;

2、中心極限定律、大數(shù)定律、辛普森悖論等;

3、概率與概率的分布、統(tǒng)計(jì)量及抽樣分布、參數(shù)估計(jì)等;

4、回歸分析、方差分析、分類分析、時(shí)間序列等。

這些基礎(chǔ)知識(shí)可以去看看浙大出版的《概率論與數(shù)理統(tǒng)計(jì)》,賈俊平老師寫的《統(tǒng)計(jì)學(xué)》。

再往上,全概率公式、貝葉斯公式、馬爾科夫鏈這些也需要深入的學(xué)習(xí)和思考一下。因?yàn)檫@些公式,在業(yè)務(wù)中的應(yīng)用也非常多。

比如,我們某功能點(diǎn)擊率下降了,我們想知道是新用戶引起的,還是老用戶引起的,我們就可以用全概率公式。

比如,我們?cè)谶M(jìn)行內(nèi)容的小流量實(shí)驗(yàn),想通過(guò)用戶的點(diǎn)擊,評(píng)估用戶對(duì)內(nèi)容的偏好,我們就可以用貝葉斯公式。

比如,我們想要對(duì)用戶的APP使用進(jìn)行引導(dǎo),我們就需要選擇最優(yōu)使用路徑,我們就可以用馬爾科夫鏈。... ... 這些,就是比較進(jìn)階的內(nèi)容。推薦看《概率導(dǎo)論》和《線性代數(shù)應(yīng)該這樣學(xué)》。

業(yè)務(wù)類技能

說(shuō)到業(yè)務(wù)類技能,師兄認(rèn)為,需要會(huì)拆,也要會(huì)比。

先說(shuō)“拆”。大家應(yīng)該都聽(tīng)過(guò)“人貨場(chǎng)”,“5W2H”,“4P”這些常用的分析方法論。這些方法論的本質(zhì)是告訴大家一種業(yè)務(wù)上的通用拆分方法。這些拆分方法可以讓我們將業(yè)務(wù)拆分為幾個(gè)相對(duì)獨(dú)立的變量,讓我們更好的了解及度量業(yè)務(wù)。

當(dāng)然,我們也可以按照公式來(lái)拆。比如,DAU = NU + 老用戶;GMV = DAU * ARPU = NU * ARPU + 老用戶 * ARPU 等等。

結(jié)合我們對(duì)業(yè)務(wù)的理解,以及從大到小的層級(jí)拆分順序。我們可以將業(yè)務(wù)映射至不同的業(yè)務(wù)變量上,通過(guò)公式組合,得到最終的業(yè)務(wù)指標(biāo)。

這樣,當(dāng)我們要解決某個(gè)業(yè)務(wù)問(wèn)題,或者建立某個(gè)業(yè)務(wù)的指標(biāo)時(shí),我們可以非常清楚的知道每個(gè)業(yè)務(wù)變量在公式中的作用。

再說(shuō)“比”。是指同比,環(huán)比,定基比。

為什么一定要對(duì)比?

舉個(gè)例子:3月1日某APP日活100w。

這句話陳述了一個(gè)事實(shí)。但是這個(gè)事實(shí)是好還是壞,我們并不能有一個(gè)結(jié)論。

為什么?

與其他的APP比較:如果每個(gè)同類型APP的3月1日的日活都是1000w,那其實(shí)這個(gè)APP流量很小;如果每個(gè)同類型APP的日活都是10w,那這個(gè)APP的流量就很大。

與歷史數(shù)據(jù)比較:如果2月1日日活是200w,那么其實(shí)預(yù)示著業(yè)務(wù)流量在下降;如果在2月1日日活是50w,那么業(yè)務(wù)是有增長(zhǎng)的。

所以,我們?cè)诓鸱种?,還需要去對(duì)比。

如果說(shuō),拆分是為了讓我們更清楚的度量業(yè)務(wù)子變量,知道每個(gè)子變量對(duì)核心業(yè)務(wù)的影響,讓我們能夠有針對(duì)性的落地;那么,對(duì)比就是讓我們知道業(yè)務(wù)當(dāng)前的狀況如何,發(fā)展是好是壞,我們最應(yīng)該解決什么問(wèn)題,給我們業(yè)務(wù)一個(gè)明確的發(fā)展方向。

當(dāng)然,以上這些,都是一個(gè)數(shù)據(jù)分析師的基礎(chǔ)技能。

無(wú)論是工具,還是理論,還是業(yè)務(wù)理解,最后都需要數(shù)據(jù)分析師們始于業(yè)務(wù),之后高于業(yè)務(wù),最后反哺業(yè)務(wù)。

當(dāng)然,由于我們的拆分和對(duì)比,都是比較“數(shù)學(xué)”的過(guò)程,我們最后還需要會(huì)講故事。將這些“數(shù)學(xué)過(guò)程“用業(yè)務(wù)的語(yǔ)言講述出來(lái),才算是一個(gè)“發(fā)現(xiàn)問(wèn)題-拆解問(wèn)題-實(shí)施策略-解決問(wèn)題”的閉環(huán)。

師兄認(rèn)為,數(shù)據(jù)分析師會(huì)有三個(gè)比較明確的階段:

第一:助力業(yè)務(wù)階段這個(gè)階段,就是俗稱的SQL Boy,表哥表姐。因?yàn)槲覀儧](méi)有很深的理解業(yè)務(wù),對(duì)業(yè)務(wù)判斷不清。我們所需要做的是支持業(yè)務(wù)同學(xué)或者更資深同學(xué)。

第二:指導(dǎo)業(yè)務(wù)階段這個(gè)階段,我們已經(jīng)較深入的了解了業(yè)務(wù),我們可以通過(guò)數(shù)據(jù)判斷出業(yè)務(wù)的狀態(tài),知道業(yè)務(wù)哪里有問(wèn)題,需要從哪個(gè)方向去進(jìn)行相關(guān)的優(yōu)化,以及優(yōu)化的步驟是什么,該如何進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果該如何評(píng)估。

第三:引領(lǐng)業(yè)務(wù)階段這個(gè)階段,就類似于業(yè)務(wù)的操盤手。我們不僅要非常了解業(yè)務(wù),我們也需要從眾多的業(yè)務(wù)發(fā)展方向中選擇更適合業(yè)務(wù)當(dāng)前狀態(tài)的方向。決策業(yè)務(wù)的未來(lái)道路。這個(gè)階段,就可以稱的上業(yè)務(wù)的專家了。

當(dāng)然,百米高樓平地起。我們還是要一點(diǎn)一滴的積累,不斷深耕業(yè)務(wù),學(xué)習(xí)工具和理論。最后量變引起質(zhì)變。不斷提高自己的能力,擴(kuò)大自己的影響力,成為一個(gè)優(yōu)秀的數(shù)據(jù)分析師。

 

責(zé)任編輯:姜華 來(lái)源: 數(shù)師兄
相關(guān)推薦

2021-03-26 07:37:34

數(shù)據(jù)分析工具技能

2017-11-27 16:37:42

Python大數(shù)據(jù)數(shù)據(jù)分析

2019-09-24 14:36:38

數(shù)據(jù)分析思維大數(shù)據(jù)

2020-07-20 07:00:00

數(shù)據(jù)分析師數(shù)據(jù)分析大數(shù)據(jù)

2021-08-05 23:24:44

大數(shù)據(jù)數(shù)據(jù)分析技能

2017-06-28 15:24:10

大數(shù)據(jù)數(shù)據(jù)分析心得

2024-06-06 09:08:14

NumPyPython數(shù)據(jù)分析

2016-10-24 11:24:22

電商數(shù)據(jù)

2020-10-14 06:28:38

數(shù)據(jù)倉(cāng)庫(kù)模型

2020-03-23 11:02:35

數(shù)據(jù)分析數(shù)據(jù)大數(shù)據(jù)

2013-05-21 10:06:11

數(shù)據(jù)庫(kù)查詢優(yōu)化

2019-06-10 15:58:30

數(shù)據(jù)分析流量采集

2019-02-20 17:55:45

數(shù)據(jù)分析師技能管理

2015-08-14 10:28:09

大數(shù)據(jù)

2017-01-07 11:42:16

2015-03-10 10:12:25

2013-06-24 10:31:38

2015-05-06 15:41:22

大數(shù)據(jù)服務(wù)HDFS云計(jì)算

2020-10-10 06:53:18

數(shù)據(jù)建模數(shù)據(jù)庫(kù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)