【干貨】怎樣用數據分析找對象
上篇
寫在前面
在工作中,經常利用多個數據指標對整體進行綜合評價,需要把多個數據壓縮成一個綜合指標,這就是多指標綜合評價方法。 耐心學完本期內容,足夠裝X一整年。
專業(yè)內容
專業(yè)術語的名稱能嚇死人,不用深究。
實際內容很簡單,一個案例你就可以完全掌握。
一個案例
富帥們看著美女數據,在進行激烈的討論...
那么,李富帥喜歡的“綜合起來最好的”類型,到底是哪個?
- 小龍女是最好的?雖然她最高,但是體重和胸圍都不是最優(yōu)的
- 趙敏頭發(fā)是最長的,但是其他數據也不是最好
要找出“綜合最好的”,需要把各項數據進行綜合評分,這樣就能幫李富帥找到心目中的女神!接下來看操作方法:
STEP1 無量綱處理
Q1 “量綱”是什么?就是數據的單位,例如厘米、公斤等等。
Q2 為什么要進行無量綱處理?我們對一個美女綜合評分不能直接相加,因為身高和胸圍單位不同,并且數據范圍相差太大,直接相加沒有任何意義,這是數據分析人員最常犯的錯誤之一。
Q3 具體怎么操作?(重點)統(tǒng)計標準化方法:z=(x-μ)/σ。其中x為某一項數據,μ為均值,σ為標準差。此種方法也叫Z標準化,比較常用。
小龍女的身高:x=1.7全部美女身高的均值:μ=1.635全部美女身高的標準差:σ=0.0363
那么小龍女身高的標準化z=(x-μ)/σ=(1.7-1.635)/0.0363=1.8
當然,實際計算不需要這么麻煩,下載模板填數據就ok啦~~~標準化的結果如下:
左側四列數據為Z標準分,右側數據為T標準分,T=50+100*Z,這樣做的目的只是為了調整數據的范圍,便于比較,因為看大一些的數字要直觀多啦,不然Z標準分的小數點看著眼花~~~
結論:
趙敏綜合評分最高~~~
趙敏是李富帥心目中的女神~~~~
但是,李富帥對結論卻不滿意
STEP2 權重確定
由于李富帥提出了進一步的要求,需要重新找出女神,接下來我們要做的,是確定身高、頭發(fā)長度、胸圍的權重,權重是幫我們找出女神的好方法。
下篇為你解答確定權重的方法,你可以了解到主觀賦權法和客觀賦權法是怎么回事。
下篇
李富帥為什么不滿意我們找的女神嗎?
確定各個指標的權重可以解決這個問題,那么問題來了,權重又是什么鬼?
權重是一個相對的概念,針對某一指標而言,某一指標的權重是指該指標在整體評價中的相對重要程度。
身高、胸圍、頭發(fā)長度這三個指標中間,李富帥可能會更喜歡高個大長腿,而對長頭發(fā)短頭發(fā)不甚在意。在上一期文章中,綜合評分=身高得分+胸圍得分+頭發(fā)得分,這也默認了三個指標的權重是一致的,而本期我們會增加權重的概念。
加權之后,計算綜合評分會變成這種樣子:綜合評分=身高得分*60%+胸圍得分*30%+頭發(fā)得分*10%(各個指標的權重之和必須等于1)
當然不是!常用的權重確定方法有兩類
- 主觀賦權法
- 客觀賦權法
主觀賦權法
主觀賦權法沒有統(tǒng)一的標準,簡單的說就是找一堆人過來憑感覺瞎猜,來,跟我一起念:ping gan jue xia cai~~~~,這里只介紹磚家調查法,簡便易行。
STEP1
找一堆磚家過來先坐著,李富帥找來了自己的基友們(為便于理解只選了3個磚家,實際應用時越多越好)
STEP2
讓每個磚家給出自己的權重,并計算均值(如果各位磚家給出的權重差異較大,不能直接求平均數,這種情況的處理方法感興趣的同學直接留言)
STEP3
數據分析其實也很簡單對吧?加權后的女神們得分結果如下
結論:
很明顯小龍女得分最高!
小龍女才是真正的女神!
what the fu....為何這么難纏,活該他找不到女神...
但是他的想法是對的,主觀賦權法的問題在于客觀性較差,如果李富帥的基友們審美有問題,那坑你沒商量!為了讓李富帥閉嘴,我們再試試客觀賦權法。
客觀賦權法
客觀賦權法是與主觀賦權法相對而言的,是根據指標的原始數據,通過數學或者統(tǒng)計方法處理后獲得權重,常見的有主成分分析、因子分析、相關、回歸等。
以上方法對智商有一點點要求,而且比較繁瑣,我們的宗旨是簡單易行接地氣,下面介紹標準差系數權數法。
前方高能預警!!!公式可以略過不看.....坦率的講,我壓根也不想看這些公式,我們只需要搞清楚思想,計算過程用軟件一步到位,不用擔心~~
標準差系數權重法是根據每個指標的變異程度大小來進行賦權,變異程度大的說明能夠更好的區(qū)分各個指標,應賦予更高的權重,反之賦予較小的權重。
大濕憋了3個小時,想把這部分內容寫的更簡單,但現在看起來還是有點難懂,有看不懂的歡迎在公眾號發(fā)消息提問。
STEP1
計算各指標均值
STEP2
計算各指標標準差
STEP3
計算各指標標準差系數,也叫離散系數,就是STEP2的結果除以STEP1的結果
STEP4
計算各指標權數
經過以上慘無人道的計算之后...身高權重=0.093075613胸圍權重=0.279571615頭發(fā)權重=0.627352772
結論:
趙敏綜合評分最高
趙敏是女神!
看到這個結果,李富帥徹底怒了!!!
大濕的解釋:
● 主觀賦權法是由人的主觀經驗或者感受得來● 客觀賦權法通過對原始數據的處理得來的,變異程度較大的指標有更高的權重,本例中由于美女之間頭發(fā)長度相差最大,所以頭發(fā)長度有最高的權重
大濕的回答:
● 如果各個指標間存在明顯的人為喜好、業(yè)務經驗上顯然某指標更重要等,用主觀賦權法更加合適、簡便。(偏向于業(yè)務的數據分析大多屬于此類)● 反之,各指標間不存在哪個更重要,或者評分不包含人為喜歡或者經驗上更重要,用客觀賦權。