自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

【干貨】怎樣用數據分析找對象

大數據 數據分析
在工作中,經常利用多個數據指標對整體進行綜合評價,需要把多個數據壓縮成一個綜合指標,這就是多指標綜合評價方法。 專業(yè)術語的名稱能嚇死人,不用深究。實際內容很簡單,一個案例你就可以完全掌握。

??

上篇

寫在前面

在工作中,經常利用多個數據指標對整體進行綜合評價,需要把多個數據壓縮成一個綜合指標,這就是多指標綜合評價方法。 耐心學完本期內容,足夠裝X一整年。 

專業(yè)內容

專業(yè)術語的名稱能嚇死人,不用深究。 

 

實際內容很簡單,一個案例你就可以完全掌握。

 

 

?

 

 


一個案例

富帥們看著美女數據,在進行激烈的討論... 

??  

 

那么,李富帥喜歡的“綜合起來最好的”類型,到底是哪個?  

  • 小龍女是最好的?雖然她最高,但是體重和胸圍都不是最優(yōu)的
  • 趙敏頭發(fā)是最長的,但是其他數據也不是最好

要找出“綜合最好的”,需要把各項數據進行綜合評分,這樣就能幫李富帥找到心目中的女神!接下來看操作方法:

STEP1 無量綱處理

Q1 “量綱”是什么?就是數據的單位,例如厘米、公斤等等。

Q2 為什么要進行無量綱處理?我們對一個美女綜合評分不能直接相加,因為身高和胸圍單位不同,并且數據范圍相差太大,直接相加沒有任何意義,這是數據分析人員最常犯的錯誤之一。

Q3 具體怎么操作?(重點)統(tǒng)計標準化方法:z=(x-μ)/σ。其中x為某一項數據,μ為均值,σ為標準差。此種方法也叫Z標準化,比較常用。

?[[179533]]?

 

小龍女的身高:x=1.7全部美女身高的均值:μ=1.635全部美女身高的標準差:σ=0.0363 

那么小龍女身高的標準化z=(x-μ)/σ=(1.7-1.635)/0.0363=1.8

當然,實際計算不需要這么麻煩,下載模板填數據就ok啦~~~標準化的結果如下:

??

 

左側四列數據為Z標準分,右側數據為T標準分,T=50+100*Z,這樣做的目的只是為了調整數據的范圍,便于比較,因為看大一些的數字要直觀多啦,不然Z標準分的小數點看著眼花~~~ 

 

結論:

趙敏綜合評分最高~~~

趙敏是李富帥心目中的女神~~~~

但是,李富帥對結論卻不滿意

 

STEP2 權重確定 

由于李富帥提出了進一步的要求,需要重新找出女神,接下來我們要做的,是確定身高、頭發(fā)長度、胸圍的權重,權重是幫我們找出女神的好方法。 

下篇為你解答確定權重的方法,你可以了解到主觀賦權法和客觀賦權法是怎么回事。

下篇

李富帥為什么不滿意我們找的女神嗎?

 

確定各個指標的權重可以解決這個問題,那么問題來了,權重又是什么鬼? 

權重是一個相對的概念,針對某一指標而言,某一指標的權重是指該指標在整體評價中的相對重要程度。

身高、胸圍、頭發(fā)長度這三個指標中間,李富帥可能會更喜歡高個大長腿,而對長頭發(fā)短頭發(fā)不甚在意。在上一期文章中,綜合評分=身高得分+胸圍得分+頭發(fā)得分,這也默認了三個指標的權重是一致的,而本期我們會增加權重的概念。

加權之后,計算綜合評分會變成這種樣子:綜合評分=身高得分*60%+胸圍得分*30%+頭發(fā)得分*10%(各個指標的權重之和必須等于1) 

?[[179534]]?

當然不是!常用的權重確定方法有兩類 

  • 主觀賦權法
  • 客觀賦權法

主觀賦權法

主觀賦權法沒有統(tǒng)一的標準,簡單的說就是找一堆人過來憑感覺瞎猜,來,跟我一起念:ping gan jue xia cai~~~~,這里只介紹磚家調查法,簡便易行。 

STEP1

找一堆磚家過來先坐著,李富帥找來了自己的基友們(為便于理解只選了3個磚家,實際應用時越多越好)   

STEP2

讓每個磚家給出自己的權重,并計算均值(如果各位磚家給出的權重差異較大,不能直接求平均數,這種情況的處理方法感興趣的同學直接留言)  

?

STEP3

數據分析其實也很簡單對吧?加權后的女神們得分結果如下

??

結論: 

很明顯小龍女得分最高!

小龍女才是真正的女神!

 

??

 

what the fu....為何這么難纏,活該他找不到女神...  

但是他的想法是對的,主觀賦權法的問題在于客觀性較差,如果李富帥的基友們審美有問題,那坑你沒商量!為了讓李富帥閉嘴,我們再試試客觀賦權法。

客觀賦權法

客觀賦權法是與主觀賦權法相對而言的,是根據指標的原始數據,通過數學或者統(tǒng)計方法處理后獲得權重,常見的有主成分分析、因子分析、相關、回歸等。 

以上方法對智商有一點點要求,而且比較繁瑣,我們的宗旨是簡單易行接地氣,下面介紹標準差系數權數法。

前方高能預警!!!公式可以略過不看.....坦率的講,我壓根也不想看這些公式,我們只需要搞清楚思想,計算過程用軟件一步到位,不用擔心~~

標準差系數權重法是根據每個指標的變異程度大小來進行賦權,變異程度大的說明能夠更好的區(qū)分各個指標,應賦予更高的權重,反之賦予較小的權重。

大濕憋了3個小時,想把這部分內容寫的更簡單,但現在看起來還是有點難懂,有看不懂的歡迎在公眾號發(fā)消息提問。

STEP1

計算各指標均值 

?

STEP2

計算各指標標準差 

?

STEP3

計算各指標標準差系數,也叫離散系數,就是STEP2的結果除以STEP1的結果 

?

STEP4

計算各指標權數

??

 

經過以上慘無人道的計算之后...身高權重=0.093075613胸圍權重=0.279571615頭發(fā)權重=0.627352772 

??

 

結論: 

趙敏綜合評分最高

趙敏是女神!

看到這個結果,李富帥徹底怒了!!! 

??

 

大濕的解釋: 

● 主觀賦權法是由人的主觀經驗或者感受得來● 客觀賦權法通過對原始數據的處理得來的,變異程度較大的指標有更高的權重,本例中由于美女之間頭發(fā)長度相差最大,所以頭發(fā)長度有最高的權重

?[[179539]]

大濕的回答: 

● 如果各個指標間存在明顯的人為喜好、業(yè)務經驗上顯然某指標更重要等,用主觀賦權法更加合適、簡便。(偏向于業(yè)務的數據分析大多屬于此類)● 反之,各指標間不存在哪個更重要,或者評分不包含人為喜歡或者經驗上更重要,用客觀賦權。

?[[179540]]?

 

 

責任編輯:龐桂玉 來源: 大數據
相關推薦

2019-12-26 12:47:10

BashLinux命令

2015-08-27 10:02:59

2019-11-20 12:30:21

Python編程語言語音識別

2018-04-11 09:30:16

Linux硬盤分區(qū)parted

2019-11-08 15:10:59

BashBash編程Linux

2014-03-06 14:39:58

2017-08-03 15:20:19

大數據數據分析

2020-05-15 15:09:51

R語言數據分析

2013-02-26 10:05:16

vmwareAWSOpenStack

2009-12-02 16:08:51

linux系統(tǒng)

2013-04-08 10:54:51

Javascript

2009-06-01 09:34:22

2011-01-21 13:41:09

Sendmail

2015-11-20 10:38:58

數據分析

2011-07-25 14:08:49

ODP.NETOracle實體數據模型

2017-05-02 17:22:05

數據

2010-04-16 10:38:49

CPU消耗

2009-11-26 17:03:24

Open Suse打印

2015-08-19 13:50:19

數據分析

2010-08-26 10:42:29

ADSL ModemDHCP服務器
點贊
收藏

51CTO技術棧公眾號