四種大數(shù)據(jù)分析方法與大家分享
本文主要講述數(shù)據(jù)挖掘分析領(lǐng)域中,最常用的四種數(shù)據(jù)分析方法:描述型分析、診斷型分析、預(yù)測型分析和指令型分析。
當(dāng)剛涉足數(shù)據(jù)挖掘分析領(lǐng)域的分析師被問及,數(shù)據(jù)挖掘分析人員最重要的能力是什么時(shí),他們給出了五花八門的答案。
其實(shí)我想告訴他們的是,數(shù)據(jù)挖掘分析領(lǐng)域最重要的能力是:能夠?qū)?shù)據(jù)轉(zhuǎn)化為非專業(yè)人士也能夠清楚理解的有意義的見解。
使用一些工具來幫助大家更好的理解數(shù)據(jù)分析在挖掘數(shù)據(jù)價(jià)值方面的重要性,是十分有必要的。其中的一個(gè)工具,叫做四維分析法。
簡單地來說,分析可被劃分為4種關(guān)鍵方法。
下面會(huì)詳細(xì)介紹這四種方法。
1. 描述型分析:發(fā)生了什么?
這是最常見的分析方法。在業(yè)務(wù)中,這種方法向數(shù)據(jù)分析師提供了重要指標(biāo)和業(yè)務(wù)的衡量方法。
例如,每月的營收和損失賬單。數(shù)據(jù)分析師可以通過這些賬單,獲取大量的客戶數(shù)據(jù)。了解客戶的地理信息,就是“描述型分析”方法之一。利用可視化工具,能夠有效的增強(qiáng)描述型分析所提供的信息。
如下圖中的“各產(chǎn)品銷售量統(tǒng)計(jì)表預(yù)警圖”,從圖中可以明確的看到哪些商品的銷售達(dá)到了銷售量預(yù)期。
2. 診斷型分析:為什么會(huì)發(fā)生?
描述性數(shù)據(jù)分析的下一步就是診斷型數(shù)據(jù)分析。通過評估描述型數(shù)據(jù),診斷分析工具能夠讓數(shù)據(jù)分析師深入地分析數(shù)據(jù),鉆取到數(shù)據(jù)的核心。
良好設(shè)計(jì)的BI dashboard能夠整合:按照時(shí)間序列進(jìn)行數(shù)據(jù)讀入、特征過濾和鉆取數(shù)據(jù)等功能,以便更好的分析數(shù)據(jù)。
如下圖中的“銷售控制臺(tái)”,從圖中可以分析出“區(qū)域銷售構(gòu)成”、“客戶分布情況”、“產(chǎn)品類別構(gòu)成”和“預(yù)算完成情況”等信息。
3. 預(yù)測型分析:可能發(fā)生什么?
預(yù)測型分析主要用于進(jìn)行預(yù)測。事件未來發(fā)生的可能性、預(yù)測一個(gè)可量化的值,或者是預(yù)估事情發(fā)生的時(shí)間點(diǎn),這些都可以通過預(yù)測模型來完成。
預(yù)測模型通常會(huì)使用各種可變數(shù)據(jù)來實(shí)現(xiàn)預(yù)測。數(shù)據(jù)成員的多樣化與預(yù)測結(jié)果密切相關(guān)。
在充滿不確定性的環(huán)境下,預(yù)測能夠幫助做出更好的決定。預(yù)測模型也是很多領(lǐng)域正在使用的重要方法。
如下圖中的“銷售額和銷售量”,可以分析出全面的銷售量和銷售額基本呈上升趨勢,借此可推斷明年的基本銷售趨勢。
4. 指令型分析:需要做什么?
數(shù)據(jù)價(jià)值和復(fù)雜度分析的下一步就是指令型分析。指令模型基于對“發(fā)生了什么”、“為什么會(huì)發(fā)生”和“可能發(fā)生什么”的分析,來幫助用戶決定應(yīng)該采取什么措施。通常情況下,指令型分析不是單獨(dú)使用的方法,而是前面的所有方法都完成之后,最后需要完成的分析方法。
例如,交通規(guī)劃分析考量了每條路線的距離、每條線路的行駛速度、以及目前的交通管制等方面因素,來幫助選擇最好的回家路線。
結(jié)論
最后需要說明,每一種分析方法都對業(yè)務(wù)分析具有很大的幫助,同時(shí)也應(yīng)用在數(shù)據(jù)分析的各個(gè)方面。