常見(jiàn)數(shù)據(jù)分析誤區(qū)有哪些?你犯了嗎?
做一份客觀的數(shù)據(jù)應(yīng)該規(guī)避的常見(jiàn)數(shù)據(jù)分析誤區(qū):
1、數(shù)據(jù)一定客觀
其實(shí)數(shù)據(jù)也會(huì)騙人,舉個(gè)例子,二戰(zhàn)時(shí)英軍發(fā)現(xiàn)從戰(zhàn)場(chǎng)飛回來(lái)的戰(zhàn)機(jī),機(jī)身上的彈孔比引擎和油箱上的要多得多,根據(jù)這個(gè)數(shù)據(jù)很容易得出要加強(qiáng)機(jī)身的防護(hù)的建議。但事實(shí)的真相是引擎和油箱上中彈的飛機(jī)已經(jīng)回不來(lái)了更應(yīng)加強(qiáng)引擎和油箱的防護(hù),這就是常說(shuō)的“幸存者偏差”。
數(shù)據(jù)可能被人為操縱。如店鋪的評(píng)論,如電影的評(píng)分,如某公司發(fā)布的關(guān)于其所在行業(yè)的分析報(bào)告都具有一定的主觀性?;阱e(cuò)誤的數(shù)據(jù)做出的分析結(jié)論是無(wú)益甚至是有害。在數(shù)據(jù)分析前先要考證數(shù)據(jù)的來(lái)源及可信度還要關(guān)注不符合常理的數(shù)據(jù)變化,對(duì)數(shù)據(jù)采集方法進(jìn)行調(diào)整。
2、過(guò)度依賴數(shù)據(jù)
對(duì)于業(yè)務(wù)決策來(lái)說(shuō)數(shù)據(jù)分析只是輔助手段,而不是核心推動(dòng)力。許多數(shù)據(jù)是無(wú)意義的,過(guò)度依賴數(shù)據(jù)于決策無(wú)益甚至?xí)龑?dǎo)上級(jí)做出錯(cuò)誤的決策。
在書(shū)籍《大數(shù)據(jù)時(shí)代》中,提到了這樣一種情況:瑪麗莎·邁爾在任谷歌高管期間,有時(shí)會(huì)要求員工測(cè)試41種藍(lán)色的陰影效果,哪種被人們使用最頻繁從而決定網(wǎng)頁(yè)工具欄的顏色。這是陷入“數(shù)據(jù)之上”的誤區(qū),這樣的數(shù)據(jù)是毫無(wú)意義,訪客能不能看出細(xì)微的差別不說(shuō),幾乎沒(méi)有人會(huì)因?yàn)殛幱靶Ч牟煌鴽Q定訪問(wèn)/不訪問(wèn)這一網(wǎng)頁(yè)。
一份靠譜的分析結(jié)論既來(lái)源于對(duì)關(guān)鍵數(shù)據(jù)的分析來(lái)源于經(jīng)驗(yàn)的積累,來(lái)源于分析師對(duì)業(yè)務(wù)的認(rèn)識(shí)。如果簡(jiǎn)單地把論證過(guò)程簡(jiǎn)單地簡(jiǎn)化為數(shù)據(jù)分析過(guò)程事實(shí)上是一種偷懶行為。
3、輕視業(yè)務(wù)
數(shù)據(jù)分析初學(xué)者極易犯的錯(cuò)誤,只懂技術(shù)不懂業(yè)務(wù)不能真正理解業(yè)務(wù)需求。很多新手認(rèn)為工作中只需要勤勤懇懇敲代碼就行,無(wú)數(shù)SQL boy/girl就這么誕生。好的分析師既懂技術(shù)又懂業(yè)務(wù)。因?yàn)榧夹g(shù)為業(yè)務(wù)服務(wù),公司衡量技術(shù)的價(jià)值不在于分析技術(shù)有多高超而是對(duì)業(yè)務(wù)有沒(méi)有貢獻(xiàn)。
數(shù)據(jù)分析師也要多去一線了解業(yè)務(wù)運(yùn)作,幫助解決業(yè)務(wù)運(yùn)營(yíng)中遇到的各種問(wèn)題。除了深入了解業(yè)務(wù),還需要積累豐富的數(shù)據(jù)分析模型庫(kù)以應(yīng)對(duì)各種業(yè)務(wù)場(chǎng)景,比如金字塔模型、KANO分析模型、RFM模型、購(gòu)物籃分析模型、四象限模型......這些經(jīng)典且廣泛應(yīng)用的模型。
4、忽略效率
數(shù)據(jù)分析是整個(gè)商業(yè)活動(dòng)的一環(huán),而商業(yè)是追求效率的。很多新人容易陷入追求完美算法的陷阱,放著簡(jiǎn)單的方案不用,非要花大量時(shí)間在鉆數(shù)據(jù)算法的牛角尖上,最后交出一份領(lǐng)導(dǎo)懶得看的長(zhǎng)文報(bào)告。對(duì)企業(yè)來(lái)說(shuō),這樣的工作態(tài)度并不可取。推動(dòng)分析結(jié)論落地是數(shù)據(jù)分析價(jià)值的體現(xiàn),數(shù)據(jù)分析師除了要用最具效率的算法,還需要拿出讓決策層和執(zhí)行層都信服的分析報(bào)告。
5、“套路式”分析
在數(shù)據(jù)分析學(xué)習(xí)時(shí)或許習(xí)慣了各種解題套路,但實(shí)操時(shí)其實(shí)并不存在通用的分析套路。不同的行業(yè)、不同的業(yè)務(wù),不同的階段,哪怕用的是同一種分析方法結(jié)論都應(yīng)有所區(qū)別。
對(duì)待每一次分析,應(yīng)該結(jié)合業(yè)務(wù)場(chǎng)景中思考,結(jié)論要有針對(duì)性,不能被套路束縛住,也不能簡(jiǎn)單依賴過(guò)往的類(lèi)似案例。大數(shù)據(jù)時(shí)代,企業(yè)的數(shù)據(jù)體量不斷擴(kuò)大,業(yè)務(wù)需求不斷變化數(shù)據(jù)分析的環(huán)境也不斷變化。要實(shí)時(shí)更新知識(shí)和工具庫(kù)也要警惕和避免踩中上面這些數(shù)據(jù)分析的誤區(qū)。