小白學(xué)數(shù)據(jù)分析:留存率是什么?(番外篇)
留存率這個(gè)數(shù)據(jù)指標(biāo)不記得從何時(shí)起變得那么重要,重要到研發(fā)上把它作為游戲好壞的一個(gè)標(biāo)準(zhǔn),運(yùn)營商(平臺(tái))作為了一個(gè)準(zhǔn)入的鑰匙,是否值得繼續(xù)下去。有時(shí)候覺得粗暴,甚至無知了有點(diǎn)。因?yàn)槟w淺的百分比背后隱藏著更多的金子,也可能是垃圾。
以上算是一點(diǎn)吐槽,更多潛在的問題這里不想累述,前幾日寫過一個(gè)關(guān)于的留存率是什么的文章,我想肯定很多人看過了,估計(jì)也都會(huì)用了,今天寫的番外篇將從這個(gè)數(shù)據(jù)的統(tǒng)計(jì)源頭說起,換個(gè)角度來看待這個(gè)留存率的問題。
留存率VS百分比
百分比是用于表達(dá)比例的,類似于一種標(biāo)準(zhǔn)化的表達(dá),因?yàn)榘俜直鹊姆帜甘?00,換個(gè)較多想想這種表達(dá)消除了數(shù)量級上的差異,使不同數(shù)量級之間的數(shù)據(jù)可以進(jìn)行比較,比如:
這里我們看到盡管上周和本周的收入數(shù)據(jù)相差了一個(gè)數(shù)據(jù)量級,但是在百分比上的表現(xiàn)只是差了10個(gè)百分點(diǎn),能夠更好的進(jìn)行量化數(shù)據(jù),這個(gè)意義上,是非常有用的,然而這里如果只是對比本周的強(qiáng)化收入環(huán)比上周少了10個(gè)百分點(diǎn)就斷言本周的強(qiáng)化道具賣的不好,那我們就錯(cuò)了。
那么下面我們再來審視這張圖:
這張圖我們發(fā)現(xiàn)的規(guī)律其實(shí)和上一張是一致的,如果我們只是在單純的考察留存率,遇到的分析麻煩就是錯(cuò)誤的相信了百分比,但是這里不能忽略百分比的作用。因此考察留存不是單純的就在看留存率,你還要看到DAU,其后的留存,DNU規(guī)模等等信息。之所以要跟這個(gè)百分比較勁的原因其實(shí)很簡單,你不能看到今天的DAU比昨天的DAU多了一倍,就說今天的DAU好于昨日,玩家更加積極(探尋有價(jià)值的DAU)。
留存率VS漏斗
大概我們現(xiàn)在在做留存分析都會(huì)用漏斗模型,因?yàn)橐慌脩暨M(jìn)入游戲后,隨著時(shí)間上是不斷遞減的,從玩家的游戲生命進(jìn)程的確是這樣的,然而這里面卻存在了一個(gè)問題,這個(gè)漏斗不一定是個(gè)嚴(yán)格意義的漏斗。再來看上面的那張圖,你會(huì)發(fā)現(xiàn)2日的留存率高于次日飛留存率,這里這種情況是存在的,實(shí)際的數(shù)據(jù)中也是存在的,至于原因后面會(huì)具體的來講述。
留存率VS目的
我覺得用到留存率的目的是探尋一批用戶的導(dǎo)入質(zhì)量情況(包括游戲前期的成長等),或者是市場、渠道的質(zhì)量研究,進(jìn)而方便我們后期的調(diào)整投放策略,游戲改進(jìn)方案。大概因此我們建立了留存率,作為一種轉(zhuǎn)化率機(jī)制,來確定和為我們之前的目的服務(wù)。留存率是研究固定群體的轉(zhuǎn)化情況,換句話我們是希望看到這個(gè)群體自然的變化情況,由于存在統(tǒng)計(jì)上時(shí)間滯后性,往往不小心就會(huì)帶來錯(cuò)誤。比如8月1日的次日留存在8月2日統(tǒng)計(jì)出來,3日留存在8月4日統(tǒng)計(jì)出來,7日留存在8月8日統(tǒng)計(jì)出來,但是如果我們夠認(rèn)真就會(huì)出現(xiàn)以下飛烏龍,比如8月2日統(tǒng)計(jì)的8月1日留存會(huì)錯(cuò)誤的認(rèn)為是8月2日的次日留存率。出現(xiàn)這個(gè)問題的原因就是統(tǒng)計(jì)日展現(xiàn)的數(shù)據(jù)不是統(tǒng)計(jì)日的,這點(diǎn)很多人在使用一些系統(tǒng)都會(huì)出現(xiàn)這樣的問題。
其實(shí)費(fèi)了不少話,最終要說的就是在下面這張圖上:
此圖中,我們列出來了每日新登玩家的次日、3日、7日的留存率,我們會(huì)發(fā)現(xiàn)每個(gè)固定的群體(每日新登作為一個(gè)獨(dú)立的群體)次日、3日、7日的留存表現(xiàn)趨勢基本上是相同的,也就是說,留存率的指標(biāo)能夠揭示一個(gè)群體在一段時(shí)間內(nèi)的變化特征,且這種特征不會(huì)因?yàn)闀r(shí)間的變化而發(fā)生顯著性改變。比如第37日的新登用戶的次日、3日、7日留存表現(xiàn)都是保持一個(gè)趨勢,這從某個(gè)角度來說,新玩家的期待或者特征我們游戲給予了最好的反饋,而這樣的期待或者特征就是我們留存率使用起來的價(jià)值。(此處另外一種方式可以計(jì)算相鄰兩日留存率變化百分比,繪制曲線去分析這種趨勢變化)
后記:
有關(guān)于留存的分析,留存率只是整體留存分析的很少一部分,真正挖掘留存的價(jià)值其實(shí)還要做很多工作,留存分析也不只是新用戶的專利,比如充值用戶的留存,這里沒辦法展開說。而一些留存率分析方法其實(shí)很多,這取決于我們分析的維度和角度,也許有時(shí)候你可以嘗試一下做一個(gè)顯著性分析,看看兩個(gè)服務(wù)器的一段時(shí)間的留存變化是否顯著,也許你也可以針對同時(shí)間的兩個(gè)服務(wù)器的用戶做分析,或者是不同渠道或者市場的用戶分析,維度方式很多了,關(guān)鍵在于是否愿意去做。
其次,我一段時(shí)間以來一直使用幾何平均數(shù)去處理這種“率”的概念,因?yàn)槲覀兛傄?jì)算平均留存率,但是算數(shù)平均數(shù)不能屏蔽極端值的干擾,所以幾何平均數(shù)是個(gè)很好的辦法。
最后剛才提到一個(gè)關(guān)于漏斗的問題,這里我想把我的理解說一些,漏斗是作為一種分析轉(zhuǎn)化率的形象化描述,但是在狹義的漏斗分析觀念上(比如網(wǎng)站分析),我們的漏斗分析是針對一個(gè)session(一個(gè)會(huì)話期間)進(jìn)行的轉(zhuǎn)化率分析。然而我們這里的漏斗分析其實(shí)是一種廣義上的轉(zhuǎn)化率漏斗分析模式,即新登用戶在次日登錄了,那么在2日,3日,4日都可以登錄,這里面不存在會(huì)話的,而狹義的漏斗是一個(gè)不斷篩選的過程。因此這里的留存率是存在我們看到的3日大于次日的情況(這點(diǎn)在最后一部分中已經(jīng)做了解釋和說明)
原文鏈接:http://www.cnblogs.com/yuyang-DataAnalysis/archive/2012/09/10/2678958.html
【編輯推薦】
- 小白學(xué)數(shù)據(jù)分析:怎么做流失分析
- 小白學(xué)數(shù)據(jù)分析之K-means理論篇
- 小白學(xué)數(shù)據(jù)分析之從購買記錄分析道具支付環(huán)節(jié)
- 小白學(xué)數(shù)據(jù)分析之付費(fèi)滲透率
- 小白學(xué)數(shù)據(jù)分析之Excel制作INFOGRAPHIC