小白學(xué)數(shù)據(jù)分析之K-means理論篇
聚類分析是一類廣泛被應(yīng)用的分析方法,其算法眾多,目前像SAS、Splus、SPSS、SPSS Modeler等分析工具均以支持聚類分析,但是如何使用,尤其在網(wǎng)游數(shù)據(jù)分析方面,作用還是很大的,尤其是我們對(duì)于某些客群的分析時(shí),排除人為的分組的干擾,客觀和全面的展現(xiàn)客群的特征是一件很重要的事。
網(wǎng)游玩家的消費(fèi)特征、游戲行為特征(副本、任務(wù)、交互)、不同生命周期的玩家特征(新登玩家、留存玩家、流失玩家、回流玩家)等等,應(yīng)用很廣泛,然而我們發(fā)現(xiàn)有時(shí)候我們的劃分是帶有主觀色彩的。比如明確分組變量、確定分組標(biāo)準(zhǔn)等等。這些特征的提取和指定往往需要很多的行業(yè)經(jīng)驗(yàn)和大量嘗試,而我們只希望分組時(shí)兼顧更多的因素和客觀事實(shí),減少人工標(biāo)準(zhǔn)的干預(yù)。
因此,聚類分析的出現(xiàn)就是解決這個(gè)問(wèn)題的,今天把以前的學(xué)習(xí)筆記內(nèi)容拿出來(lái)曬曬,說(shuō)說(shuō)K-Means吧,后續(xù)再說(shuō)說(shuō)其他的算法,最后集中的說(shuō)說(shuō)做的案例。
源文件下載:http://www.dmacn.com/viewthread.php?tid=76&extra=
原文鏈接:http://www.cnblogs.com/yuyang-DataAnalysis/archive/2012/06/13/2548080.html