SQL SERVER數(shù)據(jù)挖掘之如何實(shí)現(xiàn)Web路徑流挖掘
繼上一篇我們介紹了:SQL SERVER數(shù)據(jù)挖掘之理解聚類算法和順序聚類算法,這一篇我們介紹SQL SERVER數(shù)據(jù)挖掘的***一部分內(nèi)容,就是如何實(shí)現(xiàn)Web路徑流挖掘。我們接下來就通過一個(gè)實(shí)例來分析這一過程。
Web路徑流是讓我們發(fā)現(xiàn)用戶使用網(wǎng)站的習(xí)慣的一種表示方式,例如我們想知道用戶是先到什么頁面,然后再到什么頁面,由此我們可以給用戶分組,并且根據(jù)他們的習(xí)慣定制更好的頁面導(dǎo)航設(shè)計(jì)。
按照數(shù)據(jù)挖掘的基本流程,我們一步一步來做:
1.定義問題:通過分析得到不同用戶群使用網(wǎng)站的路徑及其規(guī)律
2.準(zhǔn)備數(shù)據(jù):
為此,我們準(zhǔn)備兩個(gè)表格,分別保存客戶信息(如下)
以及客戶點(diǎn)擊頁面的記錄表(這里作為演示,我只填寫了一些范例數(shù)據(jù))
3.建立模型:
準(zhǔn)備數(shù)據(jù)源和數(shù)據(jù)源視圖
創(chuàng)建挖掘模型。這個(gè)業(yè)務(wù)場(chǎng)景,我們適合用“順序分析和聚類分析”
點(diǎn)擊“Finish”之后,檢查模型的設(shè)計(jì)
4.部署和處理
【備注】因?yàn)閿?shù)據(jù)不多,所以看到的結(jié)果比較簡(jiǎn)單。有興趣的朋友可以實(shí)際準(zhǔn)備一些數(shù)據(jù)進(jìn)行分析。
關(guān)于SQL SERVER數(shù)據(jù)挖掘的問題我們就介紹到這里了,希望通過這幾次的介紹,能讓您有所收獲,因?yàn)槟氖斋@就是對(duì)我們工作***的肯定,謝謝!
【編輯推薦】