自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

用KNIME建立客戶流失模型

大數(shù)據(jù)
PMML是一種可以呈現(xiàn)預(yù)測分析模型的事實標(biāo)準(zhǔn)語言,用于呈現(xiàn)數(shù)據(jù)挖掘模型。預(yù)測分析模型采用定型過程中獲取的知識來預(yù)測新數(shù)據(jù)中是否有已知模式。

[[179511]]

PMML是一種可以呈現(xiàn)預(yù)測分析模型的事實標(biāo)準(zhǔn)語言,用于呈現(xiàn)數(shù)據(jù)挖掘模型。預(yù)測分析模型采用定型過程中獲取的知識來預(yù)測新數(shù)據(jù)中是否有已知模式。PMML允許您在不同的應(yīng)用程序之間輕松共享預(yù)測分析模型。因此,您可以在一個系統(tǒng)中定型一個模型,PMML中對其進(jìn)行表達(dá),然后將其移動到另一個系統(tǒng)中,并在該系統(tǒng)中使用上述模型預(yù)測機(jī)器失效的可能性等。

今天我們運(yùn)用決策樹算法訓(xùn)練一個客戶流失模型,進(jìn)行“客戶流失”的預(yù)測分析。

結(jié)點概覽

讀取數(shù)據(jù)。這里讀取兩個數(shù)據(jù)文件,一個是通話數(shù)據(jù)和合約數(shù)據(jù)。接著講兩個數(shù)據(jù)以“電話號(PHONE NUMBER)”為關(guān)鍵字連接。

文件中有兩列數(shù)據(jù),分別是“地區(qū)編號(AREA CODE)”和“流失情況(CHURN)”,我們不想將這兩列作為數(shù)值型數(shù)據(jù)處理,這里我們將其更改為字符型數(shù)據(jù)。

將流失與否(這里為布爾值)用顏色標(biāo)注出來,設(shè)置數(shù)據(jù)為0時標(biāo)藍(lán)色,數(shù)據(jù)為1時標(biāo)紅色。

接著把數(shù)據(jù)分成80%的訓(xùn)練集和20%的測試集。

至此完成數(shù)據(jù)預(yù)處理工作。

使用決策樹,依照不同的指標(biāo),對流失和存活客戶數(shù)進(jìn)行分類。

首先使用日租費(fèi)day charge將所有數(shù)據(jù)分為兩組,對于day charge =< 44.96的值再依據(jù)撥打客服電話數(shù),劃分成兩組。以此類推,直至葉節(jié)點擁有最小不純度值。

然后將決策樹所得模型記錄為PMML語句,方便下次調(diào)用。

 

刪除屬于多數(shù)類的隨機(jī)行(如在這里流失客戶為少數(shù)項,存活客戶為多數(shù)),則我們隨機(jī)刪除一些多數(shù)項,使流失客戶和存活客戶數(shù)據(jù)量相同。接著輸入測試集和已得決策樹模型,應(yīng)用決策樹算法對之前分出的80%測試數(shù)據(jù)進(jìn)行預(yù)測。

通過ROC曲線可以看出,這個模型的預(yù)測準(zhǔn)確度高達(dá)89.89%,是一個比較理想的模型。 

責(zé)任編輯:武曉燕 來源: 36大數(shù)據(jù)
相關(guān)推薦

2020-10-15 15:01:54

Python 開發(fā)編程語言

2020-09-15 14:05:21

Python代碼預(yù)測模型

2016-12-07 09:27:11

KNIME大數(shù)據(jù)網(wǎng)絡(luò)

2016-12-07 14:23:48

KNIME數(shù)據(jù)分析情感分析

2022-08-01 11:50:47

PySpark流失預(yù)測模型

2020-10-13 18:27:24

客戶流失客戶

2010-06-17 13:32:39

UML用例模型

2012-12-05 07:50:37

云服務(wù)云戰(zhàn)略

2016-01-05 10:14:33

2020-11-30 23:54:07

網(wǎng)絡(luò)可見性客戶流失IT團(tuán)隊

2022-07-04 09:44:14

數(shù)據(jù)泄露網(wǎng)絡(luò)安全網(wǎng)絡(luò)攻擊

2024-07-31 11:48:07

2020-12-23 13:13:17

機(jī)器學(xué)習(xí)客戶流失客戶

2022-07-03 21:00:58

VoIP 系統(tǒng)人工智能

2016-12-07 14:56:51

KNIME數(shù)據(jù)分析

2011-03-03 14:04:08

ProftpdFtp server

2024-06-13 08:36:11

2009-12-18 14:37:56

ADO.NET模型

2009-12-08 16:47:06

WCF IP

2021-05-06 06:28:54

運(yùn)營商中國移動中國電信
點贊
收藏

51CTO技術(shù)棧公眾號