自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="nmxlq"></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

決策樹分類預(yù)測過程可視化

作者：王彥平 2017-09-11 13:33:44

大數(shù)據(jù) 數(shù)據(jù)可視化

首先導(dǎo)入所需庫文件，numpy，pandas用于數(shù)值處理，DictVectorizer用于特征處理，graphviz用于模型可視化。導(dǎo)入所需的數(shù)據(jù)文件，用于訓(xùn)練和評估模型表現(xiàn)。

開始前的準(zhǔn)備工作

首先導(dǎo)入所需庫文件，numpy，pandas用于數(shù)值處理，DictVectorizer用于特征處理，graphviz用于模型可視化。

#導(dǎo)入所需庫文件 
 
import numpy as np 
 
import pandas as pd 
 
from sklearn.feature_extraction import DictVectorizer 
 
from sklearn import cross_validation 
 
from sklearn import tree 
 
import graphviz

導(dǎo)入所需的數(shù)據(jù)文件，用于訓(xùn)練和評估模型表現(xiàn)。

#導(dǎo)入數(shù)據(jù)表 
 
test=pd.DataFrame(pd.read_csv('TEST_ML_v2.csv',header=0,encoding='GBK'))

特征處理

第二步，對特征進(jìn)行處理。

#特征處理 
 
X_df=test[['City', 'Item category', 'Period', 'Gender', 'Age', 'Market channels', 'Self-agent', 'Category', 'Loan channels']] 
 
X_list=X_df.to_dict(orient="records") 
 
vec = DictVectorizer() 
 
X=vec.fit_transform(X_list) 
 
Y=np.array(test['Status'])劃分訓(xùn)練集和測試集數(shù)據(jù)。

劃分訓(xùn)練集和測試集數(shù)據(jù)

X_train,X_test,y_train,y_test=cross_validation.train_test_split(X.toarray(),Y,test_size=0.4,random_state=0)

訓(xùn)練模型并進(jìn)行預(yù)測

使用訓(xùn)練集數(shù)據(jù)對決策樹模型進(jìn)行訓(xùn)練，使用測試集數(shù)據(jù)評估模型表現(xiàn)。

#訓(xùn)練模型 
 
clf = tree.DecisionTreeClassifier(max_depth=5) 
 
clf=clf.fit(X_train,y_train) 
 
clf.score(X_test,y_test) 
 
0.85444078947368418

簡單對測試集的***組特征進(jìn)行預(yù)測，結(jié)果與實際值相符。

#對測試集數(shù)據(jù)進(jìn)行預(yù)測 
 
clf.predict(X_test[0]),y_test[0] 
 
(array(['Charged Off'], dtype=object), 'Charged Off')

查看具體的分類概率值。

#查看分類概率 
 
clf.predict_proba(X_test[0]) 
 
array([[ 1., 0.]])

決策樹分類預(yù)測可視化

第三步，對決策樹的分類預(yù)測過程進(jìn)行可視化，首先查看分類結(jié)果及特征的名稱。

#獲取分類名稱 
 
clf.classes_ 
 
array(['Charged Off', 'Fully Paid'], dtype=object)

對決策樹進(jìn)行可視化，feature_names為特征名稱，class_names為分類結(jié)果名稱。

#決策樹可視化 
 
dot_data = tree.export_graphviz(clf, out_file=None, 
 
feature_names=vec.get_feature_names(), 
 
class_names=clf.classes_, 
 
filled=True, rounded=True, 
 
special_characters=True) 
 
graph = graphviz.Source(dot_data) 
 
graph

將分類結(jié)果保存為PDF格式文檔。

#導(dǎo)出PDF文檔  
graph.render("test_e1")

責(zé)任編輯：龐桂玉來源： 36大數(shù)據(jù)

大數(shù)據(jù)數(shù)據(jù)可視化決策樹

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<legend id="mqctn"><track id="mqctn"></track></legend>

^{<blockquote id="mqctn"></blockquote>}

<legend id="mqctn"><track id="mqctn"></track></legend>

<sub id="mqctn"></sub><cite id="mqctn"><track id="mqctn"></track></cite>

<s id="mqctn"><li id="mqctn"></li></s>