决策树分类预测过程可视化

#决定计划树可视化 
 
dot_data = tree.export_graphviz(clf, out_file=None, 
 
feature_names=vec.get_feature_names(), 
 
class_names=clf.classes_, 
 
filled=True, rounded=True, 
 
special_characters=True) 
 
graph = graphviz.Source(dot_data) 
 
graph

决定计划树分类猜测过程可视化

开端前的预备工作

起首导入所需库文件，numpy，pandas用于数值处理，DictVectorizer用于特点处理，graphviz用于模许可视化。

#导入所需库文件 
 
import numpy as np 
 
import pandas as pd 
 
from sklearn.feature_extraction import DictVectorizer 
 
from sklearn import cross_validation 
 
from sklearn import tree 
 
import graphviz

导入所需的数据文件，用于练习和评估模型表示。

#导入数据表 
 
test=pd.DataFrame(pd.read_csv('TEST_ML_v2.csv',header=0,encoding='GBK'))

特点处理

第二步，对特点进行处理。

#特点处理 
 
X_df=test[['City', 'Item category', 'Period', 'Gender', 'Age', 'Market channels', 'Self-agent', 'Category', 'Loan channels']] 
 
X_list=X_df.to_dict(orient="records") 
 
vec = DictVectorizer() 
 
X=vec.fit_transform(X_list) 
 
Y=np.array(test['Status'])划分练习集和测试集数据。

划分练习集和测试集数据

X_train,X_test,y_train,y_test=cross_validation.train_test_split(X.toarray(),Y,test_size=0.4,random_state=0)

练习模型并进行猜测

使悠揭捉?练集数据对决定计划树范型进行练习，应用测试集数据评估模型表示。

#练习模型 
 
clf = tree.DecisionTreeClassifier(max_depth=5) 
 
clf=clf.fit(X_train,y_train) 
 
clf.score(X_test,y_test) 
 
0.85444078947368418

简单对测试集的第一组特点进行猜测，结不雅与实际值相符。

1/2 1 2 下一页尾页

　　推荐阅读

　　程序员之死：为何他被迫签下总价1300万的离婚协议

题图与本文内容无关一、法度榜样员的悲哀故事每部好莱坞爆片里都有一个酷炫明日炸天的法度榜样员，连上彀线就能神挡杀神黑破天际，把世界改成本身想要的样子。实际中的一位法度榜样员，We>>>详细阅读

本文标题：决策树分类预测过程可视化

地址：http://www.17bianji.com/lsqh/37301.html

1/2 1