- #决定计划树可视化
- dot_data = tree.export_graphviz(clf, out_file=None,
- feature_names=vec.get_feature_names(),
- class_names=clf.classes_,
- filled=True, rounded=True,
- special_characters=True)
- graph = graphviz.Source(dot_data)
- graph
开端前的预备工作
起首导入所需库文件,numpy,pandas用于数值处理,DictVectorizer用于特点处理,graphviz用于模许可视化。
- #导入所需库文件
- import numpy as np
- import pandas as pd
- from sklearn.feature_extraction import DictVectorizer
- from sklearn import cross_validation
- from sklearn import tree
- import graphviz
导入所需的数据文件,用于练习和评估模型表示。
- #导入数据表
- test=pd.DataFrame(pd.read_csv('TEST_ML_v2.csv',header=0,encoding='GBK'))
特点处理
第二步,对特点进行处理。
- #特点处理
- X_df=test[['City', 'Item category', 'Period', 'Gender', 'Age', 'Market channels', 'Self-agent', 'Category', 'Loan channels']]
- X_list=X_df.to_dict(orient="records")
- vec = DictVectorizer()
- X=vec.fit_transform(X_list)
- Y=np.array(test['Status'])划分练习集和测试集数据。
划分练习集和测试集数据
- X_train,X_test,y_train,y_test=cross_validation.train_test_split(X.toarray(),Y,test_size=0.4,random_state=0)
练习模型并进行猜测
使悠揭捉?练集数据对决定计划树范型进行练习,应用测试集数据评估模型表示。
- #练习模型
- clf = tree.DecisionTreeClassifier(max_depth=5)
- clf=clf.fit(X_train,y_train)
- clf.score(X_test,y_test)
- 0.85444078947368418
简单对测试集的第一组特点进行猜测,结不雅与实际值相符。
推荐阅读
题图与本文内容无关一、法度榜样员的悲哀故事每部好莱坞爆片里都有一个酷炫明日炸天的法度榜样员,连上彀线就能神挡杀神黑破天际,把世界改成本身想要的样子。实际中的一位法度榜样员,We>>>详细阅读
本文标题:决策树分类预测过程可视化
地址:http://www.17bianji.com/lsqh/37301.html
1/2 1