作家
登录

决策树分类预测过程可视化

作者: 来源: 2017-09-11 15:05:38 阅读 我要评论

  1. #决定计划树可视化 
  2.  
  3. dot_data = tree.export_graphviz(clf, out_file=None, 
  4.  
  5. feature_names=vec.get_feature_names(), 
  6.  
  7. class_names=clf.classes_, 
  8.  
  9. filled=True, rounded=True
  10.  
  11. special_characters=True
  12.  
  13. graph = graphviz.Source(dot_data) 
  14.  
  15. graph 

决定计划树分类猜测过程可视化

开端前的预备工作

起首导入所需库文件,numpy,pandas用于数值处理,DictVectorizer用于特点处理,graphviz用于模许可视化。

  1. #导入所需库文件 
  2.  
  3. import numpy as np 
  4.  
  5. import pandas as pd 
  6.  
  7. from sklearn.feature_extraction import DictVectorizer 
  8.  
  9. from sklearn import cross_validation 
  10.  
  11. from sklearn import tree 
  12.  
  13. import graphviz  

导入所需的数据文件,用于练习和评估模型表示。

  1. #导入数据表 
  2.  
  3. test=pd.DataFrame(pd.read_csv('TEST_ML_v2.csv',header=0,encoding='GBK'))  

特点处理

第二步,对特点进行处理。

  1. #特点处理 
  2.  
  3. X_df=test[['City''Item category''Period''Gender''Age''Market channels''Self-agent''Category''Loan channels']] 
  4.  
  5. X_list=X_df.to_dict(orient="records"
  6.  
  7. vec = DictVectorizer() 
  8.  
  9. X=vec.fit_transform(X_list) 
  10.  
  11. Y=np.array(test['Status'])划分练习集和测试集数据。  

划分练习集和测试集数据

  1. X_train,X_test,y_train,y_test=cross_validation.train_test_split(X.toarray(),Y,test_size=0.4,random_state=0) 

练习模型并进行猜测

使悠揭捉?练集数据对决定计划树范型进行练习,应用测试集数据评估模型表示。

  1. #练习模型 
  2.  
  3. clf = tree.DecisionTreeClassifier(max_depth=5) 
  4.  
  5. clf=clf.fit(X_train,y_train) 
  6.  
  7. clf.score(X_test,y_test) 
  8.  
  9. 0.85444078947368418  

简单对测试集的第一组特点进行猜测,结不雅与实际值相符。


  推荐阅读

  程序员之死:为何他被迫签下总价1300万的离婚协议

题图与本文内容无关一、法度榜样员的悲哀故事每部好莱坞爆片里都有一个酷炫明日炸天的法度榜样员,连上彀线就能神挡杀神黑破天际,把世界改成本身想要的样子。实际中的一位法度榜样员,We>>>详细阅读


本文标题:决策树分类预测过程可视化

地址:http://www.17bianji.com/lsqh/37301.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)