(1)直方图
(2)数据视图
经由过程数据视图可以查看不合指标的不合区间对于结不雅的影响。
因为经由归一化计算的逻辑回归算法有如许的特点,模型系数越大年夜表示对于结不雅的影响越大年夜,系数符号为正号表示正相干,负号表示负相干。我们看一下正号系数里pm10和no2最大年夜。pm10和pm2只是颗粒尺寸大年夜小不合,是一个包含关系,这里不推敲。剩下的no2(二氧化氮)对于pm2.5的影响最大年夜。我们只要查阅一下相干文档,懂得下哪些身分会造成no2的大年夜量排放即可找出影响pm2.5的重要身分。
以no2为例,在112.33~113.9这个区间产生了7个目标列为0的目标,产生了9个目标列为1的目标。也就是说当no2为112.33~113.9区间的情况下,出现重度雾霾的气象的概率是异常大年夜的。熵和基尼系数是表示这个特点区间对于目标值的影响,数值袈浣大年夜影响越大年夜,这个是大年夜信息量层面的影响。
推荐阅读
本文简单介绍一下若何租赁并应用 Amazon EC2 P2 实例: p2.xlarge 搭载了一块12G 显存的 Tesla K80 显卡。上图中的价格是Linux操作体系上的价格,Windows上会稍贵一点,p2.xlarge 价格是 $>>>详细阅读
本文标题:机器学习PAI实践三:雾霾成因分析
地址:http://www.17bianji.com/lsqh/35349.html
1/2 1