在“数据源”中选择“新建表”,可以把本地txt文件上传。
数据导入后查看:
经由过程直方图可以可视化的查看不合数据在不合区间下的分布。经由过程这组数据的可视化展示,我们可以懂得到每一个字段数据的分布情况,以PM2.5为例,数值区间出现最多的是11.74~15.61,一共出现了430次。
(2)数据预处理
经由过程类型转换把string型的数据转double。把pm2这一列作为目标列,数值跨越200的情况作为重度雾霾气象打标为1,低于200标为0,实现的SQL语句如下。
select time,hour,(case
推荐阅读
本文简单介绍一下若何租赁并应用 Amazon EC2 P2 实例: p2.xlarge 搭载了一块12G 显存的 Tesla K80 显卡。上图中的价格是Linux操作体系上的价格,Windows上会稍贵一点,p2.xlarge 价格是 $>>>详细阅读
本文标题:机器学习PAI实践三:雾霾成因分析
地址:http://www.17bianji.com/lsqh/35349.html
1/2 1