按前提筛选(与,或,非)
1.数据预处理
这部分是数据的预处理,对清洗完的数据进行整顿以便后期的统计和分析工作。重要包含数据表的归并,排序,数值分列,数据分组及标记等工作。
数据表归并
起首是对不合的数据表进行归并,我们这里创建一个新的数据表df1,并将df和df1两个数据表进行归并。在Excel中没有直接完成数据表归并的功能,可以经由过程VLOOKUP函数分步实现。在python中可以经由过程merge函数一次性实现。下面建立df1数据表,用于和df数据表进行归并。
- #创建df1数据表
- df1=pd.DataFrame({"id":[1001,1002,1003,1004,1005,1006,1007,1008],
- "gender":['male','female','male','female','male','female','male','female'],
- "pay":['Y','N','Y','Y','N','Y','N','Y',],
- "m-point":[10,12,20,40,40,40,30,20]})
应用merge函数对两个数据表进行归并,归并的方法为inner,将两个数据表中共有的数据匹配到一路生成新的数据表。并定名为df_inner。
- #数据表匹配归并,inner模式
- df_inner=pd.merge(df,df1,how='inner')
应用“或”前提进行筛选,年纪大年夜于25岁或城市为beijing。筛选后有6条数据相符请求。
除了inner方法以外,归并的方法还有left,right和outer方法。这几种方法的差别在我其他的文┞仿中有具体的说阕和比较。
- #其他数据表匹配模式
- df_left=pd.merge(df,df1,how='left')
- df_right=pd.merge(df,df1,how='right')
- df_outer=pd.merge(df,df1,how='outer')
设置索引列
完成数据表的归并后,我们对df_inner数据表设置索引列,索引列的功能很多,可以进行数据提取,汇总,也可以进行数据筛选等。
设置索引的函数为set_index。
- #设置索引列
- df_inner.set_index('id')
排序(按索引,按数值)
Excel中可以经由过程数据目次下的排序按钮直接对数据表进行排序,比较简单。Python中须要应用ort_values函数和sort_index函数完成排序。
在python中,既可以按索引对数据表进行排序,也可以看制订列的数值进行排序。起首我们按age列顶用户的年纪对数据表进行排序。
应用的函数为sort_values。
- #应用“与”前提进行筛选
- df_inner.loc[(df_inner['age'] > 25) & (df_inner[
推荐阅读
日复一日的人像临摹演习使得画家可以或许仅凭几个关键特点画出完全的人脸。同样地,我们欲望机械可以或许经由过程低清图像有限的图像信息,揣摸出图像对应的高清细节,这就须要算法可以或>>>详细阅读
本文标题:像Excel一样使用python进行数据分析-(2)
地址:http://www.17bianji.com/lsqh/34976.html
1/2 1