,html) fuload=re.findall(r'"fuload">(.*?)分钟<',html) alltotal=re.findall(r'"alltotal">(.*?)万<',html) capital=re.findall(r'"capital">(.*?)万<',html) date=time.strftime('%Y-%m-%d',time.localtime(time.time())) print('数据提取完成!') columns = ['采集日期','平台名称','成交额(万)','综合利率','投资人(人)','借钱周期(月)','借钱人(人)','满标速度(分 钟)','累计贷款余额(万)','净资金流入(万)'] table=pd.DataFrame({'采集日期':date, '平台名称':title, '成交额(万)':total, '综合利率':rate, '投资人(人)':pnum, '借钱周期(月)':cycle, '借钱人(人)':p1num, '满标速度(分钟)':fuload, '累计贷款余额(万)':alltotal, '净资金流入(万)':capital}, columns=columns) print('数据表创建完成!') table.to_csv('C:\\Users\\cliffwang\\Desktop\\wdty'+date+'.csv',index=False) print(date+'日数据导出完毕!') table.to_csv('wdty.csv',index=False,mode='a') print('累计数据追加导出完毕!') end = time.clock() print ("履行时光: %f s" % (end-start)) <pre> 自定义函数写好后,每次只须要履行loan_data()就可以完成之前的30+步调的工作了。下面是代码和输出的状况信息以及代码履行时光信息。
应用tableau进行可视化
导出的数据固然为csv格局,但应用excel进行可视化并不睬想,重要问题在于excel对图表行列数的限制(每张图最多只能容纳255个数
- </pre>
- loan_data()
-
- 页面抓取状况正常。
- 编码转换完成!
- 数据提取完成!
- 数据表创建完成!
- 2017-04-19日数据导出完毕!
- 累计数据追加导出完毕!
- 履行时光: 0.933262 s
推荐阅读
数据显示Java热度持续下落,日子屈指可数?
来自谷歌趋势的Java与JavaScript走势图
本年4月初,斯坦福大年夜学开端试履行计算机科学入门课CS 106A的新版本。这个名为CS 106J的新版本用JavaScript来教,而不是用Java来教。斯坦福大>>>详细阅读
本文标题:使用python和tableau对数据进行抓取及可视化
地址:http://www.17bianji.com/lsqh/35080.html
1/2 1