作家
登录

使用python和tableau对数据进行抓取及可视化

作者: 来源: 2017-05-08 16:52:57 阅读 我要评论

,html) 
  • fuload=re.findall(r'"fuload">(.*?)分钟<',html) 
  • alltotal=re.findall(r'"alltotal">(.*?)万<',html) 
  • capital=re.findall(r'"capital">(.*?)万<',html) 
  • date=time.strftime('%Y-%m-%d',time.localtime(time.time())) 
  • print('数据提取完成!'
  • columns = ['采集日期','平台名称','成交额(万)','综合利率','投资人(人)','借钱周期(月)','借钱人(人)','满标速度(分 
  • 钟)','累计贷款余额(万)','净资金流入(万)'] 
  • table=pd.DataFrame({'采集日期':date
  • '平台名称':title, 
  • '成交额(万)':total, 
  • '综合利率':rate, 
  • '投资人(人)':pnum, 
  • '借钱周期(月)':cycle, 
  • '借钱人(人)':p1num, 
  • '满标速度(分钟)':fuload, 
  • '累计贷款余额(万)':alltotal, 
  • '净资金流入(万)':capital}, 
  • columns=columns) 
  • print('数据表创建完成!'
  • table.to_csv('C:\\Users\\cliffwang\\Desktop\\wdty'+date+'.csv',index=False
  • print(date+'日数据导出完毕!'
  • table.to_csv('wdty.csv',index=False,mode='a'
  • print('累计数据追加导出完毕!'
  • end = time.clock() 
  • print ("履行时光: %f s" % (end-start)) 
  • <pre>  
  • 自定义函数写好后,每次只须要履行loan_data()就可以完成之前的30+步调的工作了。下面是代码和输出的状况信息以及代码履行时光信息。

    应用tableau进行可视化

    导出的数据固然为csv格局,但应用excel进行可视化并不睬想,重要问题在于excel对图表行列数的限制(每张图最多只能容纳255个数

    1. </pre> 
    2. loan_data() 
    3.  
    4. 页面抓取状况正常。 
    5. 编码转换完成! 
    6. 数据提取完成! 
    7. 数据表创建完成! 
    8. 2017-04-19日数据导出完毕! 
    9. 累计数据追加导出完毕! 
    10. 履行时光: 0.933262 s 

        推荐阅读

        数据显示Java热度持续下落,日子屈指可数?

      来自谷歌趋势的Java与JavaScript走势图 本年4月初,斯坦福大年夜学开端试履行计算机科学入门课CS 106A的新版本。这个名为CS 106J的新版本用JavaScript来教,而不是用Java来教。斯坦福大>>>详细阅读


      本文标题:使用python和tableau对数据进行抓取及可视化

      地址:http://www.17bianji.com/lsqh/35080.html

    关键词: 探索发现

    乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

    网友点评
    自媒体专栏

    评论

    热度

    精彩导读
    栏目ID=71的表不存在(操作类型=0)