作家
登录

使用python和tableau对数据进行抓取及可视化

作者: 来源: 2017-05-08 16:52:57 阅读 我要评论

  • <pre>  
  • 中。代码与之前的新建csv文件类似,独一的差别是增长了mode参数,这个参数默认值是w,也就是新建。把值改为a就是追加导出。

    1. </pre> 
    2.  
    3. #在汗青csv文件中追加新信息 
    4.  
    5. table.to_csv('wdty.csv',index=False,mode='a'
    6.  
    7. <pre>  

    【编辑推荐】

    1. Python vs R : 在机械进修和数据分析范畴中的比较
    2. Uber开源数据可视化对象deck.gl获重大年夜进级
    3. 一文看懂数据可视化:大年夜编程对象到可视化表示方法
    4. Python分布式抓取和分析京东商城评价
    5. 像Excel一样应用python进行数据分析-(2)
    【义务编辑:枯木 TEL:(010)68476606】

    创建自定义函数

    以下是导出后的数据表截图。内容与前面创建的数据表内容一致。 

    大年夜导入所需的库文件,到提取数据拼接和导出,我们一共进行了30+步的操作。为了简化步调,我们把这些步调放在一个loan_data自

    定义函数中。今后每次只须要履行以下这个自定义函数就可以将数据抓取下来并导出到csv里了。下面是具体的代码,个中为了获得代

    码履行中的过程信息,我们在一些关键步调后应用print输出了一些状况信息。并计算了全部代码履行所消费的时光。

    1. </pre> 
    2. def loan_data(): 
    3. import os 
    4. import requests 
    5. import re 
    6. import pandas as pd 
    7. import time 
    8. start = time.clock() 
    9. headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 
    10. Safari/537.11', 
    11. 'Accept':'text/html;q=0.9,*/*;q=0.8'
    12. 'Accept-Charset':'ISO-8859-1,utf-8;q=0.7,*;q=0.3'
    13. 'Connection':'close'
    14. 'Referer':'https://www.bluewhale.cc/' 
    15. r=requests.get('http://www.p2peye.com/shuju/ptsj/',headers=headers) 
    16. status=r.status_code 
    17. if status == 200: 
    18. print('页面抓取状况正常。'
    19. else
    20. os._exit(0) 
    21. html=r.content 
    22. html=str(html, encoding = "GBK"
    23. print('编码转换完成!'
    24. title=re.findall(r'"return false".*?title="(.*?)"',html) 
    25. total=re.findall(r'"total">(.*?)万<',html) 
    26. rate=re.findall(r'"rate">(.*?)<',html) 
    27. pnum=re.findall(r'"pnum">(.*?)人<',html) 
    28. cycle=re.findall(r'"cycle">(.*?)月<',html) 
    29. p1num=re.findall(r'"p1num">(.*?)人<'

        推荐阅读

        数据显示Java热度持续下落,日子屈指可数?

      来自谷歌趋势的Java与JavaScript走势图 本年4月初,斯坦福大年夜学开端试履行计算机科学入门课CS 106A的新版本。这个名为CS 106J的新版本用JavaScript来教,而不是用Java来教。斯坦福大>>>详细阅读


      本文标题:使用python和tableau对数据进行抓取及可视化

      地址:http://www.17bianji.com/lsqh/35080.html

    关键词: 探索发现

    乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

    网友点评
    自媒体专栏

    评论

    热度

    精彩导读
    栏目ID=71的表不存在(操作类型=0)