作家
登录

使用python和tableau对数据进行抓取及可视化

作者: 来源: 2017-05-08 16:52:57 阅读 我要评论

  •  
  • 607 
  •  
  • <pre>  
  • 按照提取平台名称title的办法,后面我们依次提取了贷款利率,贷款金额,满标时光等关键信息。下面是具体的代码。

    1. </pre> 
    2.  
    3. #应用正则提取total字段信息 
    4.  
    5. total=re.findall(r'"total">(.*?)万<',html) 
    6.  
    7. #应用正则提取rate字段信息 
    8.  
    9. rate=re.findall(r'"rate">(.*?)<',html) 
    10.  
    11. #应用正则提取pnum字段信息 
    12.  
    13. pnum=re.findall(r'"pnum">(.*?)人<',html) 
    14.  
    15. #应用正则提取cycle字段信息 
    16.  
    17. cycle=re.findall(r'"cycle">(.*?)月<',html) 
    18.  
    19. #应用正则提取plnum字段信息 
    20.  
    21. p1num=re.findall(r'"p1num">(.*?)人<',html) 
    22.  
    23. #应用正则提取fuload字段信息 
    24.  
    25. fuload=re.findall(r'"fuload">(.*?)分钟<',html) 
    26.  
    27. #应用正则提取alltotal字段信息 
    28.  
    29. alltotal=re.findall(r'"alltotal">(.*?)万<',html) 
    30.  
    31. #应用正则提取captial字段信息 
    32.  
    33. capital=re.findall(r'"capital">(.*?)万<',html) 
    34.  
    35. <pre>  

    因为后面我们要对数据进行累计追加及趋势分析,是以在这里导入time库生成当天的日期,并将日期作为一个字段一路放在数据表。

    1. </pre> 
    2.  
    3. #导入time库(获取日期) 
    4.  
    5. import time 
    6.  
    7. date=time.strftime('%Y-%m-%d',time.localtime(time.time())) 
    8.  
    9. <pre> 
    10.  
    11. 当天的日孚信息将和数据一路生成数据表。 
    12.  
    13. </pre> 
    14.  
    15. #日期 
    16.  
    17. date 
    18.  
    19. '2017-04-13' 
    20.  
    21. <pre>  

    创建贷款及理财数据表

    将前面提掏出来的数据和日孚信息一路生成数据表,起首应用columns参数设置数据表中各字段的分列次序。

    1. </pre> 
    2.  
    3. #设置数据表各字段次序 
    4.  
    5. columns = ['采集日期','平台名称','成交额(万)','综合利率','投资人(人)','借钱周期(月)','借钱人(人)',

        推荐阅读

        数据显示Java热度持续下落,日子屈指可数?

      来自谷歌趋势的Java与JavaScript走势图 本年4月初,斯坦福大年夜学开端试履行计算机科学入门课CS 106A的新版本。这个名为CS 106J的新版本用JavaScript来教,而不是用Java来教。斯坦福大>>>详细阅读


      本文标题:使用python和tableau对数据进行抓取及可视化

      地址:http://www.17bianji.com/lsqh/35080.html

    关键词: 探索发现

    乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

    网友点评
    自媒体专栏

    评论

    热度

    精彩导读
    栏目ID=71的表不存在(操作类型=0)