按照提取平台名称title的办法,后面我们依次提取了贷款利率,贷款金额,满标时光等关键信息。下面是具体的代码。
- </pre>
- #应用正则提取total字段信息
- total=re.findall(r'"total">(.*?)万<',html)
- #应用正则提取rate字段信息
- rate=re.findall(r'"rate">(.*?)<',html)
- #应用正则提取pnum字段信息
- pnum=re.findall(r'"pnum">(.*?)人<',html)
- #应用正则提取cycle字段信息
- cycle=re.findall(r'"cycle">(.*?)月<',html)
- #应用正则提取plnum字段信息
- p1num=re.findall(r'"p1num">(.*?)人<',html)
- #应用正则提取fuload字段信息
- fuload=re.findall(r'"fuload">(.*?)分钟<',html)
- #应用正则提取alltotal字段信息
- alltotal=re.findall(r'"alltotal">(.*?)万<',html)
- #应用正则提取captial字段信息
- capital=re.findall(r'"capital">(.*?)万<',html)
- <pre>
因为后面我们要对数据进行累计追加及趋势分析,是以在这里导入time库生成当天的日期,并将日期作为一个字段一路放在数据表。
- </pre>
- #导入time库(获取日期)
- import time
- date=time.strftime('%Y-%m-%d',time.localtime(time.time()))
- <pre>
- 当天的日孚信息将和数据一路生成数据表。
- </pre>
- #日期
- date
- '2017-04-13'
- <pre>
创建贷款及理财数据表
将前面提掏出来的数据和日孚信息一路生成数据表,起首应用columns参数设置数据表中各字段的分列次序。
- </pre>
- #设置数据表各字段次序
- columns = ['采集日期','平台名称','成交额(万)','综合利率','投资人(人)','借钱周期(月)','借钱人(人)',
推荐阅读
来自谷歌趋势的Java与JavaScript走势图 本年4月初,斯坦福大年夜学开端试履行计算机科学入门课CS 106A的新版本。这个名为CS 106J的新版本用JavaScript来教,而不是用Java来教。斯坦福大>>>详细阅读
本文标题:使用python和tableau对数据进行抓取及可视化
地址:http://www.17bianji.com/lsqh/35080.html
1/2 1