中。代码与之前的新建csv文件类似,独一的差别是增长了mode参数,这个参数默认值是w,也就是新建。把值改为a就是追加导出。
- </pre>
- #在汗青csv文件中追加新信息
- table.to_csv('wdty.csv',index=False,mode='a')
- <pre>
【编辑推荐】
- Python vs R : 在机械进修和数据分析范畴中的比较
- Uber开源数据可视化对象deck.gl获重大年夜进级
- 一文看懂数据可视化:大年夜编程对象到可视化表示方法
- Python分布式抓取和分析京东商城评价
- 像Excel一样应用python进行数据分析-(2)
创建自定义函数
以下是导出后的数据表截图。内容与前面创建的数据表内容一致。
大年夜导入所需的库文件,到提取数据拼接和导出,我们一共进行了30+步的操作。为了简化步调,我们把这些步调放在一个loan_data自
定义函数中。今后每次只须要履行以下这个自定义函数就可以将数据抓取下来并导出到csv里了。下面是具体的代码,个中为了获得代
码履行中的过程信息,我们在一些关键步调后应用print输出了一些状况信息。并计算了全部代码履行所消费的时光。
- </pre>
- def loan_data():
- import os
- import requests
- import re
- import pandas as pd
- import time
- start = time.clock()
- headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64
- Safari/537.11',
- 'Accept':'text/html;q=0.9,*/*;q=0.8',
- 'Accept-Charset':'ISO-8859-1,utf-8;q=0.7,*;q=0.3',
- 'Connection':'close',
- 'Referer':'https://www.bluewhale.cc/'
- }
- r=requests.get('http://www.p2peye.com/shuju/ptsj/',headers=headers)
- status=r.status_code
- if status == 200:
- print('页面抓取状况正常。')
- else:
- os._exit(0)
- html=r.content
- html=str(html, encoding = "GBK")
- print('编码转换完成!')
- title=re.findall(r'"return false".*?title="(.*?)"',html)
- total=re.findall(r'"total">(.*?)万<',html)
- rate=re.findall(r'"rate">(.*?)<',html)
- pnum=re.findall(r'"pnum">(.*?)人<',html)
- cycle=re.findall(r'"cycle">(.*?)月<',html)
- p1num=re.findall(r'"p1num">(.*?)人<'
推荐阅读
来自谷歌趋势的Java与JavaScript走势图 本年4月初,斯坦福大年夜学开端试履行计算机科学入门课CS 106A的新版本。这个名为CS 106J的新版本用JavaScript来教,而不是用Java来教。斯坦福大>>>详细阅读
本文标题:使用python和tableau对数据进行抓取及可视化
地址:http://www.17bianji.com/lsqh/35080.html
1/2 1