作家
登录

Python微博移动端爬虫实例(附代码)

作者: 来源: 2018-01-03 08:57:31 阅读 我要评论

【限时免费】岁尾最强一次云计算大年夜会,看传统、社区、互联网企业若何碰撞?


本文扼要讲述用Python爬取微博移动端数据的办法。可以看一下Robots协定。别的尽量不要爬取太快。如不雅你毫无控制的去爬取别人数据,别人网站当然会反爬越来越严格。至于为什么不爬PC端,原因是移动端较简单,很合适爬虫新手入门。有时光再写PC端吧!

情况介绍

在这里就会涉及到一个动态加载的概念,也就是我们只有向下滑动鼠标滚轮才会加载出更多的评论数据。这也是网页经常应用的方法。接下来就应当找到评论信息的┞锋实网址,找到真实网址的办法就是打开浏览器的开辟者对象,火狐/谷歌是F12键。打开如下:

Python3/Windows-10-64位/微博移动端

网页分析

以获取评论信息为例(你可以以本身的爱好获得其他数据)。如下图:

打开今后点击收集,收集用来记录浏览器和办事器交换的信息。接下来将鼠标滚轮迟缓向下滚动,在这个过程中就会弹出类似于上图的信息,也就是评论信息加载出来了。找到评论信息,应当会在第一条。如下图:

真实网址:https://m.weibo.cn/api/comments/show?id=4160547165300149&page=3

将网址在火狐琅绫擎打开如下图:

膳绫擎的网址其实pages=3就代表第三页,所以只需模仿网址即可,pages=4,5,6。。。。

别的因为是Json文件,所以提取数据异常便利,只需用切片操作即可。

【编辑推荐】

  1. 2017年大年夜数据年关盘点:开源对象、MySQL和Python是最大年夜赢家!
  2. 别@微信团队了,我用Python给本身戴上了圣诞帽!
  3. 5个酷其余Python对象
  4. 1行Python代码快速实现FTP办事器
  5. 用Python主动刷新抢12306火车票(附源码)
【义务编辑:庞桂玉 TEL:(010)68476606】

  推荐阅读

  MySQL存储写入速度慢?当然是选择分析一下啦

【限时免费】岁尾最强一次云计算大年夜会,看传统、社区、互联网企业若何碰撞? 问题背景描述: 在 MySQL 中履行 SQL 语句,比如 insert,贼慢,明明可能也就只是一行数据的插入,数据量很>>>详细阅读


本文标题:Python微博移动端爬虫实例(附代码)

地址:http://www.17bianji.com/lsqh/40189.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)