资源简介
QQ空间爬虫,包括日志、说说、个人信息等,一天可抓取 400 万条数据。
代码片段和文件信息
# coding=utf-8
import datetime
# import BitVector
import public_methods
class InitMessages(object):
“““ 功能:信息初始化(读取保存在本地的信息,并设置爬虫的各项参数)。 “““
def __init__(self):
self.myheader = {‘User-Agent‘: ‘Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:39.0) Gecko/20100101 Firefox/39.0‘
‘Referer‘: ‘http://ctc.qzs.qq.com/qzone/newblog/blogcanvas.html‘} # 表头信息
self.thread_num_QQ = 1 # 同时下载几个QQ的日志,每个QQ的访问使用不同的cookie登录
self.thread_num_Blog = 2 # 同时下载QQ的几篇日志
self.thread_num_Mood = 6 # 同时下载QQ的几条说说
self.blog_after_date = datetime.datetime.strptime(“2014-01-01“ “%Y-%m-%d“) # 爬这个时间之后的日志
self.mood_after_date = datetime.datetime.strptime(“2015-01-01“ “%Y-%m-%d“) # 爬这个时间之后的说说
self.my_qq = self.readMyQQ() # 我的QQ列表,用来登录
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2016-11-25 04:33 QQSpider-master\
目录 0 2016-11-25 04:33 QQSpider-master\BitVector模块报错解决\
文件 4049 2016-11-25 04:33 QQSpider-master\BitVector模块报错解决\init_messages.py
文件 4670 2016-11-25 04:33 QQSpider-master\BitVector模块报错解决\spide_controller.py
目录 0 2016-11-25 04:33 QQSpider-master\QQSpider1\
目录 0 2016-11-25 04:33 QQSpider-master\QQSpider1\.idea\
文件 10 2016-11-25 04:33 QQSpider-master\QQSpider1\.idea\.name
文件 551 2016-11-25 04:33 QQSpider-master\QQSpider1\.idea\QQ_spiders.iml
文件 159 2016-11-25 04:33 QQSpider-master\QQSpider1\.idea\encodings.xm
文件 718 2016-11-25 04:33 QQSpider-master\QQSpider1\.idea\misc.xm
文件 427 2016-11-25 04:33 QQSpider-master\QQSpider1\.idea\modules.xm
文件 57608 2016-11-25 04:33 QQSpider-master\QQSpider1\.idea\workspace.xm
文件 0 2016-11-25 04:33 QQSpider-master\QQSpider1\QQFailSpided.txt
文件 155 2016-11-25 04:33 QQSpider-master\QQSpider1\QQForSpider.txt
文件 0 2016-11-25 04:33 QQSpider-master\QQSpider1\QQHadSpided.txt
文件 7742 2016-11-25 04:33 QQSpider-master\QQSpider1\blog_spider.py
文件 1295 2016-11-25 04:33 QQSpider-master\QQSpider1\friend_spider.py
文件 10315 2016-11-25 04:33 QQSpider-master\QQSpider1\information_spider.py
文件 779 2016-11-25 04:33 QQSpider-master\QQSpider1\init.py
文件 4043 2016-11-25 04:33 QQSpider-master\QQSpider1\init_messages.py
文件 6804 2016-11-25 04:33 QQSpider-master\QQSpider1\mood_spider.py
文件 33 2016-11-25 04:33 QQSpider-master\QQSpider1\myQQ.txt
文件 5797 2016-11-25 04:33 QQSpider-master\QQSpider1\public_methods.py
文件 4422 2016-11-25 04:33 QQSpider-master\QQSpider1\spide_controller.py
文件 75 2016-11-25 04:33 QQSpider-master\QQSpider1\使用说明.txt
目录 0 2016-11-25 04:33 QQSpider-master\QQSpider2\
文件 40 2016-11-25 04:33 QQSpider-master\QQSpider2\QQForSpider.txt
文件 7092 2016-11-25 04:33 QQSpider-master\QQSpider2\blog_spider.py
文件 1277 2016-11-25 04:33 QQSpider-master\QQSpider2\friend_spider.py
文件 10013 2016-11-25 04:33 QQSpider-master\QQSpider2\information_spider.py
文件 3281 2016-11-25 04:33 QQSpider-master\QQSpider2\init_messages.py
............此处省略7个文件信息
- 上一篇:python爬取贝壳网小区数据
- 下一篇:教室管理系统源码(基于python)
相关资源
- 煎蛋网图片爬虫
- 网易云音乐爬虫(亲测通过)
- 分布式scrapy-redis爬虫!糗事百科
- 用Python写网络爬虫.pdf(共35页)
- python爬虫-scrapy框架
- python 爬虫爬取京东代码
- 《用python写网络爬虫》pdf
- python爬虫爬取当当网
- 登陆需要密码以及图片验证的网站 如
- Nodejs实现的一个磁力链接爬虫
- python 登录QQ(基于QQ5.8)
- PYTHON爬虫示例21345
- python 爬虫(pyspider)
- python3爬虫采集淘宝商品数据
- python 爬取豌豆荚APP的爬虫
- python 淘宝爬虫抓取天猫数据
-
python 微博爬虫 (lxm
l) - python 爬取QQ音乐并至本地
- python实现 qq音乐/网易音乐/虾米/酷狗
- python微博爬虫(scrapy)
- python无损音乐(qq音乐)
- 最简单爬虫
- python 天气网爬虫(爬取天气预报)
- Python网络爬虫与信息提取-北京理工大
- 《用python写网络爬虫》随书源码
- python大文件(爬虫大体积文件模块)
- python 爬虫入门级(BeautifulSoup爬取最好
- 爬虫爬取携程机票信息
- python爬虫(爬取新浪微博数据)
- python爬取豆瓣影评
评论
共有 条评论