资源简介
经过上一篇教程我们已经大致了解了Scrapy的基本情况,并写了一个简单的小demo。这次我会以爬取豆瓣电影TOP250为例进一步为大家讲解一个完整爬虫的流程。
工具和环境
语言:python 2.7
IDE: Pycharm
浏览器:Chrome
爬虫框架:Scrapy 1.2.1
https://zhuanlan.zhihu.com/p/24769534?refer=woodenrobot

代码片段和文件信息
# -*- coding: utf-8 -*-
# Define here the models for your scraped items
#
# See documentation in:
# http://doc.scrapy.org/en/latest/topics/items.html
import scrapy
class DoubanMovieItem(scrapy.Item):
# 排名
ranking = scrapy.Field()
# 电影名称
movie_name = scrapy.Field()
# 评分
score = scrapy.Field()
# 评论人数
score_num = scrapy.Field()
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2017-07-15 16:55 scrapy-tutorial-master\
文件 17 2017-07-15 16:55 scrapy-tutorial-master\.gitignore
文件 268 2017-07-15 16:55 scrapy-tutorial-master\scrapy.cfg
目录 0 2017-07-15 16:55 scrapy-tutorial-master\scrapyspider\
文件 0 2017-07-15 16:55 scrapy-tutorial-master\scrapyspider\__init__.py
文件 386 2017-07-15 16:55 scrapy-tutorial-master\scrapyspider\items.py
文件 292 2017-07-15 16:55 scrapy-tutorial-master\scrapyspider\pipelines.py
文件 205 2017-07-15 16:55 scrapy-tutorial-master\scrapyspider\run.py
文件 3177 2017-07-15 16:55 scrapy-tutorial-master\scrapyspider\settings.py
目录 0 2017-07-15 16:55 scrapy-tutorial-master\scrapyspider\spiders\
文件 161 2017-07-15 16:55 scrapy-tutorial-master\scrapyspider\spiders\__init__.py
文件 387 2017-07-15 16:55 scrapy-tutorial-master\scrapyspider\spiders\blog_spider.py
文件 1326 2017-07-15 16:55 scrapy-tutorial-master\scrapyspider\spiders\douban_ajax_spider.py
文件 1446 2017-07-15 16:55 scrapy-tutorial-master\scrapyspider\spiders\douban_spider.py
- 上一篇:大学排名爬虫
- 下一篇:xgboost安装包
相关资源
- django图片浏览+scrapy实现数据抓取功能
- 豆瓣爬虫;Scrapy框架
- scrapy框架爬取58同城数据
- scrapy 爬取图片clj
- scrapy_qunar_one
- Python爬虫相关书籍.zip
- pywin32-224-cp37-cp37m-win_amd64.whl
- ScrapyMySQL爬取链家网中北京地区租房信
- Twisted-17.9.0.tar.bz2和setuptools-19.6.tar.g
- 爬取优酷电影代码
- scrapy整站爬取voa双语新闻并保存到m
- Python-WenshuSpiderScrapy框架爬取中国裁判
- Python 3.6.1+Scrapy 1.1.0rc3
- scrapy 安装包
- 基于scrapy框架的百度地图公交站点数
- scrapy专利爬虫
- python3爬虫资料
- python爬虫开发与项目实战
- 爬虫多维度抓取链家二手房成交数据
- 马蜂窝爬虫案例解析
- Python网络爬虫实战Scrapy.txt
- Python Scrapy爬虫爬取微博和微信公众号
- sina_crawl.rar
- scrapy_qunar_two
- 利用python的scrapy爬取慕课网全站课程
- 基于python scrapy 的双色球爬虫
- get_wuyou.zip
- 千锋python爬虫教程之scrapy框架.txt
- scrapy简单案例--爬取慕课网所有课程信
- Python-Scrapy 入门级爬虫项目实战
评论
共有 条评论