资源简介
Scrapy爬取豆瓣读书某个tag下的所有书籍并保存到Mysql
代码片段和文件信息
# -*- coding: utf-8 -*-
# Define here the models for your scraped items
#
# See documentation in:
# http://doc.scrapy.org/en/latest/topics/items.html
import scrapy
class BooksItem(scrapy.Item):
book_name = scrapy.Field() #图书名
book_star = scrapy.Field() #图书评分
book_pl = scrapy.Field() #图书评论数
book_author = scrapy.Field() #图书作者
book_publish = scrapy.Field() #出版社
book_date = scrapy.Field() #出版日期
book_price = scrapy.Field() #图书价格
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2017-04-16 17:52 books\
目录 0 2017-04-16 17:37 books\books\
文件 546 2017-04-16 21:23 books\books\items.py
文件 2286 2017-04-16 20:37 books\books\middlewares.py
文件 1091 2017-04-16 21:34 books\books\pipelines.py
文件 5129 2017-04-16 21:29 books\books\settings.py
目录 0 2017-04-16 17:50 books\books\spiders\
文件 1591 2017-04-16 18:21 books\books\spiders\bookspider.py
文件 161 2017-04-15 19:50 books\books\spiders\__init__.py
目录 0 2017-04-16 20:36 books\books\spiders\__pycache__\
文件 1568 2017-04-16 20:36 books\books\spiders\__pycache__\bookspider.cpython-36.pyc
文件 161 2017-04-16 17:50 books\books\spiders\__pycache__\__init__.cpython-36.pyc
文件 0 2017-04-15 19:50 books\books\__init__.py
目录 0 2017-04-16 21:34 books\books\__pycache__\
文件 491 2017-04-16 21:26 books\books\__pycache__\items.cpython-36.pyc
文件 2272 2017-04-16 20:37 books\books\__pycache__\middlewares.cpython-36.pyc
文件 1339 2017-04-16 21:34 books\books\__pycache__\pipelines.cpython-36.pyc
文件 2283 2017-04-16 21:30 books\books\__pycache__\settings.cpython-36.pyc
文件 153 2017-04-16 17:50 books\books\__pycache__\__init__.cpython-36.pyc
文件 190903 2017-04-16 20:38 books\items.json
文件 254 2017-04-16 17:37 books\scrapy.cfg
- 上一篇:mysql mha安装包
- 下一篇:50个常用的SQL语句
评论
共有 条评论