资源简介
用scrapy框架写的京东爬虫,可以抓取京东商品信息和评论
代码片段和文件信息
# -*- coding: utf-8 -*-
# Define here the models for your scraped items
#
# See documentation in:
# http://doc.scrapy.org/en/latest/topics/items.html
import scrapy
from scrapy import Item Field
class JdSpiderItem(scrapy.Item):
# define the fields for your item here like:
# name = scrapy.Field()
pass
class goodsItem(Item):
link = Field() # 商品链接
ID = Field() # 商品ID
name = Field() # 商品名字
comment_num = Field() # 评论人数
shop_name = Field() # 店家名字
price = Field() # 价钱
commentVersion = Field() # 为了得到评论的地址需要该字段
score1count = Field() # 评分为1星的人数
score2count = Field() # 评分为2星的人数
score3count = Field() # 评分为3星的人数
score4count = Field() # 评分为4星的人数
score5count = Field() # 评分为5星的人数
class commentItem(Item):
user_name = Field(
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2017-07-28 11:00 jd_spider-master\
目录 0 2017-07-28 11:00 jd_spider-master\.idea\
目录 0 2017-07-28 11:00 jd_spider-master\.idea\inspectionProfiles\
文件 410 2017-07-28 11:00 jd_spider-master\.idea\inspectionProfiles\Project_Default.xm
文件 235 2017-07-28 11:00 jd_spider-master\.idea\inspectionProfiles\profiles_settings.xm
文件 459 2017-07-28 11:00 jd_spider-master\.idea\jingdong.iml
文件 701 2017-07-28 11:00 jd_spider-master\.idea\misc.xm
文件 268 2017-07-28 11:00 jd_spider-master\.idea\modules.xm
文件 180 2017-07-28 11:00 jd_spider-master\.idea\vcs.xm
文件 36991 2017-07-28 11:00 jd_spider-master\.idea\workspace.xm
文件 2022 2017-07-28 11:00 jd_spider-master\README.md
文件 80936 2017-07-28 11:00 jd_spider-master\good.png
文件 29184 2017-07-28 11:00 jd_spider-master\goods.xls
文件 1321 2017-07-28 11:00 jd_spider-master\jd_comment.sql
文件 1076 2017-07-28 11:00 jd_spider-master\jd_goods.sql
目录 0 2017-07-28 11:00 jd_spider-master\jd_spider\
文件 0 2017-07-28 11:00 jd_spider-master\jd_spider\__init__.py
文件 138 2017-07-28 11:00 jd_spider-master\jd_spider\__init__.pyc
文件 1759 2017-07-28 11:00 jd_spider-master\jd_spider\items.py
文件 1581 2017-07-28 11:00 jd_spider-master\jd_spider\items.pyc
文件 1396 2017-07-28 11:00 jd_spider-master\jd_spider\middlewares.py
文件 2082 2017-07-28 11:00 jd_spider-master\jd_spider\middlewares.pyc
文件 5780 2017-07-28 11:00 jd_spider-master\jd_spider\pipelines.py
文件 5717 2017-07-28 11:00 jd_spider-master\jd_spider\pipelines.pyc
文件 3799 2017-07-28 11:00 jd_spider-master\jd_spider\settings.py
文件 3080 2017-07-28 11:00 jd_spider-master\jd_spider\settings.pyc
目录 0 2017-07-28 11:00 jd_spider-master\jd_spider\spiders\
文件 161 2017-07-28 11:00 jd_spider-master\jd_spider\spiders\__init__.py
文件 146 2017-07-28 11:00 jd_spider-master\jd_spider\spiders\__init__.pyc
文件 2947 2017-07-28 11:00 jd_spider-master\jd_spider\spiders\jd_comment.py
文件 2684 2017-07-28 11:00 jd_spider-master\jd_spider\spiders\jd_comment.pyc
............此处省略4个文件信息
- 上一篇:物体的浮沉
- 下一篇:连铸坯角部传热过程的数值模拟
相关资源
- 少儿python编程课件.ppt
- python招聘网站爬虫与seaborn可视化职业
- Python爬取新冠肺炎疫情实时数据
- Go语言爬虫软件源码(高并发/分布式
- perl脚本爬虫程序,支持爬取北大未名
- 基于SNMP协议的网络拓扑发现程序
- 使用pymupdf开发的pdf查看器-tkinter篇
- k-近邻算法改进约会网站的配对效果
- 中南大学强智教务系统成绩爬虫
- scrapy爬取cnblog博客园
- Scapy 中文文档
- 上市公司财务报表合并
- 高校请假管理系统
- openpyxl-1.8.5.zip
- setuptools-2.2.zip
- 飞机大战图片素材全
- PyWin32中文辅助文档.rar
- 链家房价数据
- 爬虫滴滴成都位置及其他属性信息数
- 默默单词分享脚本,每天20个
- 神经脉冲网络
- Node.js-外卖爬虫定时自动抓取三大外卖
- 车型历年销量.xlsx
-
pip-sc
ript.zip - 爬虫软件可执行,随便修改就能爬
- 泰坦尼克实验文档
- 柏拉图制作
- 51搜学网数据爬取
- 人工免疫算法源程序
- Django开发论坛代码
评论
共有 条评论