资源简介
该项目用于爬取万方数据库文献摘要数据,爬虫文件在万方文件夹里面,爬取数据在data1里面,目前data1里面有一份数据可供参考
代码片段和文件信息
# -*- coding: utf-8 -*-
# Define here the models for your scraped items
#
# See documentation in:
# http://doc.scrapy.org/en/latest/topics/items.html
import scrapy
class WanfangItem(scrapy.Item):
# define the fields for your item here like:
# name = scrapy.Field()
C_title = scrapy.Field()#中文标题
E_title = scrapy.Field()#英文标题
link = scrapy.Field()#链接
C_author = scrapy.Field()#作者姓名 中文
E_author = scrapy.Field()#作者姓名 英文
periodical = scrapy.Field()#期刊名称
abstract = scrapy.Field()#摘要 中文
keywords = scrapy.Field()#关键字 中文
time = scrapy.Field()#出版日期
fund = scrapy.Field()#基金项目
pass
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2017-12-05 09:46 wanfangSpider-master\
文件 2843 2017-12-05 09:46 wanfangSpider-master\README.md
目录 0 2017-12-05 09:46 wanfangSpider-master\data1\
文件 4662788 2017-12-05 09:46 wanfangSpider-master\data1\d1TCM.txt
目录 0 2017-12-05 09:46 wanfangSpider-master\wanfang\
文件 258 2017-12-05 09:46 wanfangSpider-master\wanfang\scrapy.cfg
目录 0 2017-12-05 09:46 wanfangSpider-master\wanfang\wanfang\
文件 0 2017-12-05 09:46 wanfangSpider-master\wanfang\wanfang\__init__.py
目录 0 2017-12-05 09:46 wanfangSpider-master\wanfang\wanfang\__pycache__\
文件 131 2017-12-05 09:46 wanfangSpider-master\wanfang\wanfang\__pycache__\__init__.cpython-36.pyc
文件 510 2017-12-05 09:46 wanfangSpider-master\wanfang\wanfang\__pycache__\items.cpython-36.pyc
文件 1001 2017-12-05 09:46 wanfangSpider-master\wanfang\wanfang\__pycache__\pipelines.cpython-36.pyc
文件 2332 2017-12-05 09:46 wanfangSpider-master\wanfang\wanfang\__pycache__\settings.cpython-36.pyc
文件 717 2017-12-05 09:46 wanfangSpider-master\wanfang\wanfang\items.py
文件 1905 2017-12-05 09:46 wanfangSpider-master\wanfang\wanfang\middlewares.py
文件 762 2017-12-05 09:46 wanfangSpider-master\wanfang\wanfang\pipelines.py
文件 5155 2017-12-05 09:46 wanfangSpider-master\wanfang\wanfang\settings.py
目录 0 2017-12-05 09:46 wanfangSpider-master\wanfang\wanfang\spiders\
文件 161 2017-12-05 09:46 wanfangSpider-master\wanfang\wanfang\spiders\__init__.py
目录 0 2017-12-05 09:46 wanfangSpider-master\wanfang\wanfang\spiders\__pycache__\
文件 139 2017-12-05 09:46 wanfangSpider-master\wanfang\wanfang\spiders\__pycache__\__init__.cpython-36.pyc
文件 3632 2017-12-05 09:46 wanfangSpider-master\wanfang\wanfang\spiders\__pycache__\wanfang.cpython-36.pyc
文件 3390 2017-12-05 09:46 wanfangSpider-master\wanfang\wanfang\spiders\wanfang.py
相关资源
- Python-京东抢购助手包含登录查询商品
- Python-利用Python图虫网摄影作品
- ScrapyMySQL爬取链家网中北京地区租房信
- Python-网站图片爬虫已包含微博微信公
- Python-WenshuSpiderScrapy框架爬取中国裁判
- Python-智联51job招聘需求挖掘采集和分
- Python-指定用户的所有抖音视频以及收
- Python-淘宝天猫商品数据抓取代码和
- Python-Boss直聘Python招聘岗位信息爬取和
- Python-精准的百度指数抓取综合已有百
- Python-Python爬虫京东自动打码登录指定
- Python-百度指数爬虫可以自定义时间段
- Python-爬取各种开源软件的官方仓库历
- Python-微信公众号历史文章爬取api
- Python-readwx爬取微信公众号爬取搜狗微
- Python-指定的抖音Douyin号的视频抖音爬
- Python-爬取微信公众号文章
评论
共有 条评论