资源简介
火车采集器V9
代码片段和文件信息
#-*-coding:utf-8-*-
import sysimportlib
from urllib import unquote
import json
import sys
reload(sys)
sys.setdefaultencoding(‘utf8‘)
if len(sys.argv)!= 5:
print “argv lenth err 命令行参数长度不为5“
sys.exit()
else:
LabelCookie = unquote(sys.argv[1])
LabelUrl = unquote(sys.argv[2])
#PageType为ListContentPages分别代表列表页,内容页,多页http请求处理,Save代表内容处理
PageType=sys.argv[3]
SerializerStr = unquote(sys.argv[4])
if (SerializerStr[0:2] != ‘‘‘{“‘‘‘):
file_object = open(SerializerStr)
try:
SerializerStr = file_object.read()
SerializerStr = unquote(SerializerStr)
finally:
file_object.close()
LabelArray = json.loads(SerializerStr)
#以下是用户编写代码区域
if(PageType==“Save“):
if(LabelArray[‘标题‘]):
LabelArray[‘标题‘]=‘这是Python插件处理的标题‘
else:
LabelArray[‘Html‘]=‘当前页面的网址为:‘+ LabelUrl +“\r\n页面类型为:“ + PageType + “\r\nCookies数据为:“+LabelCookie+“\r\n接收到的数据是:“ + LabelArray[‘Html‘]
#以上是用户编写代码区域
LabelArray = json.dumps(LabelArray)
print LabelArray
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2018-04-08 15:11 火车采集器V9\
文件 165888 2018-04-09 15:43 火车采集器V9\CodeEditor.exe
目录 0 2018-07-26 10:19 火车采集器V9\Configuration\
目录 0 2018-05-08 16:00 火车采集器V9\Configuration\CategoryDir\
文件 117 2018-05-04 11:15 火车采集器V9\Configuration\CategoryDir\15.txt
文件 140 2015-08-04 15:51 火车采集器V9\Configuration\CategoryDir\2.txt
文件 117 2018-05-04 11:08 火车采集器V9\Configuration\CategoryDir\65.txt
文件 117 2018-05-04 14:12 火车采集器V9\Configuration\CategoryDir\66.txt
文件 1560 2018-05-11 12:43 火车采集器V9\Configuration\CategoryDir\67.txt
文件 0 2014-08-15 17:33 火车采集器V9\Configuration\Dict_NotAllowed.txt
文件 17786 2014-08-15 17:33 火车采集器V9\Configuration\Dict_Stopwords.txt
文件 75389 2014-08-15 17:33 火车采集器V9\Configuration\Dict_Synonym.txt
文件 31 2014-08-15 17:33 火车采集器V9\Configuration\Dict_User.txt
文件 3 2014-08-15 17:33 火车采集器V9\Configuration\Dict_Wildcard.txt
文件 556 2015-06-30 21:21 火车采集器V9\Configuration\FileDetect.txt
文件 230 2018-07-25 17:55 火车采集器V9\Configuration\LoginConfig.ini
文件 2061 2018-07-26 13:20 火车采集器V9\Configuration\Option.xm
目录 0 2018-04-08 14:26 火车采集器V9\Configuration\Synonym\
文件 29 2015-08-15 15:45 火车采集器V9\Configuration\Synonym\词库1.txt
文件 34 2015-08-15 15:45 火车采集器V9\Configuration\Synonym\词库12.txt
文件 3 2015-08-17 15:08 火车采集器V9\Configuration\TaskResume.txt
目录 0 2018-05-14 15:59 火车采集器V9\Configuration\TestLabel\
文件 243 2018-05-04 11:07 火车采集器V9\Configuration\TestLabel\PHPCMS V9 资讯_w.xm
文件 931 2018-05-14 17:04 火车采集器V9\Configuration\TestLabel\databa
文件 277 2018-05-08 17:19 火车采集器V9\Configuration\TestLabel\phpcms9_r_chinajuva_w.xm
文件 323 2018-05-04 11:41 火车采集器V9\Configuration\TestLabel\phpcms9_s_chinajuva_w.xm
文件 492 2018-05-07 16:33 火车采集器V9\Configuration\TestLabel\soyoung_d.xm
文件 341 2018-05-08 17:19 火车采集器V9\Configuration\TestLabel\web.xm
文件 529 2018-05-14 17:04 火车采集器V9\Configuration\TestLabel\北京悦美第二步-顾客日记_d.xm
文件 822 2018-05-07 16:34 火车采集器V9\Configuration\TestLabel\北京新氧第一步_d.xm
文件 527 2018-05-08 11:27 火车采集器V9\Configuration\TestLabel\北京新氧第三步-投入_d.xm
............此处省略688个文件信息
- 上一篇:程序员面试金典 第5版 中文版
- 下一篇:中文文本分类语料复旦-测试集
相关资源
- 统计学第6版贾俊平
- 共享单车案例
- 2017中国智慧停车行业大数据报告
- 大数据技术原理与应用 概念、存储、
- 大数据供应链++构建工业4.0时代只能物
- 尚硅谷大数据之Zookeeper视频笔记+代码
- 2018中国大数据大会全套ppt资料
- 《消费信用模型:定价、利润与组合
- 大数据技术原理与应用概念、存储、
- 企业IT架构转型之道 阿里巴巴中台战
- 2019 dubbo 教程 吴水城 传智 黑马 等
- Hadoop大数据分析
- hadoop-2.7.2.tar.gz
- 基于大数据学生上网行为分析
- 大数据优秀产品、服务和应用解决方
- 面向大数据的高效能垃圾文本分类
- 大数据架构详解:从数据获取到深度
- 离线和实时大数据开发实战
- 重构大数据统计
- 大数据处理之道
- 历史股票数据
- 美国人口数据案例三个.zip
- 大数据电商项目,视频真实企业项目
- 大数据云计算技术论文
- 交通时空大数据分析挖掘系统-数据
- 一种改进的自适应快速AF-DBSCAN聚类算
- 基于大数据的电池健康状态(SoH)的
- 大数据安全与隐私保护
- 论文研究-基于大数据的可视化金融量
- 大数据 安全与隐私保护
评论
共有 条评论