资源简介
一个简单的python爬虫程序,各个功能模块分开
代码片段和文件信息
import urllib2
class HtmlDownloader:
def download(selfurl):
if url is None:
return None
response = urllib2.urlopen(url)
if response.getcode() != 200:
return None
return response.read()
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2016-04-29 17:04 spider\
文件 210 2016-04-29 11:43 spider\html_downloader.py
文件 621 2016-04-29 11:43 spider\html_downloader.pyc
文件 770 2016-04-29 13:18 spider\html_outputer.py
文件 1435 2016-04-29 13:18 spider\html_outputer.pyc
文件 1171 2016-04-29 17:04 spider\html_parser.py
文件 1608 2016-04-29 17:04 spider\html_parser.pyc
文件 70731 2016-04-29 17:05 spider\output.html
文件 1027 2016-04-29 17:04 spider\spider_main.py
文件 65 2016-04-29 11:16 spider\test.py
文件 293 2016-04-29 11:17 spider\test.pyc
文件 542 2016-04-29 10:52 spider\url_manager.py
文件 1367 2016-04-29 10:52 spider\url_manager.pyc
相关资源
- 请求分页存储管理Python实现源代码+课
- python面试题大全
- python视频教程.txt
- python爬虫之豆瓣电影使用requests、lx
- 批量提取栅格影像
- 图像配准融合拼接Python.zip
- easygui一个python简单的gui库
- pycharm工程python调用OpenCV实现USB摄像头
- DEM数据三维可视化--python实现
- vae,autoencoderpython实现
- SRNN python代码实现
- ArcGIS Python常用脚本.docx
- Python找不到cl.exe等
- 自动扫雷系统+Python
- 基于标签的用户协同算法python
- 12306抢票Python代码,内含视频教程
- 爬虫从入门到精通内含如何应对反爬
- 个人博客网站源码python3.6+django2.0+my
- python网盘.txt
- Python Flask开发自己敲的试验楼小Demo
- python内置K-means聚类算法对鸢尾花数据
- KCFpython算法
- 指定步数节点内容的PROCAST仿真结果导
- python自然语言处理中文停用词
- 最好中国大学近几年排名及python爬虫
- Tensorflow-BiLSTM分类
- 感知机算法Python实现
- python 实现将TXT文件内容逐行存到EXC
- python 打开并计算两幅dicom图像感兴趣
- python 决策树代码
评论
共有 条评论