资源简介
代码片段和文件信息
# -*- coding: utf-8 -*-
import urllib2
import urlparse
def download1(url):
“““Simple downloader“““
return urllib2.urlopen(url).read()
def download2(url):
“““Download function that catches errors“““
print ‘Downloading:‘ url
try:
html = urllib2.urlopen(url).read()
except urllib2.URLError as e:
print ‘Download error:‘ e.reason
html = None
return html
def download3(url num_retries=2):
“““Download function that also retries 5XX errors“““
print ‘Downloading:‘ url
try:
html = urllib2.urlopen(url).read()
except urllib2.URLError as e:
print ‘Download error:‘ e.reason
html = None
if num_retries > 0:
if hasattr(e ‘code‘) and 500 <= e.code < 600:
# retry 5XX HTTP
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 174 2015-09-28 13:29 wswp-code-9e6b82b47087\.hg_archival.txt
文件 1201 2015-09-28 13:29 wswp-code-9e6b82b47087\README.md
文件 2364 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter01\common.py
文件 553 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter01\iteration_crawler1.py
文件 846 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter01\iteration_crawler2.py
文件 931 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter01\li
文件 1149 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter01\li
文件 4649 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter01\li
文件 445 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter01\sitemap_crawler.py
文件 554 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter02\bs_example.py
文件 462 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter02\common.py
文件 4816 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter02\li
文件 371 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter02\lxm
文件 2293 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter02\performance.py
文件 333 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter02\regex_example.py
文件 700 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter02\scrape_callback1.py
文件 940 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter02\scrape_callback2.py
文件 3686 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter03\disk_cache.py
文件 3230 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter03\downloader.py
文件 3183 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter03\li
文件 2356 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter03\mongo_cache.py
文件 818 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter04\alexa_cb.py
文件 564 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter04\alexa_fn.py
文件 3026 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter04\mongo_queue.py
文件 2736 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter04\process_crawler.py
文件 471 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter04\process_test.py
文件 375 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter04\sequential_test.py
文件 2491 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter04\threaded_crawler.py
文件 475 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter04\threaded_test.py
文件 2747 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter05\browser_render.py
文件 1101 2015-09-28 13:29 wswp-code-9e6b82b47087\chapter05\search1.py
............此处省略133个文件信息
相关资源
- Django2 文件上传及功能支持中文名文件
- 深度学习入门:基于Python的理论与实
- 《Python3爬虫、数据清洗与可视化》
- IDA.Pro.v7.2_Hgl-Green(Python)+7.0(x86ar
- python项目开发案例集锦
- 《Python开发实战》(PDF版高清扫描版
- opencv_python官方中文教程源码修改版
- Python学习手册(第3版)-带目录完整版
- python2.7:scipy-0.19.0-win64
- Python Cookbook 第3版 中文版.pdf
-
ba
semap-1.2.1-cp37-cp37m-win_amd64.whl - 《Python源码剖析-深度探索动态语言核
- MDNETpython实现
- Python + PyQt5 + MySQL模拟QQ的聊天与娱乐
- 《Python深度学习》2018中文
- opencv3计算机视觉 python实现
- python项目web
- 目标跟踪CSK算法python实现
- Pycharm+Django+Python+MySQL开发
- Python自动化运维技术与最佳实践
- Python学习手册.mobi kindle电子书 带源码
- OpenCV 3-python语言
- Python基础教程 Beginning Python From Novic
- Selenium2 Python自动化测试实战第二版高
- 《selenium2 python 自动化测试实战第二版
- opencv_python-3.4.0+contrib-cp36-cp36m-win_amd
- 机电控制python
- scipy-1.0.0-cp36-none-win_amd64.whl
- python2.7、numpy、matplotlib在windows 64位平
- 《Python深度学习》中文版pdf+英文版
评论
共有 条评论