资源简介
python 整站下载源码
代码片段和文件信息
#coding: utf-8
from urllib import request
from htmlparser import UrlParser
import os.path
import re
# regular expression
re_word = re.compile(‘(\w+)‘)
re_dataname = re.compile(‘(\w+)\.(\w+)‘)
class DataBean:
url = ‘‘
raw_data = None
data = None
encoding = None
content_type = None # html jpg gif css
headers = None
def reset(self):
self.url = ‘‘
self.raw_data = None
self.data = None
self.encoding = None
self.content_type = None # html jpg gif css
self.headers = None
def set(self resp):
self.reset()
self.headers = resp.getheaders()
temp = resp.getheader(‘Content-Type‘).strip()
self.raw_data = resp.read()
if ‘text/‘ in temp:
temp = t
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 7388 2014-10-04 20:59 downloader.py
文件 3080 2014-10-03 19:30 htmlparser.py
----------- --------- ---------- ----- ----
10468 2
- 上一篇:Nodejs实现的一个磁力链接爬虫
- 下一篇:登陆需要密码以及图片验证的网站 如知乎
相关资源
- python一个打砖块的小游戏
- python实验指导书 图文高清版
- python主动安装第三方库
- python爬取豆瓣top250电影信息
- python绘制 大蟒蛇
- python小程序(数组排序)
- Python去水印(基于cv2)
- Python 数据结构入门 - 二叉搜索树(
- python空心电感计算器
- python除法.docx
- 抽奖背后的秘密(python抽奖逻辑)
- 绘制统计学直方图茎叶图(matplotlib)
- python求解标准差
- python数据分析与处理
- 学员管理系统源码
- 利用Python将照片在Excel中利用点阵图显
- python turtle 跳房子
- python 人群计数
- Python调用第三方API换脸
- “去哪儿吃”帮你选餐厅(python代码
- python 控制台登陆密码验证
- KNN算法的Python实现(datingrecd.ipynb)
- python核心编程第二版-习题答案
- python爬取笔趣阁小说
- 唐僧大战白骨精(源码)
- Python程序设计基础试题以及答案(3
- python聊天-服务端与客户端
- python递归求最大公约数
- 用python画皮卡丘(基于turtle)
- 伟哥的python私房菜(中国程序员).
评论
共有 条评论