资源简介
代码片段和文件信息
import requests
from lxml import etree
import re
import os
from multiprocessing.dummy import Pool as ThreadPool
def gethtml(urlencode): #获取网页源码
r = requests.get(url)
r.encoding = encode
return r.text
def filterFName(FName): #文件名过滤特殊字符
rstr = r“[\/\\\:\*\?\“\<\>\|]“
new_name = re.sub(rstr “_“ FName)
return new_name
def mkdir(path): #创建文件夹
path = path.strip()
isExists = os.path.exists(path)
if not isExists:
os.makedirs(path)
def geturl(url): #获取网站各个分类链接、分类名称
html = gethtml(url‘utf-8‘)
ehtml = etree.HTML(html)
nurl = ehtml.xpath(‘//*[@id=“chenxing_menu“]/li/a/@href‘)
ntitle = ehtml.xpath(‘//*[@id=“chenxing_menu“]/li/a/text()‘)
urldata=[]
for i in range(1len(nurl)-1):
urldata.a
- 上一篇:《Python和Pygame游戏开发指南》随书源码
- 下一篇:python百度图片
相关资源
- Django2 文件上传及功能支持中文名文件
- django博客网站
- 深度学习入门:基于Python的理论与实
- 《Python3爬虫、数据清洗与可视化》
- IDA.Pro.v7.2_Hgl-Green(Python)+7.0(x86ar
- python项目开发案例集锦
- 《Python开发实战》(PDF版高清扫描版
- opencv_python官方中文教程源码修改版
- Python学习手册(第3版)-带目录完整版
- python2.7:scipy-0.19.0-win64
- Python Cookbook 第3版 中文版.pdf
-
ba
semap-1.2.1-cp37-cp37m-win_amd64.whl - 《Python源码剖析-深度探索动态语言核
- MDNETpython实现
- Python + PyQt5 + MySQL模拟QQ的聊天与娱乐
- 《Python深度学习》2018中文
- opencv3计算机视觉 python实现
- python项目web
- 目标跟踪CSK算法python实现
- Pycharm+Django+Python+MySQL开发
- Python自动化运维技术与最佳实践
- Python学习手册.mobi kindle电子书 带源码
- OpenCV 3-python语言
- Python基础教程 Beginning Python From Novic
- Selenium2 Python自动化测试实战第二版高
- 《selenium2 python 自动化测试实战第二版
- opencv_python-3.4.0+contrib-cp36-cp36m-win_amd
- 机电控制python
- scipy-1.0.0-cp36-none-win_amd64.whl
- python2.7、numpy、matplotlib在windows 64位平
评论
共有 条评论