资源简介
利用爬虫爬取得进击的巨人漫画,放在d盘test下,目前到109话。请修改参数
代码片段和文件信息
import urllib.request
import re
import os
import urllib
#根据给定的网址来获取网页详细信息,得到的html就是网页的源代码
def getHtml(url):
page = urllib.request.urlopen(url)
html = page.read()
return html.decode(‘UTF-8‘)
def getImg(html):
# reg = r‘mhurl=(.+?\.jpg)“‘
imgre = re.compile(reg)
imglist2 = imgre.findall(html)[0]#表示在整个网页中过滤出所有图片的地址,放在imglist中
imglist2=imglist2[1:]
print(imglist2)
imglist= [r‘http://p‘+str(i)+r‘.xiaoshidi.net/‘+imglist2 for i in range(1)]
print ( imglist )
x = 0
path = ‘D:\\test‘
# 将图片保存到D:\\test文件夹中,如果没有test文件夹则创建
相关资源
- ElevatorSimulation.zip
- 14002454IPC-A-610DChinese(L).pdf
- SoftwareEngineering.pdf
- linfanrong_10164999.rar
- The.Art.Of.Unit.Testing.With.Examples.in.C.2nd
- myGame.rar
- 带手机版数据同步财税代理公司注册
- pdf课本及习题答案.rar
- 深度学习PDF非扫描版(中文版)麻省
- doudizhu_shffule_src.zip
- 随机信号分析解题指南.pdf
- ios12.3驱动.zip
- 百万邮件系统多机版.rar
- learnopengl-cn-2018年5月更新.pdf
- zw_学习OpenCV(中文版).zip
- 1-300.pdf
- pyqt5windows生成二维工具源码
- KNN疾病预测算法Demo
- ABAQUS单元失效浅析(单元删除
- Jtopo+json格式数据代码
- 解多目标规划的单纯形代码
- TerraVolVoxelTerrainEngine2.1c.7z
- VA_X_Setup2118.rar
- CHS_Ha_PasswarekitEnterprise10.0.exe
- 无线通信AndreaGoldsmith杨鸿文等译.rar
- 迅捷PDF转换器破解版.rar
- 迅捷PDF编辑器破解版.rar
- 金字塔原理1清晰扫描版.pdf
- TeamViewer_11已激活+破解版+随意换ID.z
- FieldtheoryofGuidedwavesCollin__2nd.pdf
评论
共有 条评论