资源简介
利用Python爬虫批量下载百度图库图片
代码片段和文件信息
import urllib.request
import urllib.parse
import ssl
import re
import pymysql
import cv2
import time
import os
i = 0
ssl._create_default_https_context = ssl._create_unverified_context
def open_url(url):
headers = {‘User-Agent‘:‘Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4843.400 QQBrowser/9.7.13021.400‘}
req=urllib.request.Request(url=urlheaders=headers)
‘‘‘req = urllib.request.Request(url)
req.add_header(‘User-Agent‘‘Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0‘)‘‘‘
page = urllib.request.urlopen(req)
html = page.read().decode(‘utf-8‘)
#print(html)
return html
def get_img(html file_name num):
global i
os.mkdir(file_name)
photo_link = r‘“objURL“:“(http://[^“]*.jpg)“‘
imgs = re.findall(photo_link html)
last_link = r‘下一页‘
last = re.findall(last_link html)
#print(len(imgs))
try:
for each in imgs:
if i > num:
print(‘下载结束!‘)
return ‘---‘ -1
#print(each
相关资源
- abaqus激光增材仿真,生死单元添加p
- 基于python的深度信念网络
- win10下调用OpenCV-Python和YOLACT模型进行
- Python多线程子域名扫描自带字典
- modbus通信的Python实现
- python批量pdf转txt
- 遗传算法python代码
- 爬取京东评论。代码
- 迷宫问题的A*算法(python实现)
- Mod_Python2.7安装文件
- 王硕-你也能看懂的python算法书-随书代
- 使用Python实现的网络社团发现GN算法
- python3的ARP简单攻击脚本
- 详解python实现FP-TREE进行关联规则挖掘
- Python 正则表达式操作指南 Regular ex<
- k匿名隐私保护算法python版
- Python人工智能AI深度学习全套课程.t
- python实现的使用huffman编码对文本的压
- 爬取58同城
- python提取点云数据
- 千锋python爬虫教程之scrapy框架.txt
- Python教学视频哪个好
- 小甲鱼python课程96集包含源码+课件+课
- 小甲鱼python课程96集含源码课件课后习
- Python从入门到精通教程共40G.txt
- python与json
- python的BFS,DFS,UCS,A星算法
- 决策树预测获胜NBA球队
- python图像数据增强
- [python]天气预报附带gui界面
评论
共有 条评论