资源简介
手撸了一个下载器,可以自动下载百度谷歌图片,只要输入搜索关键词即可。内附所需配置驱动以及使用说明。

代码片段和文件信息
import re
import os
import urllib
import requests
from lxml import etree
import main
import time
global download_time
def get_onepage_urls(onepageurl):
if not onepageurl:
print(‘执行结束‘)
return [] ‘‘
try:
html = requests.get(onepageurl).text
except Exception as e:
print(e)
pic_urls = []
fanye_url = ‘‘
return pic_urls fanye_url
res = etree.HTML(html)
pic_urls = re.findall(‘“objURL“:“(.*?)“‘ html re.S)
fanye_url = res.xpath(‘//*[@id=“page“]/a[10]‘)
fanye_url = fanye_url[0].attrib[‘href‘]
fanye_url = ‘http://image.baidu.com‘ + str(fanye_url)
return pic_urls fanye_url
def down_pic(pic_urls localPath):
if not os.path.exists(localPath): # 新建文件夹
os.mkdir(localPath)
“““给出图片链接列表 下载图片“““
for i pic_url in enumerate(pic_urls):
download_time = str(int(time.time()*1000000))
try:
pic = requests.get(pic_url timeout=15)
with open(localPath + ‘%s.jpg‘ % download_time ‘wb‘)as f:
f.write(pic.content)
print(‘成功下载第%s张图片: %s‘ % (str(i + 1) str(pic_url)))
except Exception as e:
print(‘下载第%s张图片时失败: %s‘ % (str(i + 1) str(pic_url)))
print(e)
continue
#
# if __name__ == ‘__main__‘:
Baidu = r‘http://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq=1497491098685_R&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&ctd=1497491098685%5E00_1519X735&word=‘
url_init_first = Baidu
url_init = url_init_first + urllib.parse.quote(main.keyword safe=‘/‘) # 将关键词转为url编码
print(url_init)
all_pic_urls = []
urls_init = []
urls_init.append(url_init)
ini = 0 # 从第几页开始爬 第一页为零
while ini < main.pages:
onepage_urls fanye_url = get_onepage_urls(urls_init[ini])
urls_init.append(fanye_url)
all_pic_urls.extend(onepage_urls)
ini += 1
down_pic(list(set(all_pic_urls)) main.Download_address) # 保存位置也可以修改
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 2217 2018-09-12 10:37 Picture_crawler\Baidu.py
文件 3599 2018-09-12 10:42 Picture_crawler\Google.py
文件 6737408 2018-07-27 12:32 Picture_crawler\chromedriver.exe
文件 567 2018-09-12 10:45 Picture_crawler\main.py
目录 0 2018-09-12 10:50 Picture_crawler\
- 上一篇:springboot官方文档
- 下一篇:kalman滤波实现视频目标跟踪
相关资源
- Scratch 变脸(将人物图片变成各种各样
- 基于MFC扩展CListCtrl子项显示图片并叠
- 在大图中查找小图显示位置
- Img2Lcd(将图片转换为数组的工具)
- 图片存储到数据库保存二进制文件并
-
图片和xm
l格式互换 - 将yuv各种格式的图片转换为jpg格式的
- 傻瓜式的图片去水印下载
- 图片上传组件v1.0
- 230张网页背景图片(网页制作)
- 超强JPG图片压缩工具,减小图片文件
- 很好用的网站前端页面爬取工具
- 百度图片识别源码.rar
- 常用电子元器件图片识别
- eclipse安卓工程相册、相机选择图片功
- Qt图片浏览器 --基于Qt的Graphics View f
- Delphi图片按钮控件,很好用
- 从图片中读取条形码
- delphi外部图片拖拽
- 基于V4L2的视频采集,能够采集YUVJPE
- css3图片放大缩小切换幻灯片效果
- delphi基于gdi+的图片旋转任意角度
- 易语言图片快速无极限
- 易语言图片放大
- cropper.js h5裁剪上传图片 代码齐整
- 仿QQ头像裁剪功能
- TPG图片转换器V1.0绿色免费版
- delphi7 自制图片浏览器
- delphi打开图片或打开文件
- Flash图片转场特效.rar
评论
共有 条评论