资源简介
python爬虫代码,用于下载网络图片到本地保存
代码片段和文件信息
#!/usr/bin/env python
# -*- coding:utf-8 -*-
import os
import re
import urllib
import json
import socket
import urllib.request
import urllib.parse
import urllib.error
# 设置超时
import time
timeout = 5
socket.setdefaulttimeout(timeout)
class Crawler:
# 睡眠时长
__time_sleep = 0.1
__amount = 0
__start_amount = 0
__counter = 0
headers = {‘User-Agent‘: ‘Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0‘}
# 获取图片url内容等
# t 下载图片时间间隔
def __init__(self t=0.1):
self.time_sleep = t
# 保存图片
def __save_image(self rsp_data word):
if not os.path.exists(“./“ + word):
os.mkdir(“./“ + word)
# 判断名字是否重复,获取图片长度
self.__counter = len(os.listdir(‘./‘ + word)) + 1
for image_info in rsp_data[‘img
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2017-11-20 06:29 BaiduImageSpider-master\
文件 7 2017-11-20 06:29 BaiduImageSpider-master\.gitignore
文件 535 2017-11-20 06:29 BaiduImageSpider-master\README.md
文件 3934 2017-11-20 06:29 BaiduImageSpider-master\index.py
- 上一篇:树莓派多线程实时人脸检测
- 下一篇:Python数据处理代码
相关资源
- python 实现定时关机(windowspython3)
- python3爬虫采集淘宝商品数据
- Python3程序开发指南.第二版(带书签)
- Python3.x+ django2.x 在线教育系统源码
- python3+django实现学生信息管理系统
- python实现ftp远程文件(亲测通过)
- 基于python3.5和Django2.0的博客系统源码
- 《深入Python3》pdf
- 《Python3 萌新入门笔记》pdf 高清版
- python3程序设计课后练习(参考答案)
- Python3.5 获取海康威视代码
- python3.5从零开始学
- python3调用win32com查找替换ppt文字
- python-win-votesmart
- 盲水印python3.zip
- Python3.6实现delaunay三角剖分算法不规则
- python3.7 requests模拟新浪微博登录
- python3实现ATM机功能
- py2exe(python2.7/python3.3/python3.4)
- mod_wsgi-4.4.23+ap24vc14-cp35-cp35m-win_amd64.
- python3.6文字转语音
- python项目练习-python3实现web服务器
- kmeans上手代码
- fasterRCNN python36
- HTMLTestRunner中文版Python3.X
- 摄像机实时捕捉人脸+本地图片识别
- 官网python3.5.2中内置的python3.dll
- python3.7.2下多个txt文件合并去重
- python3-tkinter官方文档
- Python写的坦克大战
评论
共有 条评论