资源简介
直接输入所要爬虫图片的名称,能够循环遍历各个网站,并且下载所含关键字的名称图片
代码片段和文件信息
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Author: loveNight
import json
import itertools
import urllib
import requests
import os
import re
import sys
import pickle
str_table = {
‘_z2C$q‘: ‘:‘
‘_z&e3B‘: ‘.‘
‘AzdH3F‘: ‘/‘
}
‘‘‘
pickle_file = open(‘mylist.pkl‘‘rb‘)
char_table = pickle.load(pickle_file)
‘‘‘
char_table = {
‘w‘: ‘a‘
‘k‘: ‘b‘
‘v‘: ‘c‘
‘1‘: ‘d‘
‘j‘: ‘e‘
‘u‘: ‘f‘
‘2‘: ‘g‘
‘i‘: ‘h‘
‘t‘: ‘i‘
‘3‘: ‘j‘
‘h‘: ‘k‘
‘s‘: ‘l‘
‘4‘: ‘m‘
‘g‘: ‘n‘
‘5‘: ‘o‘
‘r‘: ‘p‘
‘q‘: ‘q‘
‘6‘: ‘r‘
‘f‘: ‘s‘
‘p‘: ‘t‘
‘7‘: ‘u‘
‘e‘: ‘v‘
‘o‘: ‘w‘
‘8‘: ‘1‘
‘d‘: ‘2‘
‘n‘: ‘3‘
‘9‘: ‘4‘
‘c‘: ‘5‘
‘m‘: ‘6‘
‘0‘: ‘7‘
‘b‘: ‘8‘
‘l‘: ‘9‘
‘a‘: ‘0‘
}
# str 的translate方法需要用单个字符的十进制unicode编码作为key
# value 中的数字会被当成十进制unicode编码转换成字符
# 也可以直接用字符串作为value
char_table = {ord(key): ord(value) for key value in char_table.items()}
# 解码图片URL
def decode(url):
# 先替换字符串
for key value in str_table.items():
url = url.replace(key value)
# 再替换剩下的字符
return url.translate(char_table)
# 生成网址列表
def buildUrls(word):
word = urllib.parse.quote(word)
url = r“http://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&fp=result&queryWord={word}&cl=2&lm=-1&ie=utf-8&oe=utf-8&st=-1&ic=0&word={word}&face=0&istype=2nc=1&pn={pn}&rn=60“
urls = (url.format(word=word pn=x) f
- 上一篇:图虫网爬虫python实现
- 下一篇:python实现logistics的分叉图
相关资源
- python实现logistics的分叉图
- 图虫网爬虫python实现
- 网站图片爬取代码
- SIFT算法特征提取的python实现
- 已知两点经纬度坐标,求距离函数
- 最新Python3.6网络爬虫实战案例5章(基
- 一个简单的全覆盖路径规划python
- 徐州地区及周边范围noaa气象数据数据
- python五子棋代码
- 社区发现算法 加权GN算法的Python实现
- 基于用户协同过滤usercf的python代码实
- 21天学通python.txt
- python实现视频直播
- python QQ第三方登陆
- tensorflow2.0实现mnist手写数字识别代码
- Python源码剖析_代码(pythonympx.rar)
- 豆瓣爬虫python
- 计算机视觉视频教程百度云盘资源
- Shapely-1.6.4.post1-cp36-cp36m-win_amd64.whl
- python 战棋游戏六边形地图代码实现
- naive bayes代码实现(python版)
- springcloudpython
- MODIS_Mosaic.py
- 经典动量与反转交易策略python版
- Python习题集含答案
- Python实现一个简单的3层BP神经网络
- python-urx-master.zip
- Python3.x+Pyqt5实现绘图界面matplotlib绘图
- python-克里金插值 代码
- python就业班.txt
评论
共有 条评论