• 大小: 3KB
    文件类型: .py
    金币: 1
    下载: 0 次
    发布日期: 2021-06-02
  • 语言: Python
  • 标签: python  

资源简介

直接输入所要爬虫图片的名称,能够循环遍历各个网站,并且下载所含关键字的名称图片

资源截图

代码片段和文件信息

#!/usr/bin/env python  
# -*- coding: utf-8 -*-  
# @Author: loveNight  
  
import json  
import itertools  
import urllib  
import requests  
import os  
import re  
import sys  
import pickle
  
str_table = {  
    ‘_z2C$q‘: ‘:‘  
    ‘_z&e3B‘: ‘.‘  
    ‘AzdH3F‘: ‘/‘  
}  
‘‘‘
pickle_file = open(‘mylist.pkl‘‘rb‘)
char_table = pickle.load(pickle_file)
‘‘‘
char_table = {
     ‘w‘: ‘a‘
     ‘k‘: ‘b‘
     ‘v‘: ‘c‘
     ‘1‘: ‘d‘
     ‘j‘: ‘e‘
     ‘u‘: ‘f‘
     ‘2‘: ‘g‘
     ‘i‘: ‘h‘
     ‘t‘: ‘i‘
     ‘3‘: ‘j‘
     ‘h‘: ‘k‘
     ‘s‘: ‘l‘
     ‘4‘: ‘m‘
     ‘g‘: ‘n‘
     ‘5‘: ‘o‘
     ‘r‘: ‘p‘
     ‘q‘: ‘q‘
     ‘6‘: ‘r‘
     ‘f‘: ‘s‘
     ‘p‘: ‘t‘
     ‘7‘: ‘u‘
     ‘e‘: ‘v‘
     ‘o‘: ‘w‘
     ‘8‘: ‘1‘
     ‘d‘: ‘2‘
     ‘n‘: ‘3‘
     ‘9‘: ‘4‘
     ‘c‘: ‘5‘
     ‘m‘: ‘6‘
     ‘0‘: ‘7‘
     ‘b‘: ‘8‘
     ‘l‘: ‘9‘
     ‘a‘: ‘0‘
}
  
# str 的translate方法需要用单个字符的十进制unicode编码作为key  
# value 中的数字会被当成十进制unicode编码转换成字符  
# 也可以直接用字符串作为value  
char_table = {ord(key): ord(value) for key value in char_table.items()}  
  
# 解码图片URL  
def decode(url):  
    # 先替换字符串  
    for key value in str_table.items():  
        url = url.replace(key value)  
    # 再替换剩下的字符  
    return url.translate(char_table)  
  
# 生成网址列表  
def buildUrls(word):  
    word = urllib.parse.quote(word)  
    url = r“http://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&fp=result&queryWord={word}&cl=2&lm=-1&ie=utf-8&oe=utf-8&st=-1&ic=0&word={word}&face=0&istype=2nc=1&pn={pn}&rn=60“  
    urls = (url.format(word=word pn=x) f

评论

共有 条评论