资源简介
Python爬虫实现对图虫网相关图片的在线爬取,只需要填写相应的主题名即可自动下载资源至相应目录
代码片段和文件信息
import urllib.request
import urllib.parse
import os
import time
import json
def url_open(url):
headers = (“User-Agent““Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML like Gecko) Chrome/51.0.2704.79 Safari/537.36 Edge/14.14393“)
req = urllib.request.Request(url)
req.add_header(headers[0]headers[1])
response = urllib.request.urlopen(req)
html = response.read()
return html
def get_pages(url count):
pages = []
html = url_open(url).decode(‘utf-8‘)
target = json.loads(html)
for mytag in target[“postList“]:
tag1 = mytag[‘site_id‘]
tag2 = mytag[‘post_id‘]
tag = tag1 + ‘/‘ + tag2
pages.append(tag)
return pages
def find_imgs(url):
html = url_open(url).decode(‘utf-8‘)
img_addrs = []
a = html.find(‘class=“multi-photo-image“ src=“‘)
while a != -1:
b = html.find(‘.jpg‘ a a+255)
if b != -1:
img_addrs.append(html[a+31 : b+4])
else:
b = a + 31
- 上一篇:网站图片爬取代码
- 下一篇:对任意关键字爬虫对应图片代码
相关资源
- 爬虫源码:分页爬取,mysql数据库连接
- 利用Python爬虫抓取网页上的图片含异
- python爬虫抓取百度贴吧中邮箱地址
- Python爬虫库requests获取响应内容、响应
- Python爬虫爬取51Job职位数据
- 利用python爬虫爬取王者荣耀数据.py
- Python爬虫爬取豆瓣电影
- python爬虫样例
- Python爬虫代码
- python爬虫 破解js加密有道词典案列的
- python爬虫之豆瓣电影使用requests、lx
- 最好中国大学近几年排名及python爬虫
- python爬虫爬取企业详细信息
- 新浪微博爬虫代码+结果
- python爬虫淘宝图片
- python爬虫爬取企查查公司工商信息
- 一加云服务照片批量导出 Python爬虫
- Python爬虫抓取Ebay页面
- python爬取豆瓣每个账户对电影的评分
- 使用python对淘宝商品信息数据进行爬
- python爬虫Scrapy(一)-我爬了boss数据
- 豆瓣电影信息Python爬虫存入MongoDB.一分
- Python爬虫文件:爬取图片的程序.py
- 基于Python爬虫的股票信息爬取保存到
- Python爬虫每日抓取必应壁纸
- Python爬虫源码—爬取猫途鹰官方旅游
- python爬取百度搜索新闻,并自动生成
- python爬虫数据可视化分析大作业.zip
- python爬虫--爬取youtobe红人信息
- python简单爬虫抓取网页内容
评论
共有 条评论