资源简介
请确保D盘有一个 image文件夹 用于存放采集到的图片
代码片段和文件信息
import requests
from lxml import etree
import time
class Baiduspider(object):
def __init__(self):
self.baseurl = ‘https://tieba.baidu.com/‘
self.url = ‘https://tieba.baidu.com/f?‘
self.headers = {‘User-Agent‘:‘Mozilla/5.0‘}
#获取帖子链接
def getPageUrl(selfurl):
res = requests.get(urlheaders=self.headers)
res.encoding= ‘utf-8‘
html = res.text
parseHtml = etree.HTML(html)
# 2. 解析对象调用xpath
r1 = parseHtml.xpath(‘//div[@class=“t_con cleafix“]/div/div/div/a/@href‘)
for t in r1:
self.getImaUrl(t)
#获取帖子中图片的连接
def getImaUrl(selft):
res = requests.get(self.baseurl+theaders=self.headers)
res.encoding= ‘utf-8‘
html = res.text
parseHtml = etree.HTML(html)
# 2. 解析对象调用xpath. 两个解析式不确定 第一个不能用就换第二个
r2 = parseHtml.xpath(‘//div[
相关资源
- python 给图片增加透明水印(文字)
- python模拟登录52破解论坛,并实现打卡
- python查询百度关联词(相关搜索结果
- selenium右击另存为图片(windows可用)
- python 给图片添加数字水印
- python提取word中的图片到指定文件夹
- 从图像数据集读取图片并拼接成大图
- 监控文件夹,发现psd文件自动生成j
- 煎蛋网图片爬虫
- 百度图片识别
- 多张图片识别文字(基于AipOcr)
- python批量图片(pysnooper)
- python获取酷狗top音乐500首(采集入门
- python合并PDF文件、图片先转化为A4纸大
- 登陆需要密码以及图片验证的网站 如
- python3爬虫采集淘宝商品数据
- 多线程网站图片
- python抓取网页图片
- python 采集指定网址的图片并保存到本
- python 爬取QQ音乐并至本地
- python +headless+chrome 模拟搜索百度关键
- python 中英文翻译api request(百度)
- Python实现百度文库
- python实现 qq音乐/网易音乐/虾米/酷狗
- Python采集尤图网美女图片
- python采集起点小说 并保存到txt文件
- python 采集美图录网站的图片
- python 采集有声小说至本地文件夹(幻
- python 截图并识别图片中的文字(基于
- python摄像头采集图像与库中图像分析
评论
共有 条评论