彼岸花网壁纸爬虫

大小: 2.58KB

文件类型: .rar

金币: 1

下载: 0 次

发布日期: 2024-05-08
语言: Python
标签: 爬虫壁纸

高速下载

资源简介

彼岸花网壁纸爬虫

资源截图

小图大图

代码片段和文件信息

import time 
import re
import random
from bs4 import BeautifulSoup as bf
from  urllib.request  import urlopenurlretrieve
def get_page（url）:
        html_url  = url
        html = urlopen（html_url）
        page  =  bf（html.read（）‘html.parser‘）
        return page 

#读取a标签中的超链接，并筛选出图片的链接
def GetImg_href（page）:
        img_href = []
        for i in  page.find_all（‘a‘）:
                tupian_href  = i.get（‘href‘）
                img_search = re.search（“^\/tupian\/.*\.html$“tupian_href）
                if  img_search== None:
                        continue
                img_href.append（“http://pic.netbian.com“ + str（img_search.group（）））
                #返回的列表
        return img_href
def New_GetImg_href（page）:
        “““
        获取图片的url
        return:img_src;
        “““
        img_src = []
        for i in  page.find_all（‘img‘）:
                tupian_href  = i.get（‘src‘）
                img_search_href = re.search（“^\/uploads/.*\.jpg$“tupian_href）
                if  img_search_href== None:
                        continue
                img_src.append（img_search_href.group（））
        return img_src
def img_down_load（abc）:
        ‘‘‘
         @a:已经下载的数据块 
        @b

上一篇：验证码识别（pytesseract+ matplotlib）
下一篇：python编程：入门到实践练习答案

共有条评论

彼岸花网壁纸爬虫

资源简介

资源截图

代码片段和文件信息

评论

相关资源