资源简介
彼岸花网壁纸爬虫
代码片段和文件信息
import time
import re
import random
from bs4 import BeautifulSoup as bf
from urllib.request import urlopenurlretrieve
def get_page(url):
html_url = url
html = urlopen(html_url)
page = bf(html.read()‘html.parser‘)
return page
#读取a标签中的超链接,并筛选出图片的链接
def GetImg_href(page):
img_href = []
for i in page.find_all(‘a‘):
tupian_href = i.get(‘href‘)
img_search = re.search(“^\/tupian\/.*\.html$“tupian_href)
if img_search== None:
continue
img_href.append(“http://pic.netbian.com“ + str(img_search.group()))
#返回的列表
return img_href
def New_GetImg_href(page):
“““
获取图片的url
return:img_src;
“““
img_src = []
for i in page.find_all(‘img‘):
tupian_href = i.get(‘src‘)
img_search_href = re.search(“^\/uploads/.*\.jpg$“tupian_href)
if img_search_href== None:
continue
img_src.append(img_search_href.group())
return img_src
def img_down_load(abc):
‘‘‘
@a:已经下载的数据块
@b
相关资源
- Python 爬虫小说.ipynb
- 爬虫爬取网易云音乐
- 北邮python爬虫学堂在线
- python简单爬虫
- 爬取58同城二手房信息.py
- 知网爬虫软件(python)
- python爬虫爬取微博热搜
- python爬虫爬取旅游信息(附源码,c
- python爬虫爬取豆瓣电影信息
- 爬取上百张妹子图源码可直接运行
- Python爬虫实战入门教程
- 网络爬虫(pachong_anjuke.py)
- Python-京东抢购助手包含登录查询商品
- python网络爬虫获取景点信息源码
- python爬取维基百科程序语言消息盒(
- python新浪微博爬虫
- 12306爬虫实现
- 中国裁判文书网爬虫
- Python爬虫相关书籍.zip
- 豆瓣电影排行爬虫
- 疫情数据爬虫并绘制柱状图.py
- python新浪微博爬虫,爬取微博和用户
- Python数据爬虫及可视化分析
- 一套最新价值1680元的python爬虫实战全
- 测试工程师相关学习视频(包含pyth
- 11-Python爬虫工程师-App抓取进阶
- 基于10000网页python搭建搜索引擎课程设
- 法律判决文书python爬虫、以及数据处
- python新浪微博爬虫,爬取微博和用户
- Python网络爬虫实战.epub
评论
共有 条评论