资源简介
可以分类下载汽车之家图片,自己设定下载哪些部分的图片,可以自己设定
代码片段和文件信息
import requests
import re
import time
car_url=“https://www.autohome.com.cn/grade/carhtml/F.html“
zg=[]
temp=[‘A‘‘B‘‘C‘‘D‘‘F‘‘G‘‘H‘‘J‘‘K‘‘L‘‘M‘‘N‘‘O‘‘P‘‘Q‘‘R‘‘S‘‘T‘‘V‘‘W‘‘X‘‘Y‘‘Z‘]
for i in temp:
car_url=“https://www.autohome.com.cn/grade/carhtml/“+i+“.html“
zg.append(car_url)
#print(car_url)
#print(zg)
#下载器
def download(url):
try:
response=requests.get(url)
response.encoding=‘gb2312‘
if response:
global html
html=response.text
return html
#print(html)
except Exception as e:
print(e)
for car_url in zg:
download(car_url)
html_1=html
img_url_1=re.findall(r‘href=“//car.autohome.com.cn/pic/series/(.*?).html#pvareaid=103448“‘ html_1 )
#print(len(img_url_1))
#获取所有B开头车型图片库URL
#img_url_item=list(map(lambda x: ‘https://car.autohome.com.cn/pic/series‘+ximg_url_1))
#print(img_url_item)
temp=[]
for i in img_url_1:
#IP为-10.html#pvareaid=2042220,外饰为-1.html#pvareaid=2042220,门板为-3.html#pvareaid=2042220
img_url_item_2 = ‘https://car.autohome.com.cn/pic/series/‘ + i + ‘-1.html#pvareaid=2042220‘
#print(img_url_item_2)
temp.append(img_url_item_2)
ip_list=temp
#print(len(ip_list))
for url in ip_list:
try:
ip_response=requests.get(url)
if ip_response:
#取出包在里面的网页源码
html_2=ip_response.text
#print(html_2)
#获取文档图片url用正则表达式
# img_url=re.findall(r‘ a=img_url[0:12:8]
#print(a)
img_url_1= list(map(lambd
相关资源
- 爬取汽车之家指定配置信息
- Python Scrapy爬虫爬取微博和微信公众号
- python爬虫网站图片
- sina_crawl.rar
- 新浪财经24小时python爬虫程序内置企业
- python 爬取图片
- python 爬虫的程序
- Python3爬虫入门到精通课程视频附软件
- 利用selenium对拉勾网的爬虫并将数据导
- Python3爬虫-v2
- python爬取视频源代码
- 利用python的scrapy爬取慕课网全站课程
- 基于python scrapy 的双色球爬虫
- python3 网络爬虫 多线程 无限爬网址
- Python爬取微博评论代码
- python3.x实现智联招聘网站岗位信息爬
- 闲鱼爬虫,可以爬取商品
- python3 网络爬虫实战
- 爬取知网的社科基金项目文章信息
- python爬虫房天下商品房数据
- python爬取雅虎财经股票交易数据
- python爬虫爬取58租房信息
- 基于python网络爬虫安居客新房信息爬
- 豆瓣和IMDB上电影的对比爬虫
- 人人贷爬虫代码
- Python爬虫实战之爬取网站全部图片
- Python3 实现大众点评网酒店信息和酒店
- Python爬取世界港口数据
- 基于selenium模拟天眼查登录并爬取企业
- realweibo.py
评论
共有 条评论