资源简介
指定配置与车型,自动爬取车型配置信息,程序为爬取屏幕尺寸大小,可以根据自己的需求自行更改
代码片段和文件信息
# -*- coding: utf-8 -*-
import requests
import re
import time
import sys
import os
homedir = os.getcwd()
#新能源汽车网址
car_url=“https://www.autohome.com.cn/car/0_0-0.0_0.0-0-0-0-0-4-0-0-0/“
#zg=[]
#2018年1月28 该下载N
#燃油版
#temp=[‘A‘‘B‘‘C‘‘D‘‘E‘‘F‘‘G‘‘H‘‘I‘‘J‘‘K‘‘L‘‘M‘‘N‘‘O‘‘P‘‘Q‘‘R‘‘S‘‘T‘‘V‘‘W‘‘X‘‘Y‘‘Z‘]
#纯电版
#temp=[‘B‘‘C‘‘D‘‘F‘‘G‘‘H‘‘J‘‘K‘‘L‘‘N‘‘O‘‘Q‘‘R‘‘S‘‘T‘‘W‘‘X‘‘Y‘‘Z‘]
#for i in temp:
#print(“正在访问:“i)
#car_url=“https://www.autohome.com.cn/grade/carhtml/“+i+“.html“
#zg.append(car_url)
#print(car_url)
#print(zg)
#下载器
def download(url):
try:
response=requests.get(url)
#response.encoding=‘gb2312‘
if response:
global html
type = sys.getfilesystemencoding()
html=response.text
html = html.encode(‘utf-8‘).decode(‘utf-8‘)
return html
#print(html)
except Exception as e:
print(e)
def save_carname():
path_result=homedir+‘\\‘+‘车型.txt‘
f1 = open(path_result‘a‘)
f1.write(name[0]+‘\n‘)
f1.close()
def save_num():
path_result=homedir+‘\\‘+‘屏幕尺寸.txt‘
f1 = open(path_result‘a‘)
f1.write(m.group(0)+‘\n‘)
f1.close()
download(car_url)
html_1=html
img_url_1=re.findall(r‘href=“//car.autohome.com.cn/price/(.*?).html#pvareaid=103446“‘ html_1 )
#print(img_url_1)
#获取所有当前字母开头车型报价URL
img_url_item=list(map(lambda x: ‘https://car.autohome.com.cn/price/‘+x+‘.html#pvareaid=103446‘img_url_1))
#print(len(img_url_item))
for p in img_url_item:
try:
相关资源
- 汽车之家图片爬取
- 文件夹下所有图片的读取以及显示p
- python 实现图片像素大小设置
- Python Scrapy爬虫爬取微博和微信公众号
- python爬虫网站图片
- OpenCV-Python实现的图片拼接源代码
- sina_crawl.rar
- 新浪财经24小时python爬虫程序内置企业
- pygame动态图 & 以及动态图片的移动
- python 爬取图片
- python 爬虫的程序
- 图片的旋转方法算法以及双线性插值
- Python3爬虫入门到精通课程视频附软件
- 基于python写的几个图片处理源码
- 利用selenium对拉勾网的爬虫并将数据导
- Python3爬虫-v2
- python爬取视频源代码
- 利用python的scrapy爬取慕课网全站课程
- 基于python scrapy 的双色球爬虫
- python3 网络爬虫 多线程 无限爬网址
- Python爬取微博评论代码
- python3.x实现智联招聘网站岗位信息爬
- 闲鱼爬虫,可以爬取商品
- python实现yuv转RGB图片程序
- python3 网络爬虫实战
- 爬取知网的社科基金项目文章信息
- python实现图片个性化文字编辑
- python爬虫房天下商品房数据
- python爬取雅虎财经股票交易数据
- python爬虫爬取58租房信息
评论
共有 条评论