资源简介
运用python代码结合高德地图App设计的租房app 包含项目代码和爬取的相关数据
代码片段和文件信息
from bs4 import BeautifulSoup
from urllib.parse import urljoin
import requests
import csv
import time
import random
#第一页网址
url=“http://gz.58.com/pinpaigongyu/pn/{page}/?minprice=500_5000“
#初始化页码
page=0
# 标记次数【作用:防止网络问题】
sign=0
#打开CSV格式的文件
csv_file=open(“ren.csv““w“)
#创建writer对象指定文件与分隔符
csv_writer=csv.writer(csv_filedelimiter=““)
while True:
#页码导入
page=page+1
print(“[#] 解析网址:“url.format(page=page))
response=requests.get(url.format(page=page)) #导入url请求
html=BeautifulSoup(response.text“lxml“) #解析url
house_list=html.select(“.list > li“) #CSS样式选择器
#判断是否循环结束
if not house_list:
#连续三次标记都获取为空说明列表已经读取完毕
if sign==3:
print(“ [+]已读取完毕退出.....“)
break
else:
print(“ [+]出现获取不到列表再次尝试获取...“)
sign+=1 #进行次数标记
# 加入随机延迟
time.sleep(random.randint(1 3))
continue
#获取租房信息列表成功初始化标记
sign = 0
#检列表开始循环读取
for house in house_list:
#房屋url超链接
house_url=urljoin(urlhouse.select(“a“)[0][“href“])
# print(“ [*]url:“house_url)
# 房屋标题
house_title=str(house.select(“h2“)[0].string)
# print(“ [*]房屋标题:“house_title)
# 房屋信息列表
house_info_list=house_title.split()
#地址 【判断不同的情况,第二列是公寓名去第一列作为地址】
if “公寓“ in house_info_list[1] or “青年社区“ in house_info_list[1]:
house_location=house_info_list[0].split(“】“)[1]
# print(“ [*]地址:“house_location)
else:
house_location=house_info_list[1]
# print(“ [*]地址:“house_location)
house_money=house.select(“.money“)[0].select(“b“)[0].string
# print(“ [*]房租:“house_money)
# print(“---------------------------------------------------------- \n“)
# 写入一行数据
csv_writer.writerow([house_title house_location house_money house_url])
#关闭文件
csv_file.close()
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2018-11-27 17:47 租房API调用\.idea\
文件 254 2017-09-09 21:24 租房API调用\.idea\misc.xm
文件 282 2017-09-09 21:22 租房API调用\.idea\modules.xm
文件 17202 2017-09-10 15:21 租房API调用\.idea\workspace.xm
文件 500 2017-09-09 21:24 租房API调用\.idea\租房API调用.iml
文件 2470 2017-09-11 21:26 租房API调用\crawl.py
文件 8566 2017-09-10 12:14 租房API调用\index.html
文件 94990 2017-09-11 21:00 租房API调用\ren.csv
文件 108647 2017-09-11 21:02 租房API调用\ren_1.csv
文件 51 2017-09-09 23:00 租房API调用\test.py
目录 0 2018-11-27 17:47 租房API调用\备份\
文件 2080 2017-09-10 11:49 租房API调用\备份\crawl.py
相关资源
- Iterative Bagging和MultiBoosting 算法python实
- python 滑雪小游戏
- 5层神经网络带L2正则化的损失函数计
- 查找两幅图片中的不同
- python标准库中文版.tar
- python多人在线聊天室
- Python3 实现SM3国产哈希算法
- python爬取微博热搜并直接写入mysql.r
- Python-Scrapy 入门级爬虫项目实战
- 用python编写的信息管理系统的增删改
- 用python编写的饮料自动购物机
- [计算方法作业]利用python中matplotlib实
- python电子书大全.txt
- python用Django实现简单的web版学生信息
- Python-从Python高效处理FASTQ文件
- Python-机器学习完全课程
- Python-利用flask搭建的一个简单的个人
- Python-利用Python实现中文文本关键词抽
- Python-一个WindowsLinux和Mac的简单键盘记
- Python-Glyce用于汉字表示的字形向量
- paillier 纯 python Paillier同态密码.zip
- fancyimpute 在 python 中,实现了多元插值
- 利用pythonscihub成文献为PDF操作
- 详解python实现交叉验证法与留出法
- 用python做一个搜索引擎(Pylucene)的代
- python利用urllib实现爬取京东网站商品
- python微信公众号之关键词自动回复
- python爬取cnvd漏洞库信息的
- arcgis使用python脚本批量裁剪影像
- Python的Django框架中的数据库配置指南
评论
共有 条评论