资源简介
对于佛山南海链家网数据按不同镇街进行爬取,有相应的代码和结果
代码片段和文件信息
import requests
import time
from bs4 import BeautifulSoup
import pandas as pd
#设置列表页URL的固定部分
url=‘http://fs.lianjia.com/ershoufang/‘
#设置页面页的可变部分
page=(‘pg‘)
#设定头文件
headers = {‘User-Agent‘:‘Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.11 (KHTML like Gecko) Chrome/23.0.1271.64 Safari/537.11‘
‘Accept‘:‘text/html;q=0.9*/*;q=0.8‘
‘Accept-Charset‘:‘ISO-8859-1utf-8;q=0.7*;q=0.3‘
‘Accept-Encoding‘:‘gzip‘
‘Connection‘:‘close‘
‘Referer‘:‘http://www.baidu.com/link?url=_andhfsjjjKRgEWkj7i9cFmYYGsisrnm2A-TN3XZDQXxvGsM9k9ZZSnikW2Yds4s&wd=&eqid=c3435a7d00006bd600000003582bfd1f‘
}
#设定需要的小区
xiaoqu=[“dali1““danzao““guichengbeinanhaiguangchang““guichengdongchengshiguangchang““lishui13““qiandenghu““shishan2““xiqiao“]
yema= [35119323121]
#
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2018-09-03 10:48 房地产\
文件 19650 2018-08-31 10:47 房地产\dali1.csv
文件 27097 2018-08-31 10:50 房地产\danzao.csv
文件 68741 2018-08-31 10:52 房地产\guichengbeinanhaiguangchang.csv
文件 42660 2018-08-31 17:17 房地产\guichengdongchengshiguangchang.csv
文件 2691 2018-08-31 10:44 房地产\lianjia.py
文件 16117 2018-08-31 10:55 房地产\lishui13.csv
文件 146872 2018-08-31 11:01 房地产\qiandenghu.csv
文件 56832 2018-08-31 11:09 房地产\shishan2.csv
文件 2286 2018-08-31 11:05 房地产\xiqiao.csv
文件 12625 2018-08-31 17:17 房地产\街道房价.csv
- 上一篇:32位无符号乘法/递归调用程序
- 下一篇:数据库校友录信息管理系统
相关资源
- 少儿python编程课件.ppt
- python招聘网站爬虫与seaborn可视化职业
- Python爬取新冠肺炎疫情实时数据
- 基于SNMP协议的网络拓扑发现程序
- 使用pymupdf开发的pdf查看器-tkinter篇
- k-近邻算法改进约会网站的配对效果
- Scapy 中文文档
- 上市公司财务报表合并
- 高校请假管理系统
- openpyxl-1.8.5.zip
- setuptools-2.2.zip
- 一元线性模型.rar
- 飞机大战图片素材全
- PyWin32中文辅助文档.rar
- 默默单词分享脚本,每天20个
- 神经脉冲网络
-
pip-sc
ript.zip - 泰坦尼克实验文档
- 柏拉图制作
- 51搜学网数据爬取
- 人工免疫算法源程序
- Django开发论坛代码
- 照相机模型与现实增强的代码整合版
- pip-9.0.1-py2.py3-none-any.whl
- 用希尔伯特黄变换HHT求时频谱和边际
- 京东爬虫,可抓取京东商品信息和评
- 网络编程实践报告
- 武汉二手房价数据集.xlsx
- 贝叶斯分类器数据集wine.rar
- 机器学习8-朴素贝叶斯:数据集与
评论
共有 条评论