资源简介
租房爬虫实战
代码片段和文件信息
import requests
from bs4 import BeautifulSoup
import pandas as pd
from sqlalchemy import create_engine
import re
headers = {
‘User-Agent‘: ‘Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:39.0) Gecko/20100101 Firefox/39.0‘
‘Accept‘: ‘text/htmlapplication/xhtml+xmlapplication/xml;q=0.9*/*;q=0.8‘
‘Accept-Language‘: ‘en-USen;q=0.5‘
‘Accept-Encoding‘: ‘gzip deflate‘
‘Connection‘: ‘keep-alive‘
}
xingzhengqu = [‘tianhe‘ ‘yuexiu‘ ‘liwan‘ ‘haizhu‘ ‘panyu‘ ‘baiyun‘ ‘huangpugz‘ ‘zengcheng‘ ‘huadou‘ ‘nansha‘]
xingzhengqu_cn = [‘天河‘ ‘越秀‘ ‘荔湾‘ ‘海珠‘ ‘番禺‘ ‘白云‘ ‘黄埔‘ ‘增城‘ ‘花都‘ ‘南沙‘]
def get_url(url page):
html = requests.get(url + ‘/pg%s‘ % str(page) headers=headers).text
table = BeautifulSoup(html ‘lxml‘).find(‘div‘ {‘class‘: ‘con-box‘}).find_all(‘
相关资源
- 《Python3爬虫、数据清洗与可视化》
- 《Python开发实战》(PDF版高清扫描版
- Selenium2 Python自动化测试实战第二版高
- 《selenium2 python 自动化测试实战第二版
- 跟老齐学python:django实战 源代码
- Python爬虫项目-12306票务查询
- 从零开始学Python网络爬虫所有源代码
- Python爬虫教程基于Python3.X
- Python高效开发实战——Django、Tornado、
- python 自然语言处理实战代码部分
- FlaskWeb开发:基于Python的Web应用开发实
- 用Python写网络爬虫PDF&源码
- 完整书签PySpark实战指南:利用Python和
- Python编程:从入门到实践(超清版)
- keras快速上手 基于python深度学习实战
- 《机器学习实战》python3完美运行代码
- Python网络爬虫与信息提取课件
- SELENIUM2自动化测试实战基于PYTHON语言
- Selenium 2自动化测试实战 基于Python语言
- Hands-On Transfer Learning with Python带书签
- python三剑客
- Python爬虫开发项目实战电子书 本书为
- Flask Web开发 基于Python的Web应用开发实
- Python+Spark 2.0+Hadoop机器学习与大数据实
- 《Python爬虫开发与项目实战》pdf+源码
- 《Python 3爬虫、数据清洗与可视化实战
- Python数据分析实战中英文都有—内利
- 23个Python爬虫项目
- python3爬虫资料
- 《Django企业开发实战高效PythonWeb框架
评论
共有 条评论