• 大小: 3.41KB
    文件类型: .py
    金币: 1
    下载: 0 次
    发布日期: 2021-01-30
  • 语言: Python
  • 标签: 实战  爬虫  

资源简介

租房爬虫实战

资源截图

代码片段和文件信息

import requests
from bs4 import BeautifulSoup
import pandas as pd
from sqlalchemy import create_engine
import re


headers = {
    ‘User-Agent‘: ‘Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:39.0) Gecko/20100101 Firefox/39.0‘
    ‘Accept‘: ‘text/htmlapplication/xhtml+xmlapplication/xml;q=0.9*/*;q=0.8‘
    ‘Accept-Language‘: ‘en-USen;q=0.5‘
    ‘Accept-Encoding‘: ‘gzip deflate‘
    ‘Connection‘: ‘keep-alive‘
}
xingzhengqu = [‘tianhe‘ ‘yuexiu‘ ‘liwan‘ ‘haizhu‘ ‘panyu‘ ‘baiyun‘ ‘huangpugz‘ ‘zengcheng‘ ‘huadou‘ ‘nansha‘]
xingzhengqu_cn = [‘天河‘ ‘越秀‘ ‘荔湾‘ ‘海珠‘ ‘番禺‘ ‘白云‘ ‘黄埔‘ ‘增城‘ ‘花都‘ ‘南沙‘]


def get_url(url page):
    html = requests.get(url + ‘/pg%s‘ % str(page) headers=headers).text
    table = BeautifulSoup(html ‘lxml‘).find(‘div‘ {‘class‘: ‘con-box‘}).find_all(‘

评论

共有 条评论