资源简介
此资源用xpath的方法来解析网页的内容,详细的介绍了下载网页、解析数据、将数据存入表格的过程。希望能给到你借鉴。
代码片段和文件信息
# -*- coding:utf-8 -*-
import requests
from fake_useragent import UserAgent
agent=UserAgent()
#当用到xpath时需要引入此包
from lxml import etree
#下载
url=“http://search.51job.com/list/010000%252C020000%252C180200%252C200200000000000000999python21.html?lang=c&stype=&postchannel=0000&workyear=99&cotype=99°reefrom=99&jobterm=99&companysize=99&providesalary=99&lonlat=0%2C0&radius=-1&ord_field=0&confirmdate=9&fromType=&dibiaoid=0&address=&line=&specialarea=00&from=&welfare=“
response = requests.get(url
headers = {“User-Agent“:agent.random}
)
#设置编码格式
response.encoding=response.apparent_encoding
# 解析
# root可理解为网页本身
root = etree.HTML(response.text)
#用xpath返回的是一个列表
div_list = root.xpath(‘//div[@class=“dw_table
- 上一篇:Python爬取小说网站信息并存储到数据库
- 下一篇:cpso py文件代码
相关资源
- python一个打砖块的小游戏
- python实验指导书 图文高清版
- python主动安装第三方库
- python爬取豆瓣top250电影信息
- python绘制 大蟒蛇
- python小程序(数组排序)
- Python去水印(基于cv2)
- Python 数据结构入门 - 二叉搜索树(
- python空心电感计算器
- python除法.docx
- 抽奖背后的秘密(python抽奖逻辑)
- 绘制统计学直方图茎叶图(matplotlib)
- python求解标准差
- python数据分析与处理
- 利用Python将照片在Excel中利用点阵图显
- python turtle 跳房子
- python 人群计数
- Python调用第三方API换脸
- “去哪儿吃”帮你选餐厅(python代码
- python 控制台登陆密码验证
- KNN算法的Python实现(datingrecd.ipynb)
- python核心编程第二版-习题答案
- python爬取笔趣阁小说
- Python程序设计基础试题以及答案(3
- python聊天-服务端与客户端
- python递归求最大公约数
- 用python画皮卡丘(基于turtle)
- 伟哥的python私房菜(中国程序员).
- pip一键升级(python脚本)
- 我的世界python编程——天空行走py格式
评论
共有 条评论