资源简介
1.python爬虫爬取拉勾网的python招聘信息
2.对招聘信息进行可视化分析
3.学历要求占比图
4.经验要求-平均月薪分布图
5.学历要求占比图
代码片段和文件信息
#!/usr/bin/env python
# encoding: utf-8
#条形图
#导入绘图模块
import matplotlib.pyplot as plt
import pandas as pd
# 读取excel数据
data = pd.read_excel(“Excel_test.xls“usecols = [3])
# 转化成列表
df_li = data.values.tolist()
# 空列表
results = []
# 列表中提取数据到results
for s_li in df_li:
results.append(s_li[0])
# 统计列表中相同项的个数组成词典
def all_list(arr):
result = {}
for i in set(arr):
result[i] = arr.count(i)
return result
# 统计列表中相同项的个数组成词典
all_lists = all_list(results)
#解决中文显示问题
plt.rcParams[‘font.sans-serif‘] = [‘KaiTi‘] # 指定默认字体
plt.rcParams[‘axes.unicode_minus‘] = False # 解决保存图像是负号‘-‘显示为方块的问题
#案例1:直辖市GDP水平
#构建数据
GDP=all_lists.values()
print(GDP)
#绘图
plt.bar(range(len(GDP))GDP align=‘center‘color=‘steelblue‘alpha=0.8)
#添加轴标签
plt.ylabel(‘职位数‘
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2020-03-18 20:03 爬取拉勾网\
目录 0 2020-03-18 20:26 爬取拉勾网\.idea\
目录 0 2020-03-18 19:56 爬取拉勾网\.idea\inspectionProfiles\
文件 296 2020-03-18 19:56 爬取拉勾网\.idea\misc.xm
文件 294 2020-03-18 19:56 爬取拉勾网\.idea\modules.xm
文件 455 2020-03-18 19:58 爬取拉勾网\.idea\Python爬取拉勾网.iml
文件 7986 2020-03-18 20:26 爬取拉勾网\.idea\workspace.xm
文件 1379 2020-03-15 15:47 爬取拉勾网\City_Job.py
文件 1715 2020-03-15 15:50 爬取拉勾网\City_Pay.py
文件 916 2020-03-15 11:54 爬取拉勾网\Education.py
文件 1769 2020-03-15 15:55 爬取拉勾网\Education_Pay.py
文件 71680 2020-03-18 20:09 爬取拉勾网\Excel_test.xls
文件 1130 2020-03-15 15:55 爬取拉勾网\Job_Experience.py
文件 1978 2020-03-15 15:55 爬取拉勾网\Job_Pay.py
文件 3152 2020-03-18 20:03 爬取拉勾网\test1.py
目录 0 2020-03-15 18:59 爬取拉勾网\统计图\
文件 29079 2020-03-15 11:28 爬取拉勾网\统计图\City_Job_Bar.png
文件 39282 2020-03-15 13:46 爬取拉勾网\统计图\City_Pay.png
文件 24082 2020-03-15 11:54 爬取拉勾网\统计图\Education.png
文件 21921 2020-03-15 13:28 爬取拉勾网\统计图\Education_Pay.png
文件 25487 2020-03-15 11:54 爬取拉勾网\统计图\Job_Experience.png
文件 24044 2020-03-15 13:22 爬取拉勾网\统计图\Job_Pay.png
文件 15448 2020-03-15 13:47 爬取拉勾网\统计图\招聘网站的数据爬取与分析.docx
相关资源
- 煎蛋网图片爬虫
- 网易云音乐爬虫(亲测通过)
- 分布式scrapy-redis爬虫!糗事百科
- 用Python写网络爬虫.pdf(共35页)
- python爬虫-scrapy框架
- python 爬虫爬取京东代码
- 《用python写网络爬虫》pdf
- python爬虫爬取当当网
- 登陆需要密码以及图片验证的网站 如
- Nodejs实现的一个磁力链接爬虫
- PYTHON爬虫示例21345
- python 爬虫(pyspider)
- python3爬虫采集淘宝商品数据
- python 爬取豌豆荚APP的爬虫
- python 淘宝爬虫抓取天猫数据
-
python 微博爬虫 (lxm
l) - python微博爬虫(scrapy)
- 最简单爬虫
- python 天气网爬虫(爬取天气预报)
- Python网络爬虫与信息提取-北京理工大
- 《用python写网络爬虫》随书源码
- python大文件(爬虫大体积文件模块)
- python 爬虫入门级(BeautifulSoup爬取最好
- 爬虫爬取携程机票信息
- python 数据分析与可视化
- 基于Django2、echarts的爬取智联招聘信息
- QQ空间爬虫QQSpider源码
- python爬虫(爬取新浪微博数据)
- python爬取豆瓣影评
- 《Python网络爬虫实战(胡松涛编著)
评论
共有 条评论