资源简介
北京空气质量数据处理同学们好,与本周内容相关的作业如下,完成后将整个项目(rar或zip格式)提交,压缩包名要求为 "ID-作业序号"!
相关数据在百度网盘中
链接:https://pan.baidu.com/s/1jxa91x_2_8zysjmsAtcwNQ
提取码:lwwx
代码片段和文件信息
import numpy as np
import pandas as pd
# 打开文件
FileNameStr = ‘BeijingPM20100101_20151231.csv‘
df = pd.read_csv(FileNameStr encoding=‘utf-8‘)
# 禁止省略列信息
pd.set_option(‘display.max_columns‘ None)
# 打印信息
print(“--------------head--------------“)
print(df.head())
print(“------------describe------------“)
print(df.describe())
print(“--------------info--------------“)
print(df.info())
print(“================================“)
# 打开文件,仅读取第7至第10列
FileNameStr = ‘BeijingPM20100101_20151231.csv‘
df = pd.read_csv(FileNameStr encoding=‘utf-8‘ usecols=[6 7 8 9])
# 打印信息
# 总行数
print(“Total of rows: {}“.format(len(df.index)))
# 显示某列缺失值个数
# print(“The number of missing data in PM_Dongsi: {}“.format(len(df.index) - len(df[‘PM_Dongsi‘].dropna())))
# 为了书写简便,使用循环,遍历所有列,获得每列缺失值个数
for col in df:
#dropna()会去除缺省值的数据,遂得到每列的缺失数据数
print(“The number of missing data in {}: {}“.format(col len(df.index) - len(df[col].dropna())))
# 获取所有列均为缺失值的行的个数,how=‘all‘是限定所有列均为缺省值
print(“The number of missing data in BOTH: “ len(df.index) - len(df.dropna(how=‘all‘)))
#解决问题1,答案输入到PM_Beijing1.csv
# 打开文件,仅读取第7至第10列
FileNameStr = ‘BeijingPM20100101_20151231.csv‘
df = pd.read_csv(FileNameStr encoding=‘utf-8‘ usecols=[1 6 7 8 9])
# 新建平均值列,并将平均值写入
# 其中,iloc[: 1:5]指第2到第5列,mean(axis=1)为求行平均值
df[‘PM_ave‘] = df.iloc[: 1:5].mean(axis=1)
# 保存到文件,其中以‘year‘分组,计算‘PM_ave‘列的平均值。
df.groupby(‘year‘)[‘PM_ave‘].mean().to_csv(“PM_Beijing1.csv“)
# 为方便,再打印一份
print(df.groupby(‘year‘)[‘PM_ave‘].mean())
#解决问题2,答案输入到PM_Beijing2.csv
# 打开文件,仅读取第7至第10列
FileNameStr = ‘BeijingPM20100101_20151231.csv‘
df = pd.read_csv(FileNameStr encoding=‘utf-8‘ usecols=[1 2 6 7 8 9])
# 新建平均值列,并将平均值写入
# 其中,iloc[: 2:6]指第3到第6列,mean(axis=1)为求行平均值
df[‘PM_ave‘] = df.iloc[: 2:6].mean(axis=1)
# 保存到文件,其中以‘year‘和‘month‘分组,计算‘PM_ave‘列的平均值。
df.groupby([‘year‘ ‘month‘])[‘PM_ave‘].mean().to_csv(“PM_Beijing2.csv“)
# 为方便,再打印一份
print(df.groupby([‘year‘ ‘month‘])[‘PM_ave‘].mean())
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2020-05-19 23:08 北京空气质量\
目录 0 2020-05-19 23:07 北京空气质量\PM_BeiJing\
文件 33960588 2020-05-19 23:07 北京空气质量\PM_BeiJing.zip
目录 0 2020-05-19 23:12 北京空气质量\PM_BeiJing\.idea\
目录 0 2020-05-18 16:14 北京空气质量\PM_BeiJing\.idea\inspectionProfiles\
文件 174 2020-05-18 10:10 北京空气质量\PM_BeiJing\.idea\inspectionProfiles\profiles_settings.xm
文件 201 2020-05-18 10:10 北京空气质量\PM_BeiJing\.idea\misc.xm
文件 279 2020-05-18 10:10 北京空气质量\PM_BeiJing\.idea\modules.xm
文件 361 2020-05-18 10:10 北京空气质量\PM_BeiJing\.idea\PM_BeiJing.iml
文件 10010 2020-05-19 23:12 北京空气质量\PM_BeiJing\.idea\workspace.xm
文件 3173618 2020-04-07 10:30 北京空气质量\PM_BeiJing\BeijingPM20100101_20151231.csv
文件 157 2020-05-18 16:22 北京空气质量\PM_BeiJing\PM_Beijing1.csv
文件 1913 2020-05-18 16:22 北京空气质量\PM_BeiJing\PM_Beijing2.csv
文件 2573 2020-05-18 12:00 北京空气质量\PM_BeiJing\statistics.py
目录 0 2020-05-18 16:15 北京空气质量\PM_BeiJing\venv\
目录 0 2020-05-18 09:48 北京空气质量\PM_BeiJing\venv\Include\
目录 0 2020-05-18 16:14 北京空气质量\PM_BeiJing\venv\Lib\
目录 0 2020-05-18 16:15 北京空气质量\PM_BeiJing\venv\Lib\site-packages\
目录 0 2020-05-18 16:14 北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\
文件 2684 2020-05-18 10:04 北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\easter.py
目录 0 2020-05-18 16:14 北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\parser\
文件 13098 2020-05-18 10:04 北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\parser\isoparser.py
文件 58804 2020-05-18 10:04 北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\parser\_parser.py
文件 1766 2020-05-18 10:04 北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\parser\__init__.py
目录 0 2020-05-18 16:14 北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\parser\__pycache__\
文件 11132 2020-05-18 10:04 北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\parser\__pycache__\isoparser.cpython-37.pyc
文件 40056 2020-05-18 10:04 北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\parser\__pycache__\_parser.cpython-37.pyc
文件 2085 2020-05-18 10:04 北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\parser\__pycache__\__init__.cpython-37.pyc
文件 24904 2020-05-18 10:04 北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\relativedelta.py
文件 66514 2020-05-18 10:04 北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\rrule.py
目录 0 2020-05-18 16:14 北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\tz\
............此处省略3979个文件信息
- 上一篇:杨淑英版《电力系统分析复习指导与习题精编》
- 下一篇:微信小程序商城无后台源码
相关资源
- DC-DC开关变换器的建模与设计 [解光军
- 山东大学软件学院机器学习期末复习
- Labview大学实用教程第三版
- 信息论、推理与学习算法 翻译版
- 数据链路层协议设计[BUPT]计算机网络
- 西北工业大学821自动控制原理初试课
- torch-1.1.0-cp36-cp36m-win_amd64.rar
- 网易云课堂 Andrew Ng 深度学习Class1-C
- 医学影像工作站.exe
- 战德臣 大学计算机:计算思维导论
- 统计推断高清中文
- 人大版统计学+学习指导书第6版贾俊平
- 山东大学数据库考试复习资料
- 软件工程课程设计-学生成绩管理系统
- ANSYS CFX 14.0超级学习手册[扫描版PDF电
- Statistically Sound Machine Learning for Algor
- 解读51单片机完全学习与应用完整版
- 150分学姐考研线性代数笔记-融合线代
- 思科网络技术学院教程CCNA Exploration
- Introduction to Linear Algebra 5th edition 高清
- Handbook of mathematical functions--数学函数
- 北京邮电大学大三计算机体系结构资
- 学习OpenCV中文版(高清扫描版)()
- 山东大学软件学院人机交互实验源码
- 深度学习框架PyTorch:入门与实践_陈云
- Fluid Mechanics 第八版
- 数字电子技术 康华光第六版 书本教
- 数字图像处理_冈萨雷斯第三版_中文版
- 程序员的数学(3册完整版)
- 剑桥学习科学手册(中文版).pdf
评论
共有 条评论