• 大小: 64.92MB
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2022-09-01
  • 语言: 其他
  • 标签: 学堂在线  

资源简介

北京空气质量数据处理同学们好,与本周内容相关的作业如下,完成后将整个项目(rar或zip格式)提交,压缩包名要求为 "ID-作业序号"! 相关数据在百度网盘中 链接:https://pan.baidu.com/s/1jxa91x_2_8zysjmsAtcwNQ 提取码:lwwx

资源截图

代码片段和文件信息

import numpy as np
import pandas as pd

# 打开文件
FileNameStr = ‘BeijingPM20100101_20151231.csv‘
df = pd.read_csv(FileNameStr encoding=‘utf-8‘)

# 禁止省略列信息
pd.set_option(‘display.max_columns‘ None)
# 打印信息
print(“--------------head--------------“)
print(df.head())
print(“------------describe------------“)
print(df.describe())
print(“--------------info--------------“)
print(df.info())
print(“================================“)

# 打开文件,仅读取第7至第10列
FileNameStr = ‘BeijingPM20100101_20151231.csv‘
df = pd.read_csv(FileNameStr encoding=‘utf-8‘ usecols=[6 7 8 9])

# 打印信息

# 总行数
print(“Total of rows: {}“.format(len(df.index)))

# 显示某列缺失值个数
# print(“The number of missing data in PM_Dongsi: {}“.format(len(df.index) - len(df[‘PM_Dongsi‘].dropna())))
# 为了书写简便,使用循环,遍历所有列,获得每列缺失值个数
for col in df:
    #dropna()会去除缺省值的数据,遂得到每列的缺失数据数
    print(“The number of missing data in {}: {}“.format(col len(df.index) - len(df[col].dropna())))

# 获取所有列均为缺失值的行的个数,how=‘all‘是限定所有列均为缺省值
print(“The number of missing data in BOTH: “ len(df.index) - len(df.dropna(how=‘all‘)))

#解决问题1,答案输入到PM_Beijing1.csv
# 打开文件,仅读取第7至第10列
FileNameStr = ‘BeijingPM20100101_20151231.csv‘
df = pd.read_csv(FileNameStr encoding=‘utf-8‘ usecols=[1 6 7 8 9])

# 新建平均值列,并将平均值写入
# 其中,iloc[: 1:5]指第2到第5列,mean(axis=1)为求行平均值
df[‘PM_ave‘] = df.iloc[: 1:5].mean(axis=1)
# 保存到文件,其中以‘year‘分组,计算‘PM_ave‘列的平均值。
df.groupby(‘year‘)[‘PM_ave‘].mean().to_csv(“PM_Beijing1.csv“)
# 为方便,再打印一份
print(df.groupby(‘year‘)[‘PM_ave‘].mean())






#解决问题2,答案输入到PM_Beijing2.csv
# 打开文件,仅读取第7至第10列
FileNameStr = ‘BeijingPM20100101_20151231.csv‘
df = pd.read_csv(FileNameStr encoding=‘utf-8‘ usecols=[1 2 6 7 8 9])

# 新建平均值列,并将平均值写入
# 其中,iloc[: 2:6]指第3到第6列,mean(axis=1)为求行平均值
df[‘PM_ave‘] = df.iloc[: 2:6].mean(axis=1)
# 保存到文件,其中以‘year‘和‘month‘分组,计算‘PM_ave‘列的平均值。
df.groupby([‘year‘ ‘month‘])[‘PM_ave‘].mean().to_csv(“PM_Beijing2.csv“)
# 为方便,再打印一份
print(df.groupby([‘year‘ ‘month‘])[‘PM_ave‘].mean())

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2020-05-19 23:08  北京空气质量\
     目录           0  2020-05-19 23:07  北京空气质量\PM_BeiJing\
     文件    33960588  2020-05-19 23:07  北京空气质量\PM_BeiJing.zip
     目录           0  2020-05-19 23:12  北京空气质量\PM_BeiJing\.idea\
     目录           0  2020-05-18 16:14  北京空气质量\PM_BeiJing\.idea\inspectionProfiles\
     文件         174  2020-05-18 10:10  北京空气质量\PM_BeiJing\.idea\inspectionProfiles\profiles_settings.xml
     文件         201  2020-05-18 10:10  北京空气质量\PM_BeiJing\.idea\misc.xml
     文件         279  2020-05-18 10:10  北京空气质量\PM_BeiJing\.idea\modules.xml
     文件         361  2020-05-18 10:10  北京空气质量\PM_BeiJing\.idea\PM_BeiJing.iml
     文件       10010  2020-05-19 23:12  北京空气质量\PM_BeiJing\.idea\workspace.xml
     文件     3173618  2020-04-07 10:30  北京空气质量\PM_BeiJing\BeijingPM20100101_20151231.csv
     文件         157  2020-05-18 16:22  北京空气质量\PM_BeiJing\PM_Beijing1.csv
     文件        1913  2020-05-18 16:22  北京空气质量\PM_BeiJing\PM_Beijing2.csv
     文件        2573  2020-05-18 12:00  北京空气质量\PM_BeiJing\statistics.py
     目录           0  2020-05-18 16:15  北京空气质量\PM_BeiJing\venv\
     目录           0  2020-05-18 09:48  北京空气质量\PM_BeiJing\venv\Include\
     目录           0  2020-05-18 16:14  北京空气质量\PM_BeiJing\venv\Lib\
     目录           0  2020-05-18 16:15  北京空气质量\PM_BeiJing\venv\Lib\site-packages\
     目录           0  2020-05-18 16:14  北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\
     文件        2684  2020-05-18 10:04  北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\easter.py
     目录           0  2020-05-18 16:14  北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\parser\
     文件       13098  2020-05-18 10:04  北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\parser\isoparser.py
     文件       58804  2020-05-18 10:04  北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\parser\_parser.py
     文件        1766  2020-05-18 10:04  北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\parser\__init__.py
     目录           0  2020-05-18 16:14  北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\parser\__pycache__\
     文件       11132  2020-05-18 10:04  北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\parser\__pycache__\isoparser.cpython-37.pyc
     文件       40056  2020-05-18 10:04  北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\parser\__pycache__\_parser.cpython-37.pyc
     文件        2085  2020-05-18 10:04  北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\parser\__pycache__\__init__.cpython-37.pyc
     文件       24904  2020-05-18 10:04  北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\relativedelta.py
     文件       66514  2020-05-18 10:04  北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\rrule.py
     目录           0  2020-05-18 16:14  北京空气质量\PM_BeiJing\venv\Lib\site-packages\dateutil\tz\
............此处省略3979个文件信息

评论

共有 条评论