资源简介
2019_nCoV.zip
代码片段和文件信息
#!/usr/bin/env python
# coding: utf-8
# + 数据源 [腾讯疫情实时追踪](https://news.qq.com/zt2020/page/feiyan.htm?from=timeline&isappinstalled=0)
# ### 第一部分 网页分析
# ### 第二部分 数据准备
# #### 导入模块
import time
import json
import requests
from datetime import datetime
import pandas as pd
import numpy as np
# #### 抓取数据
def catch_data():
url = ‘https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5‘
reponse = requests.get(url=url).json()
#返回数据字典
data = json.loads(reponse[‘data‘])
return data
data = catch_data()
data.keys()
# #### 数据处理
# 数据集包括[“国内总量““国内新增““更新时间““数据明细““每日数据““每日新增“]
lastUpdateTime = data[‘lastUpdateTime‘]
chinaTotal = data[‘chinaTotal‘]
chinaAdd = data[‘chinaAdd‘]
print(chinaTotal)
print(chinaAdd)
# ##### 国内数据处理 第一步
# 数据明细,数据结构比较复杂,一步一步打印出来看,先明白数据结构
areaTree = data[‘areaTree‘]
# 国内数据
china_data = areaTree[0][‘children‘]
china_list = []
for a in range(len(china_data)):
province = china_data[a][‘name‘]
province_list = china_data[a][‘children‘]
for b in range(len(province_list)):
city = province_list[b][‘name‘]
total = province_list[b][‘total‘]
today = province_list[b][‘today‘]
china_dict = {}
china_dict[‘province‘] = province
china_dict[‘city‘] = city
china_dict[‘total‘] = total
china_dict[‘today‘] = today
china_list.append(china_dict)
china_data = pd.Dataframe(china_list)
china_data.head()
# ##### 国内数据处理 第二步
# 定义数据处理函数
def confirm(x):
confirm = eval(str(x))[‘confirm‘]
return confirm
def suspect(x):
suspect = eval(str(x))[‘suspect‘]
return suspect
def dead(x):
dead = eval(str(x))[‘dead‘]
return dead
def heal(x):
heal = eval(str(x))[‘heal‘]
return heal
# 函数映射
china_data[‘confirm‘] = china_data[‘total‘].map(confirm)
china_data[‘suspect‘] = china_data[‘total‘].map(suspect)
china_data[‘dead‘] = china_data[‘total‘].map(dead)
china_data[‘heal‘] = china_data[‘total‘].map(heal)
china_data[‘addconfirm‘] = china_data[‘today‘].map(confirm)
china_data[‘addsuspect‘] = china_data[‘today‘].map(suspect)
china_data[‘adddead‘] = china_data[‘today‘].map(dead)
china_data[‘addheal‘] = china_data[‘today‘].map(heal)
china_data = china_data[[“province““city““confirm““suspect““dead““heal““addconfirm““addsuspect““adddead““addheal“]]
china_data.head()
# ##### 国际数据处理
global_data = pd.Dataframe(data[‘areaTree‘])
global_data[‘confirm‘] = global_data[‘total‘].map(confirm)
global_data[‘suspect‘] = global_data[‘total‘].map(suspect)
global_data[‘dead‘] = global_data[‘total‘].map(dead)
global_data[‘heal‘] = global_data[‘total‘].map(heal)
global_data[‘addconfirm‘] = global_data[‘today‘].map(confirm)
global_data[‘addsuspect‘] = global_data[‘today‘].map(suspect)
global_data[‘adddead‘] = global_data[‘today‘].map(dead)
global_data[‘addheal‘] = global_data[‘today‘].map(heal)
world_name = pd.read_excel(“世界各国中英文对照.xlsx“)
global_data = pd.merge(global_dataworld_nameleft_on =“name“right_on = “中文“how=“inner“)
global_d
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 40772 2020-02-03 12:04 2019_nCoV 可视化.html
文件 397720 2020-02-03 11:56 2019_nCoV 可视化2.0.ipynb
文件 8124 2020-02-03 12:03 2019_nCoV 可视化2.0.py
文件 55874 2020-02-03 11:46 2019_nCoV.ipynb
文件 98890 2020-01-30 14:17 2019_nCoV_预测(无实际意义).ipynb
文件 6325 2020-02-02 18:21 daily_data.xlsx
文件 16095 2020-01-29 17:34 世界各国中英文对照.xlsx
相关资源
- 数据分析就压板.txt
- SpringBoot实战与原理分析视频课程(
- LEMS.zip
- 协议分析.doc
- 采用遗传粒子群GAPSO和混沌粒子群CP
- 16PSK系统仿真及误码率性能分析.pdf
- 社区管理系统需求分析文档
- 第2篇-第4版M文件.zip
- 2009试卷人工智能.pdf
- 原理图源代码Proteus仿真.zip
- zw_xielingyue1987-2431008-.zip
- 双二阶RC有源带通滤波器分析_附Mult
- 往年卷子.zip
- 43t9sb.rar
- 1fporp.rar
- 2015年逻辑控制赛项思路分析.pdf
- Bilibili竞对分析20200508.pdf
- 多元统计分析程序.rar
- tuosanqian1575_10300922.zip
- MIKEZERO2014_.rar
- zw_hello3222-8745847-语义分析及中间代码
- kay-仓库管理系统.zip
- 梯控数据分析.rar
- exapowerflow5.3c特别版(附破解教程破解
- Y---腾讯大牛亲授Web前后端漏洞分析与
- ofdmproj_win.rar
- 从零进阶!数据分析的统计基础.txt
- 电子负载.rar
- 谷歌.zip
- 康拓系统分析(1).rar
评论
共有 条评论