资源简介
2019_nCoV.zip
代码片段和文件信息
#!/usr/bin/env python
# coding: utf-8
# + 数据源 [腾讯疫情实时追踪](https://news.qq.com/zt2020/page/feiyan.htm?from=timeline&isappinstalled=0)
# ### 第一部分 网页分析
# ### 第二部分 数据准备
# #### 导入模块
import time
import json
import requests
from datetime import datetime
import pandas as pd
import numpy as np
# #### 抓取数据
def catch_data():
url = ‘https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5‘
reponse = requests.get(url=url).json()
#返回数据字典
data = json.loads(reponse[‘data‘])
return data
data = catch_data()
data.keys()
# #### 数据处理
# 数据集包括[“国内总量““国内新增““更新时间““数据明细““每日数据““每日新增“]
lastUpdateTime = data[‘lastUpdateTime‘]
chinaTotal = data[‘chinaTotal‘]
chinaAdd = data[‘chinaAdd‘]
print(chinaTotal)
print(chinaAdd)
# ##### 国内数据处理 第一步
# 数据明细,数据结构比较复杂,一步一步打印出来看,先明白数据结构
areaTree = data[‘areaTree‘]
# 国内数据
china_data = areaTree[0][‘children‘]
china_list = []
for a in range(len(china_data)):
province = china_data[a][‘name‘]
province_list = china_data[a][‘children‘]
for b in range(len(province_list)):
city = province_list[b][‘name‘]
total = province_list[b][‘total‘]
today = province_list[b][‘today‘]
china_dict = {}
china_dict[‘province‘] = province
china_dict[‘city‘] = city
china_dict[‘total‘] = total
china_dict[‘today‘] = today
china_list.append(china_dict)
china_data = pd.Dataframe(china_list)
china_data.head()
# ##### 国内数据处理 第二步
# 定义数据处理函数
def confirm(x):
confirm = eval(str(x))[‘confirm‘]
return confirm
def suspect(x):
suspect = eval(str(x))[‘suspect‘]
return suspect
def dead(x):
dead = eval(str(x))[‘dead‘]
return dead
def heal(x):
heal = eval(str(x))[‘heal‘]
return heal
# 函数映射
china_data[‘confirm‘] = china_data[‘total‘].map(confirm)
china_data[‘suspect‘] = china_data[‘total‘].map(suspect)
china_data[‘dead‘] = china_data[‘total‘].map(dead)
china_data[‘heal‘] = china_data[‘total‘].map(heal)
china_data[‘addconfirm‘] = china_data[‘today‘].map(confirm)
china_data[‘addsuspect‘] = china_data[‘today‘].map(suspect)
china_data[‘adddead‘] = china_data[‘today‘].map(dead)
china_data[‘addheal‘] = china_data[‘today‘].map(heal)
china_data = china_data[[“province““city““confirm““suspect““dead““heal““addconfirm““addsuspect““adddead““addheal“]]
china_data.head()
# ##### 国际数据处理
global_data = pd.Dataframe(data[‘areaTree‘])
global_data[‘confirm‘] = global_data[‘total‘].map(confirm)
global_data[‘suspect‘] = global_data[‘total‘].map(suspect)
global_data[‘dead‘] = global_data[‘total‘].map(dead)
global_data[‘heal‘] = global_data[‘total‘].map(heal)
global_data[‘addconfirm‘] = global_data[‘today‘].map(confirm)
global_data[‘addsuspect‘] = global_data[‘today‘].map(suspect)
global_data[‘adddead‘] = global_data[‘today‘].map(dead)
global_data[‘addheal‘] = global_data[‘today‘].map(heal)
world_name = pd.read_excel(“世界各国中英文对照.xlsx“)
global_data = pd.merge(global_dataworld_nameleft_on =“name“right_on = “中文“how=“inner“)
global_d
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 40772 2020-02-03 12:04 2019_nCoV 可视化.html
文件 397720 2020-02-03 11:56 2019_nCoV 可视化2.0.ipynb
文件 8124 2020-02-03 12:03 2019_nCoV 可视化2.0.py
文件 55874 2020-02-03 11:46 2019_nCoV.ipynb
文件 98890 2020-01-30 14:17 2019_nCoV_预测(无实际意义).ipynb
文件 6325 2020-02-02 18:21 daily_data.xlsx
文件 16095 2020-01-29 17:34 世界各国中英文对照.xlsx
相关资源
- Listary Pro 破解最新版
- Allway Sync Pro 10.5.8注册码 序列号 激活
- 百度文库破解软件
- winfrom自定义设计器源码
- 操作系统哲学家就餐问题(界面+源码
- 康耐视电子表格实战
- getdata破解补丁
- 一键反修复远程桌面.rar
- STM32F407ZGT6实现HAL库硬件I2C读写EEPROM功
- arcGis10.2
- PS技术 在学校里 学三年 也学不到这么
- Hi3520D300 硬件设计用户指南
- Hi3536 Linux开发环境用户指南
- activiti-explorer流程图设计器汉化文件
- 数据库课程设计停车场管理系统
- m×n的长方阵迷宫问题完美求解
- 针对MPLAB® X IDE使用PICKit™ 3在线调
- 东软股份教育事业部解决方案
- 东软数字化校园网解决方案成功应用
- 奶瓶(beini)无限免费破解增强版 使
- 交通灯multisim仿真(附图)
- powerdesigner 15.1 license key
- powerdesigner15.0的注册码license key
- visio软件64位破解版本
- Internet Explorer 11 Windows 系统 各版本
-
开机速度优化工具Startup Dela
yer3.0中 - tomcat 8.0 32位 绿色版
- 四路抢答器
- SolidWorks-100多个
- delphi源码-检测是否运行了多个程序
评论
共有 条评论