• 大小: 0.32M
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2021-09-14
  • 语言: 其他
  • 标签: 其他  

资源简介

2019_nCoV.zip

资源截图

代码片段和文件信息

#!/usr/bin/env python
# coding: utf-8

# + 数据源 [腾讯疫情实时追踪](https://news.qq.com/zt2020/page/feiyan.htm?from=timeline&isappinstalled=0)

# ### 第一部分 网页分析

# ### 第二部分 数据准备

# #### 导入模块

import time 
import json
import requests
from datetime import datetime
import pandas as pd 
import numpy as np 


# #### 抓取数据

def catch_data():
    url = ‘https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5‘
    reponse = requests.get(url=url).json()
    #返回数据字典
    data = json.loads(reponse[‘data‘])
    return data


data = catch_data()
data.keys()


# #### 数据处理

# 数据集包括[“国内总量““国内新增““更新时间““数据明细““每日数据““每日新增“]

lastUpdateTime = data[‘lastUpdateTime‘]
chinaTotal = data[‘chinaTotal‘]
chinaAdd = data[‘chinaAdd‘]
print(chinaTotal)
print(chinaAdd)


# ##### 国内数据处理 第一步
# 数据明细,数据结构比较复杂,一步一步打印出来看,先明白数据结构
areaTree = data[‘areaTree‘]
# 国内数据
china_data = areaTree[0][‘children‘]
china_list = []
for a in range(len(china_data)):
    province = china_data[a][‘name‘]
    province_list = china_data[a][‘children‘]
    for b in range(len(province_list)):
        city = province_list[b][‘name‘]
        total = province_list[b][‘total‘]
        today = province_list[b][‘today‘]
        china_dict = {}
        china_dict[‘province‘] = province
        china_dict[‘city‘] = city
        china_dict[‘total‘] = total
        china_dict[‘today‘] = today
        china_list.append(china_dict)
        
china_data = pd.Dataframe(china_list)
china_data.head()


# ##### 国内数据处理 第二步

# 定义数据处理函数
def confirm(x):
    confirm = eval(str(x))[‘confirm‘]
    return confirm
def suspect(x):
    suspect = eval(str(x))[‘suspect‘]
    return suspect
def dead(x):
    dead = eval(str(x))[‘dead‘]
    return dead
def heal(x):
    heal =  eval(str(x))[‘heal‘]
    return heal
# 函数映射
china_data[‘confirm‘] = china_data[‘total‘].map(confirm)
china_data[‘suspect‘] = china_data[‘total‘].map(suspect)
china_data[‘dead‘] = china_data[‘total‘].map(dead)
china_data[‘heal‘] = china_data[‘total‘].map(heal)
china_data[‘addconfirm‘] = china_data[‘today‘].map(confirm)
china_data[‘addsuspect‘] = china_data[‘today‘].map(suspect)
china_data[‘adddead‘] = china_data[‘today‘].map(dead)
china_data[‘addheal‘] = china_data[‘today‘].map(heal)
china_data = china_data[[“province““city““confirm““suspect““dead““heal““addconfirm““addsuspect““adddead““addheal“]]
china_data.head()


# ##### 国际数据处理

global_data = pd.Dataframe(data[‘areaTree‘])
global_data[‘confirm‘] = global_data[‘total‘].map(confirm)
global_data[‘suspect‘] = global_data[‘total‘].map(suspect)
global_data[‘dead‘] = global_data[‘total‘].map(dead)
global_data[‘heal‘] = global_data[‘total‘].map(heal)
global_data[‘addconfirm‘] = global_data[‘today‘].map(confirm)
global_data[‘addsuspect‘] = global_data[‘today‘].map(suspect)
global_data[‘adddead‘] = global_data[‘today‘].map(dead)
global_data[‘addheal‘] = global_data[‘today‘].map(heal)
world_name = pd.read_excel(“世界各国中英文对照.xlsx“)
global_data = pd.merge(global_dataworld_nameleft_on =“name“right_on = “中文“how=“inner“)
global_d

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     文件       40772  2020-02-03 12:04  2019_nCoV 可视化.html
     文件      397720  2020-02-03 11:56  2019_nCoV 可视化2.0.ipynb
     文件        8124  2020-02-03 12:03  2019_nCoV 可视化2.0.py
     文件       55874  2020-02-03 11:46  2019_nCoV.ipynb
     文件       98890  2020-01-30 14:17  2019_nCoV_预测(无实际意义).ipynb
     文件        6325  2020-02-02 18:21  daily_data.xlsx
     文件       16095  2020-01-29 17:34  世界各国中英文对照.xlsx

评论

共有 条评论