• 大小: 39.76MB
    文件类型: .rar
    金币: 2
    下载: 0 次
    发布日期: 2024-01-29
  • 语言: Python
  • 标签: json  DataV  GeoJson  

资源简介

DataV.GeoAtlas全国GeoJSON省市区县json数据 使用Python(内含py脚本)爬取阿里云DataV的全国省市区县地图包。 官方网址:http://datav.aliyun.com/tools/atlas 支持JSON API和JSON API(包含子区域)两种 JSON API:https://geo.datav.aliyun.com/areas_v2/bound/100000.json JSON API(包含子区域):https://geo.datav.aliyun.com/areas_v2/bound/100000_full.json 更新至2020.08.19

资源截图

代码片段和文件信息

#coding:utf-8

import json
import os
import requests
import time
import random

headers = {
    ‘User-Agent‘: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML like Gecko) Chrome/81.0.4044.138 Safari/537.36‘
    ‘sec-fetch-dest‘: ‘document‘
    ‘sec-fetch-mode‘: ‘navigate‘
    ‘sec-fetch-site‘: ‘none‘
    ‘sec-fetch-user‘: ‘?1‘
    ‘upgrade-insecure-requests‘: ‘1‘
    # ‘cookie‘: ‘cna=+N8uF3jmiAUCAQ7fsc55qjg0; UM_distinctid=171c8ae1dcd545-01fb3d094dbfef-6373664-1fa400-171c8ae1dcedbd; _ga=GA1.2.1551068067.1588209786; login_aliyunid_pk=1959013603573207; login_aliyunid_pks=“BG+4OYw32oIMX+aEnDXB9TqC7ukeb1nlZvUY0OuxeWSDvw=“; aliyun_site=CN; console_base_assets_version=3.11.3; aliyun_choice=CN; l=eB_8AaI4Qn6rHW6zKOfZhurza779dIRfguPzaNbMiOCP911p5IVlBZuauQ89CnGVns6JR3ykIQI6BfLSxPa9h7rpqQXqGl8jPdTh.; tfstk=c8NFB_0SY6CeL_l5HXGyO1wc9ADdZv43rCujK-CRMOIwKqDhiut-SNt-74iAsvf..; isg=BMTEscJ5R40SuvJRpizjaRdQlUK23ehHgI3PDd5lcg9SCWXTBunP1bOrTaHRESCf‘
    ‘cache-control‘: ‘no-cache‘
    ‘accept-language‘: ‘zh-CNzh;q=0.9‘
}

l = [‘北京市‘ ‘天津市‘ ‘上海市‘ ‘重庆市‘ ‘澳门特别行政区‘ ‘香港特别行政区‘ ‘吉林省‘ ‘黑龙江省‘ ‘山东省‘ ‘河北省‘ ‘广东省‘ ‘辽宁省‘ ‘四川省‘ ‘海南省‘ ‘安徽省‘ ‘江西省‘ ‘河南省‘ ‘台湾省‘ ‘陕西省‘ ‘福建省‘ ‘青海省‘ ‘山西省‘ ‘湖北省‘ ‘湖南省‘ ‘贵州省‘ ‘甘肃省‘ ‘江苏省‘ ‘浙江省‘ ‘云南省‘ ‘新疆维吾尔自治区‘ ‘宁夏回族自治区‘ ‘广西壮族自治区‘ ‘内蒙古自治区‘ ‘西藏自治区‘]
# with open(‘10000.json‘ ‘r‘ encoding=‘utf8‘) as f:
#     data = f.read()
#
# data = json.loads(data)
# for i in data[‘features‘]:
#     print(i[‘properties‘])
s = set()
di = {‘中国‘: 100000}
with open(‘infos.json‘ ‘r‘ encoding=‘utf8‘) as f:
    data = f.read()
url = ‘https://geo.datav.aliyun.com/areas_v2/bound/{}_full.json‘
data = json.loads(data)
a = 0
for i in data:
    for j in data[i][‘children‘]:
        a += 1
        if a > 2939:
            adcode = j[‘adcode‘]
            name = j[‘name‘]
            parent = j[‘parent‘]
            if adcode not in di:
                di[name] = adcode
            s.add(name)
            print(url.format(str(adcode)))
            r = requests.get(url.format(str(adcode)) headers=headers)
            with open(‘full/{}_full.json‘.format(str(adcode)) ‘w‘ encoding=‘utf8‘) as f:
                f.write(r.text)
            print(a)
            time.sleep(3)

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件      31787  2020-08-19 09:20  geoJson\geoJson\不含子域\110000.json

     文件       7061  2020-08-19 09:22  geoJson\geoJson\不含子域\110101.json

     文件       5502  2020-08-19 09:22  geoJson\geoJson\不含子域\110102.json

     文件      18255  2020-08-19 09:22  geoJson\geoJson\不含子域\110105.json

     文件      21598  2020-08-19 09:22  geoJson\geoJson\不含子域\110106.json

     文件       7569  2020-08-19 09:22  geoJson\geoJson\不含子域\110107.json

     文件      16717  2020-08-19 09:22  geoJson\geoJson\不含子域\110108.json

     文件      30349  2020-08-19 09:22  geoJson\geoJson\不含子域\110109.json

     文件      27567  2020-08-19 09:23  geoJson\geoJson\不含子域\110111.json

     文件      16614  2020-08-19 09:23  geoJson\geoJson\不含子域\110112.json

     文件      27901  2020-08-19 09:23  geoJson\geoJson\不含子域\110113.json

     文件      40592  2020-08-19 09:23  geoJson\geoJson\不含子域\110114.json

     文件      21049  2020-08-19 09:23  geoJson\geoJson\不含子域\110115.json

     文件      23746  2020-08-19 09:23  geoJson\geoJson\不含子域\110116.json

     文件      34433  2020-08-19 09:23  geoJson\geoJson\不含子域\110117.json

     文件      35852  2020-08-19 09:23  geoJson\geoJson\不含子域\110118.json

     文件      33078  2020-08-19 09:23  geoJson\geoJson\不含子域\110119.json

     文件      28159  2020-08-19 09:20  geoJson\geoJson\不含子域\120000.json

     文件       2854  2020-08-19 09:23  geoJson\geoJson\不含子域\120101.json

     文件       3876  2020-08-19 09:23  geoJson\geoJson\不含子域\120102.json

     文件       4567  2020-08-19 09:23  geoJson\geoJson\不含子域\120103.json

     文件       5354  2020-08-19 09:23  geoJson\geoJson\不含子域\120104.json

     文件       4762  2020-08-19 09:23  geoJson\geoJson\不含子域\120105.json

     文件       4459  2020-08-19 09:23  geoJson\geoJson\不含子域\120106.json

     文件       8923  2020-08-19 09:23  geoJson\geoJson\不含子域\120110.json

     文件       9746  2020-08-19 09:23  geoJson\geoJson\不含子域\120111.json

     文件       7462  2020-08-19 09:24  geoJson\geoJson\不含子域\120112.json

     文件      11806  2020-08-19 09:24  geoJson\geoJson\不含子域\120113.json

     文件      23192  2020-08-19 09:24  geoJson\geoJson\不含子域\120114.json

     文件      21183  2020-08-19 09:24  geoJson\geoJson\不含子域\120115.json

............此处省略6483个文件信息

评论

共有 条评论