资源简介

基于Python爬虫爬取中国天气网的天气预报信息

资源截图

代码片段和文件信息

import urllib.request
from bs4 import BeautifulSoup

url = “http://www.weather.com.cn/weather15d/101280601.shtml“


def getHtml():
    response = urllib.request.urlopen(url)
    data = response.read()
    html = data.decode()
    return html


def getTemp(s):
    # 25℃/18℃
    p = s.find(“/“)
    max = s[p - 3:len(s) - 5]
    min = s[p + 1:len(s) - 1]
    return {“max“: max “min“: min}


html = getHtml()
# 创建一个对象,使用xml解析
root = BeautifulSoup(html “lxml“)
# select_one使用CSS语法查找ul元素

评论

共有 条评论