资源简介
python爬虫抓取北京天气的一个超级简单的案例
代码片段和文件信息
#!/usr/bin/python
#-*- coding=UTF-8 -*-
import urllib
import re
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
page.close
return html
def get_city(html):
reg = r‘tle>【(.+?)天气】.+? tle>‘
get_re = re.compile(reg)
get_list = re.findall(get_rehtml)
return get_list[0]
def get_start(html):
reg=r‘.+?(今天.+?
‘
get_re = re.compile(reg)
get_list = re.findall(get_rehtml)
return get_list[0]
def get_end(html):
reg=r‘.+?(明天.+?
‘
get_re = re.compile(reg)
get_list = re.findall(get_rehtml)
return get_list[0]
def get_block(html):
start=html.find(get_start(html))
end=html.find(get_end(html))
block=html[start:end]
return block
def get_block_date(block):
reg=r‘(.+?)(今天.+?
‘
get_re = re.compile(reg)
get_list = re.findall(get_reblock)
return get_list[0]
def get_block_air(block):
reg=r‘p class=“wea“ title
相关资源
- navicat.11.2.16.premium_cs_x64破解版.zip
- 凸优化_Boyd_王书宁译.rar
- 云盘.rar
- Xshell5.exe
- 20170121135652618.rar
- DiskGenius4.7.0专业版.rar
- AlphaControlsv11.16StableFullSource(D5和D10
- 雅奇880官方开源赠品30多个雅奇4.rar
- 2009_LabVIEW编程样式_清晰版.pdf
- tiger_newhu5.99.24.zip
- 大数据架构详解:从数据获取到深度
- 程序是怎样跑起来的_PDF电子书带书签
- MongodbSample.rar
- EtherCATSlaveStackCodeTool5.12.rar
- 重构_改善既有代码的设计.rar
- 矩阵分析与应用第二版高清带书签.
- 通达网络智能办公系统OfficeAnywhere20
- 入门到实践.rar
- vRealizeAutomation7.0快速部署手册v1.3.pd
- 迅捷pdf转换器.7z
- FLACFLAC3D基础与应用-陈育民.pptx
- Location12.2.rar
- proteus仿真stm32测距.zip
- 《探索式软件测试》高清影印带书签
- Microsoft-70-483.pdf
- 微积分之屠龙宝刀美C.亚当斯等上.p
- F3arRa1n_Windows3.4.3.zip
-
zw_baidu_38396237-10813429-weibodataba
se.zi - zw_xqy987967363-10661999-信号与系统.zip
- 微信头像2000.rar
评论
共有 条评论