资源简介
利用python爬虫技术爬取部分城市的旅游信息
代码片段和文件信息
#-*- coding = utf-8 -*-
#@Time : 2020/12/23 14:23
#@Author : lxy
#@File : 旅游.py
#@Software: PyCharm
import requests
import parsel
import csv
for page in range (130):
print(“=====================正在爬取第{}页数据==========================“.format(page))
#1、得到数据所在的url地址
url=“https://place.qyer.com/china/citylist-0-0-{}/“.format(str(page))
#2、发送网络请求
response = requests.get(url)
datalist = response.text
#3、数据解析(筛选数据)
#3.1转换数据
selector = parsel.Selector(datalist)
#3.2解析数据
list = selector.xpath(‘//ul[@class=“plcCitylist“]/li‘)#提取所有li标签
for li in list:
#城市名
travel_place = li.xpath(‘.//h3/a/text()‘).get()
#拜访人数
travel_people =li.xpath(‘.//p[@class=“beento“]/text()‘).get()
#热门景点
travel_hot = li.xpath(‘.//p[@class=“pois“]/a/text()‘).getall()
travel_hot = [hot.strip() for hot in travel_hot]
travel_hot= ‘‘.join(travel_hot)
#景点链接
travel_url = li.xpath(‘.//h3/a/@href‘).get()
#图片
travel_Imgurl = li.xpath(‘./p/a/img/@src‘).get()
print(travel_placetravel_peopletravel_hottravel_urltravel_Imgurl)
#4、保存数据
with open(‘travel.csv‘ mode=‘a‘encoding=‘utf-8‘newline=‘‘) as f:
csv_writer = csv.writer(f)
csv_writer.writerow([travel_placetravel_peopletravel_hottravel_urltravel_Imgurl])
print(“爬取完毕!“)
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 451566 2020-12-28 11:12 python爬虫爬取旅游信息\data.csv
文件 1605 2020-12-29 16:16 python爬虫爬取旅游信息\旅游.py
目录 0 2020-12-30 22:57 python爬虫爬取旅游信息\
相关资源
- python爬虫爬取豆瓣电影信息
- 视觉处理(test_shape.py)
- 网页视频并合并(2heiPage.py)
- 网页遥控小车 Python web (基于RPi.GPI
- 呼吸灯(IO.py)
- python 采集360的图片地址到文本文件
- Python简单小游戏 五子棋
- python基础题库(附答案).docx(共54页
- Python RC4算法
- 微信防撤回.py
- python实现的日历
- Python源代码:以web方式管理自己的常
- 电赛电磁炮.py
- 基于Python实现的简易画气球
- 画一朵可自定义的花.py
- python 井字棋 游戏源码
- 《Python从小白到大牛》源代码
- 基于表面肌电的手势识别.py
- 查找两个路径中相同文件(get_same_f
- Python爬虫实战入门教程
- 70行代码实现贪吃蛇完整游戏功能
- 机器学习numpy和pandas基础
- Python 3 Web Development. Beginners Guide
- 贪吃蛇游戏.py
- 模拟自动滑块验证码.py(基于chromed
- 动物图片识别.py(基于百度api)
- Python爬取小说
- NumPy Cookbook
- 网络爬虫(pachong_anjuke.py)
- python demo百度文库.py
评论
共有 条评论