使用python对淘宝商品信息数据进行爬取

大小: 25KB

文件类型: .zip

金币: 2

下载: 0 次

发布日期: 2021-05-12
语言: Python
标签: python爬虫

高速下载

资源简介

使用python对淘宝数据进行爬取，浏览器需要设置为搜狐浏览器，若不是搜狐浏览器，则需要对浏览器对象进行更改。

资源截图

小图大图

代码片段和文件信息

# coding: utf-8

# 打开cmd命令行  输入pip install selenium 下载包
# 从selenium中引入webdriver
from selenium import webdriver
# 引入时间模块
import time
# 1.创建浏览器对象，并打开浏览器
driver = webdriver.Firefox（）
# 2.在浏览器中访问网址
driver.get（‘http://www.baidu.com‘）
# 当前页的网页源代码
# print driver.page_source
# 根据id查找某个标签
# element = driver.find_element_by_id（‘kw‘）
# # 输入搜索关键词
# element.send_keys（u‘淘宝‘）
# 通过id找到百度一下按钮
news_link = driver.find_element_by_link_text（‘新闻‘）
# # 执行点击操作
news_link.click（）
# 程序休眠3秒
time.sleep（3）
# 退出浏览器
driver.quit（）

# element 不加s 找到的是一个标签
# driver.find_element_by_id（）  # 根据id查找
# driver.find_element_by_class_name（）  # 根据class查找
# driver.find_element_by_css_selector（）  # 根据css选择器查找
# driver.find_element_by_name（）  # 根据name查找
# driver.find_element_by_link_text（） # 根据链接文本查找

# elements 查找多个符合条件的标签，并且返回一个列表
# rs = driver.find_elements_by_class_name（‘mnav‘）
# print rs

属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2018-01-12 11:52  2018_1_12_am\
     目录           0  2018-01-12 11:55  2018_1_12_am\.idea\
     文件         516  2018-01-12 09:29  2018_1_12_am\.idea\2018_1_12_am.iml
     文件         598  2018-01-12 09:28  2018_1_12_am\.idea\deployment.xml
     目录           0  2018-01-12 09:28  2018_1_12_am\.idea\inspectionProfiles\
     文件         270  2018-01-12 09:28  2018_1_12_am\.idea\inspectionProfiles\Project_Default.xml
     文件         213  2018-01-12 09:29  2018_1_12_am\.idea\misc.xml
     文件         276  2018-01-12 09:26  2018_1_12_am\.idea\modules.xml
     文件       17309  2018-01-12 11:55  2018_1_12_am\.idea\workspace.xml
     文件        1121  2018-01-12 10:29  2018_1_12_am\css_selector.html
     文件        6527  2018-01-12 11:55  2018_1_12_am\geckodriver.log
     文件        1207  2018-01-12 10:10  2018_1_12_am\sele_demo.py
     文件       69007  2018-01-12 11:53  2018_1_12_am\shops.txt
     文件        1505  2018-01-12 11:52  2018_1_12_am\taobao_spider.py

上一篇：python全套视频教程
下一篇：pydelicious的__init__.py替换文件

共有条评论

使用python对淘宝商品信息数据进行爬取

资源简介

资源截图

代码片段和文件信息

评论

相关资源