资源简介
使用python对淘宝数据进行爬取,浏览器需要设置为搜狐浏览器,若不是搜狐浏览器,则需要对浏览器对象进行更改。
代码片段和文件信息
# coding: utf-8
# 打开cmd命令行 输入pip install selenium 下载包
# 从selenium中引入webdriver
from selenium import webdriver
# 引入时间模块
import time
# 1.创建浏览器对象,并打开浏览器
driver = webdriver.Firefox()
# 2.在浏览器中访问网址
driver.get(‘http://www.baidu.com‘)
# 当前页的网页源代码
# print driver.page_source
# 根据id查找某个标签
# element = driver.find_element_by_id(‘kw‘)
# # 输入搜索关键词
# element.send_keys(u‘淘宝‘)
# 通过id找到百度一下按钮
news_link = driver.find_element_by_link_text(‘新闻‘)
# # 执行点击操作
news_link.click()
# 程序休眠3秒
time.sleep(3)
# 退出浏览器
driver.quit()
# element 不加s 找到的是一个标签
# driver.find_element_by_id() # 根据id查找
# driver.find_element_by_class_name() # 根据class查找
# driver.find_element_by_css_selector() # 根据css选择器查找
# driver.find_element_by_name() # 根据name查找
# driver.find_element_by_link_text() # 根据链接文本查找
# elements 查找多个符合条件的标签,并且返回一个列表
# rs = driver.find_elements_by_class_name(‘mnav‘)
# print rs
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2018-01-12 11:52 2018_1_12_am\
目录 0 2018-01-12 11:55 2018_1_12_am\.idea\
文件 516 2018-01-12 09:29 2018_1_12_am\.idea\2018_1_12_am.iml
文件 598 2018-01-12 09:28 2018_1_12_am\.idea\deployment.xm
目录 0 2018-01-12 09:28 2018_1_12_am\.idea\inspectionProfiles\
文件 270 2018-01-12 09:28 2018_1_12_am\.idea\inspectionProfiles\Project_Default.xm
文件 213 2018-01-12 09:29 2018_1_12_am\.idea\misc.xm
文件 276 2018-01-12 09:26 2018_1_12_am\.idea\modules.xm
文件 17309 2018-01-12 11:55 2018_1_12_am\.idea\workspace.xm
文件 1121 2018-01-12 10:29 2018_1_12_am\css_selector.html
文件 6527 2018-01-12 11:55 2018_1_12_am\geckodriver.log
文件 1207 2018-01-12 10:10 2018_1_12_am\sele_demo.py
文件 69007 2018-01-12 11:53 2018_1_12_am\shops.txt
文件 1505 2018-01-12 11:52 2018_1_12_am\taobao_spider.py
相关资源
- python爬虫Scrapy(一)-我爬了boss数据
- 豆瓣电影信息Python爬虫存入MongoDB.一分
- Python爬虫文件:爬取图片的程序.py
- 基于Python爬虫的股票信息爬取保存到
- Python爬虫每日抓取必应壁纸
- Python爬虫源码—爬取猫途鹰官方旅游
- python爬取百度搜索新闻,并自动生成
- python爬虫数据可视化分析大作业.zip
- python爬虫--爬取youtobe红人信息
- python简单爬虫抓取网页内容
- python 爬虫源码
- 81个Python爬虫源代码
- python爬虫程序python3.6版本
- python爬虫项目.zip
- Python爬虫教程+游戏+框架全套源码课件
- python爬虫爬取股票评论,调用百度A
- 2018年统计用区划代码和城乡划分代码
- Python爬虫抓取双色球开奖数据保存为
- Python爬虫爬取招聘数据和代码.zip
- Python爬虫爬取链家网,并进行可视化
- Python爬虫:爬取小说站(biqukan.com)网
- python爬虫-scrapy框架
- python爬虫爬取当当网
- PYTHON爬虫示例21345
- python爬虫(爬取新浪微博数据)
- python爬虫百度图片(将网络图片采集
- 新手python爬虫必学案例,爬取豆瓣电
- Python爬虫开发与项目实战-范传辉.pd
- 微信公众号的爬取 Selenium+Chromedriver
- python爬虫爬取小说网源码
评论
共有 条评论