资源简介
利用selenium编写的python网络爬虫-淘宝商品信息并保存到mysql数据库。包括宝贝的详细信息
代码片段和文件信息
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from pyquery import PyQuery as pq
from Tbmeishi.config import *
import MySQLdb
# browser = webdriver.Chrome() 使用chrome来运行,会跳出界面
browser = webdriver.PhantomJS(service_args=[‘--load-images=false‘ ‘--disk-cache=true‘])
wait = WebDriverWait(browser 10)
# 设置phantomjs的界面大小
browser.set_window_size(1400 900)
def search():
print(‘正在搜索‘)
browser.get(‘https://www.taobao.com‘)
# 判断加载是否成功
# 输入框选择器
input = wait.until(
EC.presence_of_element_located((By.CSS_SELECTOR ‘#q‘))
)
# 点击事件J_TSearchForm > div.search-button > button
submit = wait.until(
EC.element_to_be_clickable((By.CSS_SELECTOR ‘#J_TSearchForm > div.search-button > button‘)))
# 输入搜索内容KEYWORD
input.send_keys(KEYWORD)
# 点击搜索
submit.click()
# 网页等待
total = wait.until(
EC.presence_of_element_located((By.CSS_SELECTOR “#mainsrp-pager > div > div > div > div.total“)))
get_products()
return total.text
def next_page(page_number):
print(‘正在翻页%d‘ % page_number)
try:
# 页码的数据框选择器
input = wait.until(
EC.presence_of_element_located((By.CSS_SELECTOR ‘#mainsrp-pager > div > div > div > div.form > input‘))
)
# 确定按钮
submit = wait.until(
EC.element_to_be_clickable(
(By.CSS_SELECTOR ‘#mainsrp-pager > div > div > div > div.form > span.btn.J_Submit‘)))
# 清除下面的页码
input.clear()
# 写入当前页的下一页
input.send_keys(page_number)
# 点击确定按钮
submit.click()
wait.until(EC.text_to_be_present_in_element(
(By.CSS_SELECTOR ‘#mainsrp-pager > div > div > div > ul > li.item.active > span‘) str(page_number)))
get_products()
except TimeoutError:
next_page
- 上一篇:人脸检测python源代码
- 下一篇:时间长短序列网络LSTM
相关资源
- 人脸检测python源代码
- python实现可暂停的动态曲线绘制,横
- python2048游戏源代码
- 机器学习-python处理UCI鲍鱼数据集.ra
- python带基因元胞自动机代码
- python-web系统实时监控
- numpy-1.17.0+mkl-cp37-cp37m-win_amd64.whl百度云
- 四行Python代码实现将word文件转换为
- python评分卡模型数据源
- 传智播客 python基础班 + 就业班 + 课件
- python实现简易3D方块动画
- 基于PYTHON+OPENCV的SIFT SURF图像特征匹配
- python总结
- boost.python 动态编译库
- 高斯投影正反算Python源码
- python xlutils
- Python3网络爬虫实战思维导图
- ros_arduino_python 调通版
- 数据挖掘十大算法源代码Python)
- XModem -发送端源代码Python语言实现
- pytracking/pytracking/evaluation/tracker.py
- Python爬取教务系统课程表
- 元胞自动机模拟交通道路_Python
- Python二级考试试题.zip
- python实现扫描线填充算法,可以画凹
- python3 包装的httpclient,支持session
- python日期时间运算
- python实现的ping工具
- Python简版聊天室代码
- Flask-login
评论
共有 条评论