资源简介
python自定义爬虫,爬取豆瓣网以及腾讯招聘网信息并进行数据可视化分析,可自定义爬取网站
代码片段和文件信息
# from selenium.webdriver.remote.webelement import WebElement
from selenium import webdriver
from selenium.webdriver import ActionChains
# from selenium.common.exceptions import NoSuchElementException
from selenium.common.exceptions import StaleElementReferenceException
# from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
# from selenium.webdriver.common.by import By
import time
import urllib.request
# 歌曲名
mname = ‘‘
# js重定向
def wait(drive):
elem = drive.find_element_by_tag_name(‘html‘)
count = 0
while True:
count += 1
if count > 20:
print(‘chaoshi‘)
return
time.sleep(5)
try:
elem == drive.find_element_by_tag_name(‘html‘)
except StaleElementReferenceException:
return
# 获取url
def geturl():
input_string = input(“>>>please input the song name:“)
driver = webdriver.Chrome()
url = ‘http://www.kugou.com/‘
driver.get(url)
# 输入搜索内容
a = driver.find_element_by_xpath(‘html/body/div[1]/div[1]/div[1]/div[1]/input‘)
a.send_keys(input_string)
# 点击搜索
driver.find_element_by_xpath(‘html/body/div[1]/div[1]/div[1]/div[1]/div/i‘)
result_url = driver.current_url
driver.quit()
return result_url
# 显示搜索结果
def show_result(url):
driver = webdriver.Chrome()
driver.get(url)
time.sleep(3)
for i in range(1 1000):
try:
print(‘%d.‘ % i + driver.find_element_by_xpath(“.//*[@id=‘search_song‘]/div[2]/ul[2]/li[%d]/div[1]/a“ % i).get_attribute(‘title‘))
except Exception as e:
print(e)
break
choice = input(“>>>Which one do you want(you can input ‘quit‘ to goback(带引号)):“)
# 从下载界面退回
if choice == ‘quit‘:
result = ‘quit‘
else:
global mname
mname = driver.find_element_by_xpath(“.//*[@id=‘search_song‘]/div[2]/ul[2]/li[%d]/div[1]/a“ % choice).get_attribute(‘title‘)
a = driver.find_element_by_xpath(“.//*[@id=‘search_song‘]/div[2]/ul[2]/li[%d]/div[1]/a“ % choice)
actions = ActionChains(driver)
actions.move_to_element(a)
actions.click(a)
actions.perform()
# 跳转到新打开的页面
driver.switch_to.window(driver.window_handles[1])
# 获取播放元文件url
result = driver.find_element_by_xpath(“.//*[@id=‘myAudio‘]“).get_attribute(‘src‘)
driver.quit()
return result
# 下载回调
def cbk(a b c):
per = 100.0 * a * b / c
if per > 100:
per = 100
print(‘%.2f%%‘ % per)
def main():
print(“***********************************欢迎使用免费音乐下载器************************************“)
time.sleep(1)
while True:
url = geturl()
result = show_result(url)
if result == ‘quit‘:
print(‘\n‘)
continue
else:
local = ‘d://%s.mp3‘ % mname
print(“download start“)
time.sle
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2019-02-26 14:14 kugou_download\
目录 0 2019-03-22 14:42 kugou_download\.idea\
目录 0 2019-02-26 14:14 kugou_download\.idea\codest
文件 153 2018-11-06 20:53 kugou_download\.idea\codest
目录 0 2019-03-22 14:45 kugou_download\.idea\inspectionProfiles\
文件 516 2018-11-20 10:09 kugou_download\.idea\kugou_download.iml
文件 202 2018-11-20 10:09 kugou_download\.idea\misc.xm
文件 280 2018-11-06 20:05 kugou_download\.idea\modules.xm
文件 25042 2019-03-22 14:42 kugou_download\.idea\workspace.xm
文件 4213246 2018-12-19 13:35 kugou_download\douban.txt
文件 2041 2018-11-16 13:05 kugou_download\get_xici_ip.txt
文件 3306 2018-11-06 21:14 kugou_download\kugou.py
文件 26 2018-11-14 10:05 kugou_download\stopwords.txt
文件 83803 2018-12-20 16:26 kugou_download\tencent.txt
文件 9521 2018-11-13 19:32 kugou_download\timg.png
目录 0 2019-02-26 14:14 kugou_download\venv\
目录 0 2019-02-26 14:14 kugou_download\venv\Include\
文件 22274 2016-09-11 22:51 kugou_download\venv\Include\Python-ast.h
文件 2928 2016-06-14 00:47 kugou_download\venv\Include\Python.h
文件 47239 2016-12-07 04:27 kugou_download\venv\Include\abstract.h
文件 1016 2016-05-16 16:43 kugou_download\venv\Include\accu.h
文件 1213 2016-06-14 00:47 kugou_download\venv\Include\asdl.h
文件 477 2016-05-16 16:43 kugou_download\venv\Include\ast.h
文件 792 2016-05-16 16:43 kugou_download\venv\Include\bitset.h
文件 264 2016-05-16 16:43 kugou_download\venv\Include\bltinmodule.h
文件 886 2016-05-16 16:43 kugou_download\venv\Include\boolob
文件 2114 2016-05-16 16:43 kugou_download\venv\Include\bytearrayob
文件 3191 2016-06-14 00:47 kugou_download\venv\Include\bytes_methods.h
文件 8333 2016-11-01 02:21 kugou_download\venv\Include\bytesob
文件 701 2016-05-16 16:43 kugou_download\venv\Include\cellob
文件 8304 2016-09-11 22:51 kugou_download\venv\Include\ceval.h
............此处省略6684个文件信息
相关资源
- python行人检测视频+源码
- python+flask+echarts+mysql实现中国疫情数据
- 数据结构——Python语言描述
- ABAQUS Python二次开发攻略(含code)
- 《Python3网络爬虫开发实战代码》.zi
- python语言在abaqus中的应用
- 吴恩达coursera机器学习课后编程练习源
- Python面向对象编程指南.[美]Steven F.L
- Python-MuseGAN用于乐曲生成的AI
- 《Python面向对象编程指南》 高清完整
- 《PYTHON QT GUI快速编程 PYQT编程指南》
- 数据结构与算法 python语言描述
- dlib-19.19.0-cp38-cp38-win_amd64.whl
- Python大战机器学习 PDF 高清 + 源代码
- 基于ArcGIS的Python编程秘笈(第2版)中
- 用Python做股票量化分析量化交易之路
- 基于ArcGIS的Python编程秘笈(第2版)
- Python新手使用Django架站的16堂课简体中
- cifar-10-python.tar.gz
- python图像处理相机姿态估计
- Python聚类分析
- 与孩子一起学PythonPDF书、源代码素材
- 机器学习-使用OpenCV和Python进行智能图
- OpenCV 3计算机视觉:Python语言实现(以
- 学习python推荐书籍6本中文版
- 数据之魅中文版:基于开源工具的数
- 黑马15期Python.txt
- numpy-1.19.1+mkl-cp39-cp39-win_amd64.whl
- 从芯片到云端 Python物联网全栈开发实
- Python3.7打包whl库,包括numpy、scikit、
评论
共有 条评论