资源简介
使用Python3,爬取500彩票网站的足球比赛场次赔率,爬取后以excel形式存放在E:\2017-2018赔率\赔率下载\……
代码片段和文件信息
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import requests
#读入网页加以解析抓取需要用到的软件包是 requests_html.此处并不需要这个软件包的全部功能只读入其中的 HTMLSession 就可以
#from requests_html import HTMLSession
import re #正则表达
import xlwt #import xlrt
import json
import os
#from openpyxl import workbook # 写入Excel表所用
#from openpyxl import load_workbook # 读取Excel表所用
def get_num():
url = “http://live.500.com/zqdc.php“
page = requests.get(url)
result=str(page.content)
pattern = re.compile(“ content = re.findall(patternresult)
#print(content)
return content
def get_data(numindex):
urlmain = “http://odds.500.com/fenxi/ouzhi-“+str(num)+“.shtml?ctype=2“
pagemain=requests.get(urlmain)
resultmain=str(pagemain.content)
contentmain=re.findall(re.compile(‘‘)resultmain) #主流公司个数
data_main=[]
for data in contentmain:
data_main.append(float(data))
#print(data_main)
url1 = “http://odds.500.com/fenxi/ouzhi-“+str(num)+“.shtml?ctype=4“
url2=“http://odds.500.com/fenxi1/ouzhi.php?id=“+str(num)+“&ctype=4&start=30&r=1&style=0&guojia=0&chupan=1“
url3=“http://odds.500.com/fenxi1/ouzhi.php?id=“+str(num)+“&ctype=4&start=60&r=1&style=0&guojia=0&chupan=1“
url4=“http://odds.500.com/fenxi1/ouzhi.php?id=“+str(num)+“&ctype=4&start=90&r=1&style=0&guojia=0&chupan=1“
url5=“http://odds.500.com/fenxi1/ouzhi.php?id=“+str(num)+“&ctype=4&start=120&r=1&style=0&guojia=0&chupan=1“
url6=“http://odds.500.com/fenxi1/ouzhi.php?id=“+str(num)+“&ctype=4&start=150&r=1&style=0&guojia=0&chupan=1“
url7=“http://odds.500.com/fenxi1/ouzhi.php?id=“+str(num)+“&ctype=4&start=180&r=1&style=0&guojia=0&chupan=1“
url8=“http://odds.500.com/fenxi1/ouzhi.php?id=“+str(num)+“&ctype=4&start=210&r=1&style=0&guojia=0&chupan=1“
page1=requests.get(url1)
page2=requests.get(url2)
page3=requests.get(url3)
page4=requests.get(url4)
page5=requests.get(url5)
page6=requests.get(url6)
page7=requests.get(url7)
page8=requests.get(url8)
#html = html.decode(‘UTF-8‘)
result1=str(page1.content.decode(‘gbk‘)) #print(result)
result2=str(page2.content) #print(result)
result3=str(page3.content) #print(result)
result4=str(page4.content) #print(result)
result5=str(page5.content) #print(result)
result6=str(page6.content) #print(result)
result7=str(page7.content) #print(result)
result8=str(page8.content) #print(result)
print(‘\n‘)
content1 = re.findall(re.compile(r‘klfc.*?style=“cursor.*?([\d][\d]?[\d]?[\.]?[\d]?[\d]?)‘)result1)#赔率
content2 = re.findall(re.compile(r‘‘)result1)#胜率
#content3 = re.findall(re.compile(r‘class=“ [y|p].*?>([0|1][\.][\d]?[\d]?)‘)result)#赔寸率
#content4 = re.findall(re.compile(r‘([0|1][\.][\d]?[\d]?) ‘)
相关资源
- python实现SGBM图像匹配算法
- python实现灰度直方图均衡化
- scrapy_qunar_one
- Python学习全系列教程永久可用
- python简明教程.chm
- 抽奖大转盘python的图形化界面
- 双边滤波器实验报告及代码python
- python +MYSQL+HTML实现21蛋糕网上商城
- Python-直播答题助手自动检测出题搜索
- OpenCV入门教程+OpenCV官方教程中文版
- Python 串口工具源码+.exe文件
- Python开发的全栈股票系统.zip
- Python操作Excel表格并将其中部分数据写
- python书籍 PDF
- 利用python绘制散点图
- python+labview+No1.vi
- 老男孩python项目实战
- python源码制作whl文件.rar
- python3.5可用的scipy
- PYTHON3 经典50案例.pptx
- 计算机科学导论-python.pdf
- python模拟鼠标点击屏幕
- windows鼠标自动点击py脚本
- 鱼c小甲鱼零基础学python全套课后题和
- Python 练习题100道
- Practical Programming 2nd Edition
- wxPython Application Development Cookbook
- python 3.6
- Python 3.5.2 中文文档 互联网唯一CHM版本
- python3.5.2.chm官方文档
评论
共有 条评论