资源简介
使用Python3,爬取500彩票网站的足球比赛场次赔率,爬取后以excel形式存放在E:\2017-2018赔率\赔率下载\……
代码片段和文件信息
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import requests
#读入网页加以解析抓取需要用到的软件包是 requests_html.此处并不需要这个软件包的全部功能只读入其中的 HTMLSession 就可以
#from requests_html import HTMLSession
import re #正则表达
import xlwt #import xlrt
import json
import os
#from openpyxl import workbook # 写入Excel表所用
#from openpyxl import load_workbook # 读取Excel表所用
def get_num():
url = “http://live.500.com/zqdc.php“
page = requests.get(url)
result=str(page.content)
pattern = re.compile(“ content = re.findall(patternresult)
#print(content)
return content
def get_data(numindex):
urlmain = “http://odds.500.com/fenxi/ouzhi-“+str(num)+“.shtml?ctype=2“
pagemain=requests.get(urlmain)
resultmain=str(pagemain.content)
contentmain=re.findall(re.compile(‘‘)resultmain) #主流公司个数
data_main=[]
for data in contentmain:
data_main.append(float(data))
#print(data_main)
url1 = “http://odds.500.com/fenxi/ouzhi-“+str(num)+“.shtml?ctype=4“
url2=“http://odds.500.com/fenxi1/ouzhi.php?id=“+str(num)+“&ctype=4&start=30&r=1&style=0&guojia=0&chupan=1“
url3=“http://odds.500.com/fenxi1/ouzhi.php?id=“+str(num)+“&ctype=4&start=60&r=1&style=0&guojia=0&chupan=1“
url4=“http://odds.500.com/fenxi1/ouzhi.php?id=“+str(num)+“&ctype=4&start=90&r=1&style=0&guojia=0&chupan=1“
url5=“http://odds.500.com/fenxi1/ouzhi.php?id=“+str(num)+“&ctype=4&start=120&r=1&style=0&guojia=0&chupan=1“
url6=“http://odds.500.com/fenxi1/ouzhi.php?id=“+str(num)+“&ctype=4&start=150&r=1&style=0&guojia=0&chupan=1“
url7=“http://odds.500.com/fenxi1/ouzhi.php?id=“+str(num)+“&ctype=4&start=180&r=1&style=0&guojia=0&chupan=1“
url8=“http://odds.500.com/fenxi1/ouzhi.php?id=“+str(num)+“&ctype=4&start=210&r=1&style=0&guojia=0&chupan=1“
page1=requests.get(url1)
page2=requests.get(url2)
page3=requests.get(url3)
page4=requests.get(url4)
page5=requests.get(url5)
page6=requests.get(url6)
page7=requests.get(url7)
page8=requests.get(url8)
#html = html.decode(‘UTF-8‘)
result1=str(page1.content.decode(‘gbk‘)) #print(result)
result2=str(page2.content) #print(result)
result3=str(page3.content) #print(result)
result4=str(page4.content) #print(result)
result5=str(page5.content) #print(result)
result6=str(page6.content) #print(result)
result7=str(page7.content) #print(result)
result8=str(page8.content) #print(result)
print(‘\n‘)
content1 = re.findall(re.compile(r‘klfc.*?style=“cursor.*?([\d][\d]?[\d]?[\.]?[\d]?[\d]?)‘)result1)#赔率
content2 = re.findall(re.compile(r‘‘)result1)#胜率
#content3 = re.findall(re.compile(r‘class=“ [y|p].*?>([0|1][\.][\d]?[\d]?)‘)result)#赔寸率
#content4 = re.findall(re.compile(r‘([0|1][\.][\d]?[\d]?) ‘)
相关资源
- 二级考试python试题12套(包括选择题和
- pywin32_python3.6_64位
- python+ selenium教程
- PycURL(Windows7/Win32)Python2.7安装包 P
- 英文原版-Scientific Computing with Python
- 7.图像风格迁移 基于深度学习 pyt
- 基于Python的学生管理系统
- A Byte of Python(简明Python教程)(第
- Python实例174946
- Python 人脸识别
- Python 人事管理系统
- 基于python-flask的个人博客系统
- 计算机视觉应用开发流程
- python 调用sftp断点续传文件
- python socket游戏
- 基于Python爬虫爬取天气预报信息
- python函数编程和讲解
- Python开发的个人博客
- 基于python的三层神经网络模型搭建
- python实现自动操作windows应用
- python人脸识别(opencv)
- python 绘图(方形、线条、圆形)
- python疫情卡UN管控
- python 连连看小游戏源码
- 基于PyQt5的视频播放器设计
- 一个简单的python爬虫
- csv文件行列转换python实现代码
- Python操作Mysql教程手册
- Python Machine Learning Case Studies
- python获取硬件信息
评论
共有 条评论