资源简介

python股票数据爬取

需要执行 pip install xlwt -i https://mirrors.aliyun.com/pypi/simple

python 3.8 亲测通过

资源截图

代码片段和文件信息

import requests
import re
import pandas as pd

#用get方法访问服务器并提取页面数据
def getHtml(cmdpage):
    url = “http://nufm.dfcfw.com/EM_Finance2014NumericApplication/JS.aspx?cb=jQuery112406115645482397511_1542356447436&type=CT&token=4f1862fc3b5e77c150a2b985b12db0fd&sty=FCOIATC&js=(%7Bdata%3A%5B(x)%5D%2CrecordsFiltered%3A(tot)%7D)&cmd=“+cmd+“&st=(ChangePercent)&sr=-1&p=“+str(page)+“&ps=20“
    r = requests.get(url)
    pat = “data:\[(.*?)\]“
    data = re.compile(patre.S).findall(r.text)
    return data

#获取单个页面股票数据
def getOnePageStock(cmdpage):
    data = getHtml(cmdpage)
    datas = data[0].split(‘““‘)
    stocks = []
    for i in range(len(datas)):
        stock = datas[i].replace(‘“‘““).split(““)
        stocks.append(stock)
    return stocks

def main():
    cmd = {
        “上证指数“:“C.1“
 

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     文件        1955  2020-04-02 14:11  gupiaopachong.py
     目录           0  2020-04-02 14:18  股票\
     文件      773120  2020-04-02 14:16  股票\上证A股.xls
     文件      166400  2020-04-02 14:14  股票\上证指数.xls
     文件      492544  2020-04-02 14:17  股票\中小板.xls
     文件      426496  2020-04-02 14:18  股票\创业板.xls
     文件      129024  2020-04-02 14:17  股票\新股.xls
     文件     1891840  2020-04-02 14:16  股票\沪深A股.xls
     文件     1120256  2020-04-02 14:17  股票\深圳A股.xls
     文件      216064  2020-04-02 14:14  股票\深圳指数.xls

评论

共有 条评论