逻辑回归python实现

大小: 4KB

文件类型: .gz

金币: 1

下载: 1 次

发布日期: 2021-06-07
语言: Python
标签: 逻辑回归

高速下载

资源简介

在开源的基础上实现的逻辑回归，纯python实现，采用的是批量梯度下降，用户可以自己换其他的梯度下降方式

资源截图

小图大图

代码片段和文件信息

#coding=utf-8

import math
import numpy as np
import pandas as pd
from sklearn import preprocessing
from sklearn import metrics


#数据的标准化/归一化处理
def  Normalization（data）:
    min_max_scaler = preprocessing.MinMaxScaler（feature_range=（-1 1））
    return min_max_scaler.fit_transform（data）


#数据加载及处理
def DealData（DataPath）:
    df=pd.read_csv（DataPathheader=0）
    df.columns=[‘f1‘‘f2‘‘label‘]
    X = df[[“f1“ “f2“]]
    X = np.array（X）
    X = Normalization（X）
    Y=df[‘label‘].map（lambda x: float（x.rstrip（‘;‘）））
    Y=np.array（Y）
    return XY


#Sigmoid函数
def Sigmoid（z）:
    return  float（1.0/（float（1+math.exp（-1.0*z））））


#计算H函数值
def Hypothesis（thetaxi）:
    z = 0.0
    for i in xrange（len（theta））:
        z += xi[i]*theta[i]
    return Sigmoid（z）

#计算每一个theta向量的每一个theta的梯度，使用的是批量梯度下降的方法
def Cost_Function_Derivative（XYthetajalpha）:
    sum_errors=0.0
    m=len（Y）
    for i in xrange（m）:
        xi=X[i]
        xij=xi[j]
        hi=Hypothesis（thetaxi）
        sum_errors += （（hi-Y[i]）*xij）
    constant = float（alpha）/float（m）
    res = constant*sum_errors
    return res


#梯度下降，更新theta的每一个theta的值
def Gradient_Descent（XYthetaalpha）:
    new_theta=[]
    for j in xrange（len（theta））:
        CFDerivative = Cost_Function_Derivative（XYthetajalpha）  #计算第i个权重的梯度
        new_theta_value=theta[j]-CFDerivative
        new_theta.append（new_theta_value）
    return new_theta


#损失函数，用于计算模型的loss
def Cost_Function（XYtheta）:
    sum_errors=0.0
    m=len（Y）
    for i in xrange（m）:
        xi=X[i]
        hi=Hypothesis（thetaxi）
        if Y[i] == 1:
            error=Y[i]*math.log（hi）
        elif Y[i] == 0:
            error=（1-Y[i]）*math.log（1-hi）
        sum_errors += error
    J=（-1.0/m） * sum_errors
    return J

#逻辑回归的主体
def Logittic_Regression（XYalphathetanum_iters）:

    for x in xrange（num_iters）: #多次迭代
        new_theta=Gradient_Descent（XYthetaalpha）
        theta=new_theta
        #每100个样本计算一下损失，这一步可有可无，可以在最后计算一下即可
        if x % 100 == 0:
            res=Cost_Function（XYtheta）
            print ‘cost is ‘res
    return theta


#模型保存
def Save_Model（modemodelPath）:
    save=open（modelPath‘w‘）
    for i in mode:
        save.write（str（i））
        save.write（‘\n‘）
    return


#根据已经训练好的模型，进行预测，返回的是每一个样本属于1的概率组成的list
def Logittic_Regression_Predict（modelX）:
    predictOut = []
    for i in xrange（len（X））:
        probability = Hypothesis（modelX[i]）
        predictOut.append（probability）
    return predictOut


#根据预测值与真实值计算AUC
def Logittic_Regression_Auc（PredictTrueValue）:
    fpr tpr thresholds = metrics.roc_curve（TrueValue Predict pos_label=1）
    return metrics.auc（fpr tpr）



if __name__ == ‘__main__‘:

    train_Xtrain_Y=DealData（‘train.csv‘）    #处理数据，得到符合训练格式的数据
    test_X test_Y=DealData（‘test.csv‘）     #处理数据，得到符合测试格式的数据

    # 初始化参数
    initial_theta = [0.0 for i in range（train_X.ndim）]  #theta初始化
    alpha = 0.1 #学习率
    iterations = 10   #迭代次数

    model_lr=Logittic_Regression（train_Xtrain_Yalphainitial_th

上一篇：基于循环神经网络的日内预测
下一篇：HTMLTestRunner汉化+优化

共有条评论

逻辑回归python实现

资源简介

资源截图

代码片段和文件信息

评论

相关资源