资源简介
文档内容是关于机器学习课程期末大作业,用Python实现,代码全,文档详细,需要的可以下载
代码片段和文件信息
# 导入数值计算库
import numpy as np
# 导入科学计算库
import pandas as pd
#导入机器学习linear_model库
from sklearn import linear_model
#导入交叉验证库
from sklearn import model_selection
#导入图表库
import matplotlib.pyplot as plt
#读取数据
datalist = pd.read_csv(‘lineardata.csv‘)
X = datalist.iloc[ : : 1 ].values
Y = datalist.iloc[ : 1 ].values
print(datalist)
#格式调整
X = np.array(datalist[[‘month‘]])#将月份数设为自变量X
Y = np.array(datalist[‘PM2.5‘])#PM2.5设为因变量Y
X.shapeY.shape #查看自变量和因变量的行数
#设置图表字体为华文细黑,字号11
plt.rc(‘font‘ family=‘STXihei‘ size=11)
#绘制散点图,月份数X,PM2.5Y,设置颜色,标记点样式和透明度等参数
plt.scatter(XY30color=‘red‘marker=‘x‘linewidth=2alpha=0.8)
plt.xlabel(‘月份‘)#添加x轴标题
plt.ylabel(‘PM2.5值‘)#添加y轴标题
plt.title(‘2017年月份与PM2.5关系分析‘)#添加图表标题
#设置背景网格线颜色,样式,尺寸和透明度
plt.grid(color=‘#95a5a6‘linestyle=‘--‘ linewidth=1axis=‘both‘alpha=0.4)
plt.show()#显示图表
#划分数据
X_train X_test y_train y_test = model_selection.train_test_split(X Y test_size=0.25 random_state=0)
#查看训练集数据的行数
print(‘训练集的行数:‘)
print(X_train.shapey_train.shape)
#将训练集代入到线性回归模型中
clf = linear_model.LinearRegression()
clf.fit (X_trainy_train)
clf.coef_#线性回归模型的斜率
clf.intercept_#线性回归模型的截距
#判定系数R
clf.score(X_trainy_train)
print(‘判定系数R:‘)
print(clf.score(X_trainy_train))
#显示测试集的因变量
print(‘测试集因变量:‘)
print(list(y_test))
#将测试集的自变量代入到模型预测因变量
pred = list(clf.predict(X_test))
print(‘预测集因变量:‘)
print(pred)
#训练结果的可视化
plt.scatter(X_train y_train color = ‘red‘)
plt.plot(X_train clf.predict(X_train) color =‘blue‘)
plt.show()
#测试结果的可视化
plt.scatter(X_test y_test color = ‘red‘)
plt.plot(X_test clf.predict(X_test) color =‘green‘)
plt.show()
#计算误差平方和
print(‘误差平方和:‘)
print(((y_test - clf.predict(X_test)) **2).sum())
#返回预测性能得分
print(‘Score:%.2f‘%clf.score(X_testy_test))
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2018-12-10 17:42 2016218735_常利\
文件 182 2018-12-09 13:47 2016218735_常利\lineardata.csv
文件 2311 2018-12-10 16:20 2016218735_常利\linear_regression.py
文件 583 2018-12-10 10:25 2016218735_常利\logisticdata.csv
文件 3276 2018-12-10 16:22 2016218735_常利\logistic_regression.py
文件 782 2018-12-10 13:17 2016218735_常利\poly_regression.py
文件 2059 2018-12-07 16:23 2016218735_常利\weather-data.py
文件 718828 2019-07-23 10:38 2016218735_常利\工程报告.doc
文件 15215 2018-12-09 17:59 2016218735_常利\空气质量检测.xlsx
- 上一篇:画散点图轮廓图雷达图调和曲线图等
- 下一篇:python实现两张图片融合
评论
共有 条评论