资源简介
机器学习(9)-PCA原理与实现:数据集与源码下载
机器学习(9)-PCA原理与实现:数据集与源码下载
机器学习(9)-PCA原理与实现:数据集与源码下载
代码片段和文件信息
# PCA
# Importing the libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
# Importing the dataset
dataset = pd.read_csv(‘Wine.csv‘)
X = dataset.iloc[: 0:13].values
y = dataset.iloc[: 13].values
# Splitting the dataset into the Training set and Test set
from sklearn.model_selection import train_test_split
X_train X_test y_train y_test = train_test_split(X y test_size = 0.2 random_state = 0)
# Feature Scaling
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)
# Applying PCA
from sklearn.decomposition import PCA
pca = PCA(n_components = 2)
X_train = pca.fit_transform(X_train)
X_test = pca.transform(X_test)
explained_variance = pca.explained_variance_ratio_
# Fitting Logistic Regression to the Training set
from sklearn.linear_model import LogisticRegression
classifier = LogisticRegression(random_state = 0)
classifier.fit(X_train y_train)
# Predicting the Test set results
y_pred = classifier.predict(X_test)
# Making the Confusion Matrix
from sklearn.metrics import confusion_matrix
cm = confusion_matrix(y_test y_pred)
# Visualising the Training set results
from matplotlib.colors import ListedColormap
X_set y_set = X_train y_train
X1 X2 = np.meshgrid(np.arange(start = X_set[: 0].min() - 1 stop = X_set[: 0].max() + 1 step = 0.01)
np.arange(start = X_set[: 1].min() - 1 stop = X_set[: 1].max() + 1 step = 0.01))
plt.contourf(X1 X2 classifier.predict(np.array([X1.ravel() X2.ravel()]).T).reshape(X1.shape)
alpha = 0.75 cmap = ListedColormap((‘red‘ ‘green‘ ‘blue‘)))
plt.xlim(X1.min() X1.max())
plt.ylim(X2.min() X2.max())
for i j in enumerate(np.unique(y_set)):
plt.scatter(X_set[y_set == j 0] X_set[y_set == j 1]
c = ListedColormap((‘red‘ ‘green‘ ‘blue‘))(i) label = j)
plt.title(‘Logistic Regression (Training set)‘)
plt.xlabel(‘PC1‘)
plt.ylabel(‘PC2‘)
plt.legend()
plt.show()
# Visualising the Test set results
from matplotlib.colors import ListedColormap
X_set y_set = X_test y_test
X1 X2 = np.meshgrid(np.arange(start = X_set[: 0].min() - 1 stop = X_set[: 0].max() + 1 step = 0.01)
np.arange(start = X_set[: 1].min() - 1 stop = X_set[: 1].max() + 1 step = 0.01))
plt.contourf(X1 X2 classifier.predict(np.array([X1.ravel() X2.ravel()]).T).reshape(X1.shape)
alpha = 0.75 cmap = ListedColormap((‘red‘ ‘green‘ ‘blue‘)))
plt.xlim(X1.min() X1.max())
plt.ylim(X2.min() X2.max())
for i j in enumerate(np.unique(y_set)):
plt.scatter(X_set[y_set == j 0] X_set[y_set == j 1]
c = ListedColormap((‘red‘ ‘green‘ ‘blue‘))(i) label = j)
plt.title(‘Logistic Regression (Test set)‘)
plt.xlabel(‘PC1‘)
plt.ylabel(‘PC2‘)
plt.legend()
plt.show()
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 2840 2016-12-23 05:03 pca.py
文件 11452 2018-10-26 20:35 Wine.csv
相关资源
- 谁说菜鸟不会数据分析
- CiteSpace压缩包
- 无监督学习方法以及应用 谢娟英
- 《现代模式识别》-孙即祥&机器学习:
- casia 汉语情感语料库
- Spark推荐书籍.zip
- Reinforcement Learning An Introduction(2nd)
- 惯性仪器测试与数据分析[严恭敏 编
- MIT线性代数公开课笔记.zip
- 机器学习 算法
- SAS中国高校数据分析大赛决赛赛题
- 机器学习实践指南:案例应用解析第
- 机器学习常使用到的图像分类数据
- 深入理解机器学习 从原理到算法(带
- 数据挖掘与机器学习 WEKA应用技术与实
- 周志华机器学习全书16章ppt.zip
- 机器学习和深度学习个人笔记合集
- 机器学习实践指南:案例应用解析第
- Spark MLlib机器学习算法、源码及实战详
- Hands On Machine Learning with Scikit-Learn an
- 《机器学习实战》中文版高清PDF+源代
- 数据挖掘导论-中文版-Pang-Ning Tan,M
- 基于阿里云数加构建企业级数据分析
- 国科大-模式识别与机器学习-2017-201
- 数据挖掘建模过程——思维导图
- 比赛测试数据
- 数据挖掘——实用机器学习工具与技
- octave-5.1.0-w64-installer
- 我最想要的Excel数据分析书+数据文件
- 山东大学软件学院机器学习期末复习
评论
共有 条评论