资源简介
郑捷《机器学习算法原理与编程实践》第2-9章各章节的算法源码及数据集
代码片段和文件信息
from numpy import *
import matplotlib.pyplot as plt
import sys
def LongToInt(value):
assert isinstance(value (int long))
return int(value & sys.maxint)
def loadDataSet(fileName) :
recordlist = []
fp = open(fileName“rb“)
content = fp.read()
fp.close()
rowlist = content.splitlines()
#print rowlist
recordlist = [map(evalrow.split(“\t“)) for row in rowlist if row.strip()]
#recordlist = [row.split(‘\t‘) for row in rowlist if row.strip()]
mn = shape(recordlist)
dataSet = mat(recordlist)[::-1]
for i in xrange(m) :
if recordlist[i][-1] == 0.0 :
recordlist[i][-1] = -1.0
labels = mat(recordlist)[:-1].T
return dataSetlabels
def plotROC(predStrengthsclassLabels) :
# mn = shape(classLabels)
# print mn
# print type(classLabels)
# print classLabels
cur = (1.01.0)
ySum = 0.0
numPosClas = sum(array(classLabels) == 1.0)
yStep = 1/float(numPosClas)
xStep =1/float(len(classLabels) - numPosClas)
sortedIndicies = predStrengths.argsort()
# print sortedIndicies
fig = plt.figure()
fig.clf()
ax = plt.subplot(111)
for index in sortedIndicies.tolist()[0] :
if classLabels[0index] == 1.0 :
delX = 0
delY = yStep
else :
delX = xStep
delY = 0
ySum += cur[1]
ax.plot([cur[0]cur[0] - delX][cur[1]cur[1]-delY]c=‘b‘)
cur = (cur[0] - delXcur[1]-delY)
ax.plot([01][01]‘b--‘)
plt.xlabel(‘False positive rate‘)
plt.ylabel(‘True positive rate‘)
plt.title(‘ROC curve for AdaBoost horse colic datection system‘)
ax.axis([0101])
plt.show()
print “the Area Under the Cure is:“ySum*xStep
def decisionTree(dataSetlabellistD) :
dataMat = mat(dataSet)
labelMat = mat(labellist).T
mn = shape(dataMat)
numSteps = 10.0
bestFeat = {}
bestClass = mat(zeros((m1)))
minError = inf
for i in xrange(n) :
#rangeMin = dataMat[:i].min()
# print dataMat[:i]
rangeMin = dataMat[:i].min()
rangeMax = dataMat[:i].max()
stepSize = (rangeMax - rangeMin)/numSteps
for j in xrange(-1int(numSteps) + 1) :
for operator in [‘lt‘‘gt‘] :
threshVal = (rangeMin + float(j) * stepSize)
predictedVals = splitDataSet(dataMatithreshValoperator)
# print predictedVals
# ddd
errSet = mat(ones((m1)))
errSet[predictedVals == labelMat] = 0
weightedError = D.T*errSet
if weightedError < minError :
minError = weightedError
bestClass = predictedVals.copy()
bestFeat[‘dim‘] = i
bestFeat[‘thresh‘] = threshVal
bestFeat[‘oper‘] = operator
return bestFeatminErrorbestClass
def adaBoostTrain(dataSetlabellistnumIt=40) :
weakClassSet = []
m = shape(dataSet)[0]
D = mat(ones((m1))/m)
# print “D = “D
aggClassSet = mat(zeros((m1)))
for i in xrange(numIt) :
bestFeaterrorEstClass = decisionTree(dataSetlabellistD)
alpha = float(0.5 * log((1-error)/max(error1e-16)))
bestFeat[‘alpha‘] = alpha
weakClassSet.append(bestFeat)
wtx = multiply(-1*alpha*mat(labellist)
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2017-11-11 10:04 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\
目录 0 2017-10-01 22:38 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\KNN\
文件 2746 2017-10-01 22:38 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\KNN\KNN.py
目录 0 2017-09-24 16:34 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\KNN\__pycache__\
文件 3503 2017-09-24 16:34 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\KNN\__pycache__\Nbayes_lib.cpython-34.pyc
目录 0 2017-11-11 10:04 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\
文件 2882 2017-11-06 17:26 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\MyPCA.py
文件 4399 2017-11-06 17:26 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\MyPCA.pyc
目录 0 2017-11-11 10:04 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\
目录 0 2017-11-11 10:04 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s1\
文件 10318 1994-04-18 14:17 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s1\1.pgm
文件 10318 1994-04-18 14:07 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s1\10.pgm
文件 10318 1994-04-18 14:17 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s1\2.pgm
文件 10318 1994-04-18 14:17 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s1\3.pgm
文件 10318 1994-04-18 14:17 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s1\4.pgm
文件 10318 1994-04-18 14:17 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s1\5.pgm
文件 10318 1994-04-18 14:07 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s1\6.pgm
文件 10318 1994-04-18 14:07 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s1\7.pgm
文件 10318 1994-04-18 14:07 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s1\8.pgm
文件 10318 1994-04-18 14:07 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s1\9.pgm
目录 0 2017-11-11 10:04 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s10\
文件 10318 1994-04-18 14:18 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s10\1.pgm
文件 10318 1994-04-18 14:07 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s10\10.pgm
文件 10318 1994-04-18 14:18 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s10\2.pgm
文件 10318 1994-04-18 14:18 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s10\3.pgm
文件 10318 1994-04-18 14:18 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s10\4.pgm
文件 10318 1994-04-18 14:18 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s10\5.pgm
文件 10318 1994-04-18 14:07 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s10\6.pgm
文件 10318 1994-04-18 14:07 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s10\7.pgm
文件 10318 1994-04-18 14:07 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s10\8.pgm
文件 10318 1994-04-18 14:07 郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集\PCA\att\s10\9.pgm
............此处省略5190个文件信息
相关资源
- Hands-On Machine Learning with Scikit-Learn an
- 视觉机器学习20讲[PDF扫描版,带书签
- 机器学习-算法工程师面试宝典
- 指针仪表角度机器学习
- 《百面机器学习算法工程师带你去面
- 机器学习实战.pdf 高清中文版
- web安全机器学习入门-pdf+源码全套
- 百面机器学习-机器学习面经
- Pattern Recognition 4th Edition模式识别英文
- AI算法编程竞赛回顾与题解-1.pptx
- 机器学习实战(中、英文原版)
- 全2020吴恩达机器学习MachineLearning课程
- 机器学习实战中文原版电子书
- 拍拍贷发起的一次与信贷申请审核工
- Feature Engineering Made Easy (2018.04) (
- 最经典的机器学习教科书之一:《模
- 手写体识别数据集
- 机器学习/数据挖掘岗面试准备
- 贝叶斯网引论
- 机器学习实战-Peter Harrington著
- 东北大学人工智能与机器学习课程课
- 用Scikit-Learn和TensorFlow实践机器学习
- 统计学习理论中文版part2
- kaggle肺癌检测第一名解决方案和代码
- Eric Xing:分布式机器学习系统、算法
- 哈佛大学能耗预测项目Prediction of Bu
- 李宏毅——深度学习ppt
- Keras中文文档.pdf
- 机器学习正负样本集(车牌3000+)
- PRML读书笔记
评论
共有 条评论