资源简介
包含了数据挖掘十大算法中的:Apriori、C4.5、CART、EM、K-means、KNN、PageRank。语言为Python
代码片段和文件信息
‘‘‘
@version 0.1
@date 2016-03-21
@reference
‘‘‘
from numpy import *
def loadDataSet():
return [[1 3 4] [2 3 5] [1 2 3 5] [2 5]]
def createC1(dataSet):
C1 = []
for transaction in dataSet:
for item in transaction:
if not [item] in C1:
C1.append([item])
C1.sort()
return map(frozenset C1)#use frozen set so we
#can use it as a key in a dict
def scanD(D Ck minSupport):
ssCnt = {}
for tid in D:
for can in Ck:
if can.issubset(tid):
if not ssCnt.has_key(can): ssCnt[can]=1
else: ssCnt[can] += 1
numItems = float(len(D))
retList = []
supportData = {}
for key in ssCnt:
support = ssCnt[key]/numItems
if support >= minSupport:
retList.insert(0key)
supportData[key] = support
return retList supportData
def aprioriGen(Lk k): #creates Ck
retList = []
lenLk = len(Lk)
for i in range(lenLk):
for j in range(i+1 lenLk):
L1 = list(Lk[i])[:k-2]; L2 = list(Lk[j])[:k-2]
L1.sort(); L2.sort()
if L1==L2: #if first k-2 elements are equal
retList.append(Lk[i] | Lk[j]) #set union
return retList
def apriori(dataSet minSupport = 0.5):
C1 = createC1(dataSet)
D = map(set dataSet)
L1 supportData = scanD(D C1 minSupport)
L = [L1]
k = 2
while (len(L[k-2]) > 0):
Ck = aprioriGen(L[k-2] k)
Lk supK = scanD(D Ck minSupport)#scan DB to get Lk
supportData.update(supK)
L.append(Lk)
k += 1
return L supportData
if __name__ == ‘__main__‘:
dataSet = loadDataSet()
L suppData = apriori(dataSet)
print L
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\
目录 0 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\.idea\
文件 284 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\.idea\Top10_Algorithms_in_DataMining.iml
文件 159 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\.idea\encodings.xm
文件 735 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\.idea\misc.xm
文件 312 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\.idea\modules.xm
文件 1824 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\.idea\workspace.xm
目录 0 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\Apriori\
文件 1793 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\Apriori\Apriori.py
目录 0 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\C4.5\
文件 4501 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\C4.5\C4.5.py
目录 0 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\CART\
文件 4056 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\CART\Cart.py
文件 3646 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\CART\testSet
目录 0 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\EM\
文件 916 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\EM\em.py
目录 0 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\K-means\
文件 2313 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\K-means\Kmeans.py
文件 1519 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\K-means\testSet
目录 0 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\KNN\
文件 949 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\KNN\KNN.py
目录 0 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\PageRank\
文件 1276 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\PageRank\pagerank.py
文件 325 2016-05-01 03:46 Top10_Algorithms_in_DataMining-master\README.md
- 上一篇:XModem -发送端源代码Python语言实现
- 下一篇:OpenOPC指南
相关资源
- XModem -发送端源代码Python语言实现
- 续Python3.x+PyQtChart实现数据可视化界面
- python爬虫 破解js加密有道词典案列的
- 请求分页存储管理Python实现源代码+课
- 海明校验 python源代码 海明码
- Python程序设计与算法基础教程源代码
- python 打砖块源代码
- Kaggle5000部电影数据挖掘源码
- 彼岸网4K高清图片爬虫源代码
- python遗传算法 源代码
- python基础教程第三版源代码
- 去停用词、测试数据
- 数据挖掘教学视频实战超详细加pyth
- 基于百度API抓取公交站点经纬度数据
- python爬取新浪微博源代码
- 动态规划例题源代码
- 深度学习 莫烦 Keras源代码
- 漏洞扫描器源代码
- Tensorflow笔记-中国大学全部讲义源代码
- 四种聚类算法实现对控制图时间序列
- python数据挖掘分类聚类回归关联算法
- 小甲鱼pythons视频+课件+源代码(96天)
- 《Python神经网络编程》源代码
- DataMiningProject-Bearing 用于轴承大数据的
- 基于Python的三维重建开源代码
- Python 扫雷游戏 完整源代码+图片素材
- yolo3物体检测源代码
- python飞机小游戏源代码
- 零基础学习python pygame 飞机大战可执行
- 用python做的qq源代码
评论
共有 条评论