资源简介
python实现apriori 算法并进行关联规则挖掘,内涵详细注释,帮助理解
代码片段和文件信息
# coding=utf8
# python3.5
# http://www.cnblogs.com/90zeng/p/apriori.html
def loadDataSet():
‘‘‘‘‘创建一个用于测试的简单的数据集‘‘‘
return [[1 3 4 5] [2 3 5] [1 2 3 4 5] [2 3 4 5]]
def createC1(dataSet):
‘‘‘‘‘
构建初始候选项集的列表,即所有候选项集只包含一个元素,
C1是大小为1的所有候选项集的集合
‘‘‘
C1 = []
for transaction in dataSet:
for item in transaction:
if [item] not in C1:
C1.append([item])
C1.sort()
# return map( frozenset C1 )
# return [var for var in map(frozensetC1)]
return [frozenset(var) for var in C1]
def scanD(D Ck minSupport):
‘‘‘‘‘
计算Ck中的项集在数据集合D(记录或者transactions)中的支持度
返回满足最小支持度的项集的集合,和所有项集支持度信息的字典。
‘‘‘
ssCnt = {}
for tid in D: # 对于每一条transaction
for can in Ck: # 对于每一个候选项集can,检查是否是transaction的一部分 # 即该候选can是否得到transaction的支持
if can.issubset(tid):
ssCnt[can] = ssCnt.get(can 0) + 1
numItems = float(len(D))
retList = []
supportData
相关资源
- 数据可视化驾驶舱.zip
- 李晓峰通信原理.zip
- 图解西门子S71200PLC入门到实践(清晰
- AI拓客商家联盟V2.1.3前端+后端.rar
- echarts大数据领导仓demo.rar
- [C51单片机开发工具Keil.UV4].Keil.C51.V9
- Deep_Learning_2016.pdf
- zw_Classification1.zip
- Griffiths-IntroductiontoElectrodynamics4thEdit
- ParaViewTutorial.pdf
- xyisv_10236804.zip
- 计算机图形学第4版高清电子书.pdf
- 《多粒度知识获取与不确定性度量》
- 华成英模电课件.zip
- 70d0cd041f738f12db575d3b46e97582.pdf
- OfficeTabEnterprise13.1.zip
- wxu998.rar
- PowerDesigner16.5汉化文件.rar
- jsgis.zip
- PinyinIME(关键代码写了注释).zip
- 锁相环设计、仿真与应用第5版中.pd
- novelOnLine.zip
- SingleSensorImagingMethodsandApplicationsforDi
- ControlSystemsEngineering7th(NormanS.Nise)
- ModernControlSystems13th(RichardC.Dorf).ra
- VectorMagic_1.15pojie.rar
- complexityoflattice__problems.pdf
- xnby_883749.zip
- TOGAF培训讲义-周金根.pdf
- OS12.2驱动,手机虚拟定位软件,Loca
评论
共有 条评论