资源简介

聚类分析技术算法,使用鸢尾花数据集,可视化处理

资源截图

代码片段和文件信息

#-*- coding: utf-8 -*-
from __future__ import print_function    #Python3.+ 不需要此项引入
import pandas as pd
 
#自定义连接函数,用于实现L_{k-1}到C_k的连接
def connect_string(x ms):
  x = list(map(lambda i:sorted(i.split(ms)) x))
  l = len(x[0])
  r = []
  for i in range(len(x)):
    for j in range(ilen(x)):
      if x[i][:l-1] == x[j][:l-1] and x[i][l-1] != x[j][l-1]:
        r.append(x[i][:l-1]+sorted([x[j][l-1]x[i][l-1]]))
  return r
 
#寻找关联规则的函数
def find_rule(d support confidence ms = u‘--‘):
  result = pd.Dataframe(index=[‘support‘ ‘confidence‘]) #定义输出结果
  
  support_series = 1.0*d.sum()/len(d) #支持度序列(C1)
  column = list(support_series[support_series > support].index) #初步根据支持度筛选(剪枝,得到频繁项集 L1)
  k = 0
  
  while len(column) > 1:
    k = k+1
    print(u‘\n正在进行第%s次搜索...‘ %k)
    column = connect_string(column ms)
    print(u‘数目:%s...‘ %len(column))
    sf = lambda i: d[i].prod(axis=1 numeric_only = True) #新一批支持度的计算函数(通过相乘得1确认项集结果[数据已转换为‘0无’,‘1有’的形式,每一项集中元素相乘结果为1则证明有该

评论

共有 条评论