资源简介
Apriori算法,实现挖掘关联规则的频繁项集,输入的文本可为单词或数字
代码片段和文件信息
function L = Apriori_BFJ( DBminsup )
%Apriori算法,
%DB-输入的数据库,内容为文件中提取的现实物品
%minsup最小支持度
%L所有的频繁项,包括各项数
[~N] = size(DB); %求X的维数
L=cell(1);
CK=DB{1}; %变量存储所有不同项集此处1项CK表示候选K-项集
for i=2:N
CK=union( CKDB{i}); %使用并集找出所有不同项(种类)
end
LK = Get_frequent( CKDBminsup );%频繁1项集
K = 1;%统计项数
L{K} = LK;%L每个元胞存放对应的K-项集
while(~isempty(LK{1}))%检测是否没有频繁K-项集,否结束
K = K + 1;
if (K == 2)
%应该先产生2项集,然后再统计计算
CK = Get_C2( LK );
elseif (K > 2)
%K-1项产生K-项集
CK = Get_CK( LK );
end
if(~isempty(CK{1}))%如果不能生成K-项集,则令频繁K-为空
LK = Get_frequent( CKDBminsup );%统计次数,进行裁剪
L{K} = LK;%将所有的频繁项集存放一起,只适合少量内容
else
LK = cell(1);
end
end
disp([‘最大频繁项数为:‘num2str(K-1)‘ 项!‘]);
end
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 952 2014-12-04 09:30 Apriori\Apriori_BFJ.m
文件 110 2014-12-03 15:50 Apriori\b.txt
文件 268 2014-12-04 09:13 Apriori\cell_union.m
文件 271 2014-12-04 09:06 Apriori\Get_C2.m
文件 715 2015-01-14 19:54 Apriori\Get_CK.m
文件 615 2014-12-03 17:54 Apriori\Get_frequent.m
文件 462 2014-12-04 09:37 Apriori\run.m
文件 49034 2014-12-04 18:31 Apriori\图表.pptx
..A..H. 165 2014-12-06 08:57 Apriori\~$图表.pptx
文件 13 2014-12-06 09:11 Apriori\运行run.m脚本.txt
目录 0 2014-12-05 22:44 Apriori
----------- --------- ---------- ----- ----
52605 11
评论
共有 条评论