资源简介
对于超市销售记录进行关联挖掘,项目集庞大,每次事务中涉及到项目数非常少。针对这类稀疏数据,提出了基于事务哈希表和线性对象表的FP-Tree改进算法,其只需扫描数据库一次,把相关信息压入事务哈希表和线性对象表中。当支持度和事务记录变化时,可不用重新扫描数据库或扫描数据库更新部分。试验结果验证了该改进算法相对于原算法在建树中的优势,特别在大数据集下,降低了建立FP-Tree的时间
代码片段和文件信息
- 上一篇:Hive操作笔记呕心沥血制作
- 下一篇:socket封装dll
评论
共有 条评论