机构地区: 南昌大学科学技术学院
出 处: 《计算机仿真》 2010年第11期
摘 要: 在数据挖掘问题的研究中,为减少候选最大频繁项集数量和降低超集存在判断的开销,为了优化算法,提出了一种基于条件矩阵挖掘最大频繁项集的算法(conditional matrix for maximal frequent itemsets,CMMFI)。将压缩频繁模式树表示的频繁项集信息投影到条件矩阵,采用最大顺序尾项排序和扩展2项集剪枝,有效削减了搜索空间,提高了算法的空间效率。使用标号数组优化超集检测的过程,减少了频繁项集比较的次数,减少了花费时间。最后,选用了两个模式长度不同的数据集,将算法与FPMax算法进行性能比较,实验结果验证了算法的有效性和优越性。更多还原
关 键 词: 数据挖掘 最大频繁项集 条件矩阵 压缩频繁模式树
分 类 号: [TP311.13]
领 域: [自动化与计算机技术] [自动化与计算机技术]