中文会议: 2003中国计算机大会论文集
会议日期: 2003-11-01
会议地点: 北京
主办单位: 中国计算机学会
出版日期: 2003-11-01
出版地: 北京
机构地区: 中国科学院研究生院
出 处: 《2003中国计算机大会》
摘 要: 传统的频繁模式挖掘算法往往会得到成百上千的结果模式,面对繁多的频繁模式用户通常要经过"二次挖掘"才能得到有用的目标模式,怎样根据用户需求直接挖掘用户感兴趣的目标模式是本文的研究目标.本文在FP-树的基础上设计了紧缩的、非冗余的TFP-树,它能有效过滤与目标模式无关的项和事务,而仅保留与目标模式相关的信息,缩小TFP-树的大小规模.同时根据TFP-树的规律和特点,我们设计了最大目标频繁模式挖掘算法,算法的结果模式具有以下两个特点:(1)满足用户需求的目标模式;(2)最大模式.我们的实验结果验证了TFP-树算法是有效的,而且显著改善了FP-树算法的性能.
关 键 词: 数据挖掘 频繁模式 最大目标频繁模式 树 树 机器学习
分 类 号: [TP311.131 TP18]