中文会议: 2005第一届中国分类技术与应用研讨会(CSCA)
会议日期: 2005-09-23
会议地点: 北京
主办单位: 中国计算机学会
机构地区: 华南理工大学软件学院
出 处: 《2005第一届中国分类技术与应用研讨会(CSCA)》
摘 要: 关联分类是通过挖掘训练集中数据属性和类别标号之间的关联,从而利用这些规则来为新数据预测类别的分类技术.近年来的研究指出,这种分类技术比C4.5等传统的分类方法具有更高的准确性和更好的效率,因此得到了广泛的关注.然而,之前的工作关注于如何在支持度-置信度的框架上实现这种分类技术,因而存在支持度-置信度框架中阈值指定依赖经验、关联规则产生偏见等问题.提出了一个基于相关性分析的关联分类算法,直接从训练数据集中抽取k个最好的正相关和负相关规则用于分类,从而避免复杂的阈值指定和偏见规则等问题.大量的实验证明,该算法比C4.5算法具有更高的准确性。
关 键 词: 关联规则 关联分类算法 相关性分析 类别标号 数据属性
领 域: [自动化与计算机技术]