机构地区: 广东外语外贸大学思科信息学院
出 处: 《电子学报》 2008年第S1期
摘 要: 本文提出了一种度量特征区分度的定义,进而提出一种基于聚类的特征选择方法CBFS.该方法时间复杂度与数据集的大小和特征个数成近似线性关系,适合于大规模数据集中的特征选择;该方法对数据类型没有限制,适用于混合类型数据.在UCI数据集上的实验结果表明,与文献中的方法相比,本文方法具有较好的性能,说明提出的特征选择方法是有效和实用的.
分 类 号: [TP391.1]
领 域: [自动化与计算机技术] [自动化与计算机技术]