帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于聚类和信息熵的特征选择算法
A Feature Selection Algorithm Based on Clustering and Information Entropy

作  者: ; ; ;

机构地区: 华南农业大学信息学院

出  处: 《郑州大学学报(理学版)》 2009年第1期77-80,共4页

摘  要: 针对分类属性数据,基于信息熵,提出一种度量特征重要程度的定义,结合聚类分析,提出一种无指导的特征选择方法.该方法时间复杂度与数据集的大小和特征个数近似成线性关系,适合于大规模数据集中的特征选择.实验结果表明,该方法具有较好的性能,提出的特征选择方法有效实用. For categorical data,a method is put forward to measure significance of feature based on information entropy.Based on clustering,an unsupervised feature selection method is presented.The time complexity of the method is nearly linear with the size of dataset and the number of features.Besides,the method is applicable to the selection of features in large dataset.The results of the experiment on UCI datasets show that the method is effective and practicable.

关 键 词: 聚类 信息熵 特征选择 大规模数据集

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 余伟兴
作者 彭湘涛
作者 梁东梅
作者 闫华
作者 吴宝红

相关机构对象

机构 华南理工大学
机构 中山大学
机构 华南师范大学
机构 华南师范大学体育科学学院
机构 中山大学政治与公共事务管理学院

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊