帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于类别概率的特征选择方法

导  师: 黄文学

授予学位: 硕士

作  者: ();

机构地区: 广州大学

摘  要: 大数据时代,各类数据都在快速增长.然而不是所有的数据都有价值,或者说存在一些垃圾信息,这给数据分析和决策带来一定的困难.因此需要从大量的数据中提取有用的信息,特征选择便成为处理该问题的重要方法,即从原始特征中提取有效特征进而达到降维的效果.除此之外,在含有一个因变量的高维或者大样本的离散型数据中,其解释变量的某些类别可能包含信息较少或者冗余.为了提高数据分析与数据挖掘的效率,我们提出了一个基于类别概率的特征选择方法.它能将各离散特征中包含信息丰富的类别选出来,将包含信息较少或者冗余的类别合并从而得到新的特征,并用可靠性度量指标和关联度对基于该方法和基于原始特征中选择进行对比分析,评价选择后的特征的可靠性和预测能力.最后用两组实际数据进行验证分析,实验结果显示了该方法的有效性.

关 键 词: 特征选择 分类数据 虚拟变量 可靠性

领  域: [] []

相关作者

作者 曹金龙
作者 李虹
作者 陈佳
作者 陈骏良
作者 邓端富

相关机构对象

机构 华南理工大学
机构 暨南大学
机构 暨南大学管理学院会计学系
机构 华南师范大学
机构 华南师范大学地理科学学院

相关领域作者