中文会议: 2009中国计算机大会论文集
会议日期: 2009-10-23
会议地点: 天津
主办单位: 中国计算机学会
机构地区: 广东外语外贸大学思科信息学院
出 处: 《2009中国计算机大会》
摘 要: 针对现有相关性度量方法只能直接计算两个连续特征或两个离散特征之问的相关度的问题,本文提出了一种度量连续特征与离散特征之间的相关性方法,在此基础上,进一步提出一种基于混合特征相关度的特征选择方法,并给出了一种闽值选择的指导性策略。提出的特征选择方法关于数据集大小具有线性时间复杂度,可以用于大规模数据集中的特征选择。在真实数据集、UCI机器学习数据集上的实验结果表明,本文提出的相关度计算方法及特征选择方法是有效、可行的。
领 域: [自动化与计算机技术] [文化科学]