中文会议: 仪器仪表学报2004增刊(下册)
会议日期: 2004-08-01
会议地点: 大连
主办单位: 中国仪器仪表学会
机构地区: 广东工业大学自动化学院
出 处: 《第二届全国信息获取与处理学术会议》
摘 要: 属性约简是对大数据集进行数据处理的需要.依据ROUGH集理论关于属性约简的基本理论和判定条件,以及大数据集启发式约简中属性重要性的重要意义,对大型数据表的启发式属性约简分别提出等价类最大近似度MAAEC和等价类最大差异度MDAEC的属性重要性定义和启发式约简算法.实例演算证明此两法计算有效,在大数据表高维情况下可有效控制计算量,获得属性最小约简集.
关 键 词: 集理论 属性约简 属性重要性 大数据集数据处理 数据处理
领 域: [一般工业技术]