帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于代价敏感的改进AdaBoost算法在不平衡数据中的应用

导  师: 王国长

授予学位: 硕士

作  者: ();

机构地区: 暨南大学

摘  要: 数据快速增长的时代,数据结构呈现各种各样的形式,数据挖掘方法也层出不穷。常用的分类算法均默认数据集是平衡的,更多的关注分类正确率,而越来越多不平衡数据集的出现为挖掘和分析带来了困难。不平衡数据集更关注少数类样本分类正确的比例,而传统分类算法对于少数类的识别率并不好,因此本文针对不平衡数据集的处理方法提出基于代价敏感思想改进的AdaBoost算法。本文着重在原始AdaBoost算法的基础上,选取逻辑斯蒂回归作为基分类器,引入代价敏感因子,结合代价敏感的主要思想,通过将逻辑斯蒂回归条件概率最大化的决策函数转化为贝叶斯风险最小化,从而确定敏感因子的取值;继而在权值更新的部分引入其值,对原始算法将分类结果简单视为正确分类和错误分类的处理方法进行改进,将其分为分类错误且代价大、分类错误且代价小、分类正确但代价大、分类正确且代价小等四类,通过为样本点赋予代价敏感的权重来提升少数类分类正确率。本文通过数值模拟对比常用分类算法在不同平衡度下的分类结果,后经由实证分析选取违约数据集验证改进方法的有效性,结果表明本文所提出的方法在少数类的识别上有明显提升。更多还原

关 键 词: [8816323]不平衡数据 代价敏感 [8140380]ADABOOST 分类

分 类 号: [TP311.13]

领  域: []

相关作者

作者 王和勇

相关机构对象

机构 华南理工大学

相关领域作者