帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于邻域混合抽样和动态集成的不平衡数据分类方法
Imbalanced Data Classification Method Based on Neighborhood Hybrid Sampling and Dynamic Ensemble

作  者: (高锋); (黄海燕);

机构地区: 华东理工大学信息科学与工程学院,上海200237

出  处: 《计算机科学》 2017年第8期225-229,共5页

摘  要: 不平衡数据严重影响了传统分类算法的性能,导致少数类的识别率降低。提出一种基于邻域特征的混合抽样技术,该技术根据样本邻域中的类别分布特征来确定采样权重,进而采用混合抽样的方法来获得平衡的数据集;然后采用一种基于局部置信度的动态集成方法,通过分类学习生成基分类器,对于每个检验的样本,根据局部分类精度动态地选择最优的基分类器进行组合。通过UCI标准数据集上的实验表明,该方法能够同时提高不平衡数据中少数类和多数类的分类精度。 The class imbalance problems severely affect the performance of the traditional classification algorithm,leading to decrease the recognition rate of the minority.In order to solve this problem,a hybrid sampling technology based on neighborhood characteristic was proposed to enhance the classification accuracy of minority class.This technology changes the sampling weight according to the class distribution in the samples neighborhood,and uses the hybrid sampling to obtain the balanced data subset.Then the base classifiers are generated,for each test sample,a dynamic ensemble method based on local confidence is proposed to select the optimal base classifier sets.The experiments on UCI datasets show that the method has high classification accuracy rate of both minority and majority class for imbalance datasets.

关 键 词: 数据挖掘 不平衡数据 近邻 混合抽样 集成学习

相关作者

作者 王和勇
作者 申华
作者 钟雪飞
作者 吴戴赋
作者 梁颖殷

相关机构对象

机构 华南理工大学
机构 暨南大学
机构 中山大学
机构 暨南大学管理学院
机构 华南师范大学

相关领域作者

作者 庞菊香
作者 康秋实
作者 康超
作者 廖伟导
作者 廖刚