帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于聚类分析的改进堆叠算法
An Improved Stacking Algorithm Based on Cluster Analysis

作  者: ; ; ;

机构地区: 佛山科学技术学院

出  处: 《计算机与数字工程》 2013年第11期1725-1728,共4页

摘  要: 在基于Stacking框架下异构分类器集成的元学习基础上,将无监督的聚类应用到分类过程中,提出一种基于聚类分析的改进Stacking集成算法。训练样本首先被基分类器分类,随后分类结果被聚类成多个簇,以便分类结果相一致的样本能够被聚集至同一个簇中,同时,将样本特征属性也应用到聚类过程中以增强聚类效果,在每个聚簇内应用C4.5决策树算法提炼决策边界;在分类阶段,首先找出与待分类样本距离最近的聚簇,之后用此聚簇的决策树模型进行分类。实验结果表明,该算法在分类准确性方面有明显优势。 On the Stacking framework to construct heterogeneous ensemble meta-learning, a modified version of Stacking based on clus- ter analysis was proposed, applying unsupervised K-means clustering to classification process. Instances from training set are firstly classified by all base classifiers, the classified results are then grouped into a number of clusters, which means that one cluster should contain objects that were correctly/incorrectly classified to the same class by the same group of base classifiers. The algorithm apply the whole instance fea- tures in the clustering process to enhance clustering quality. Next, using C4. 5 algorithm on each cluster to build decision tree, the decision tree on each cluster refines the decision boundaries by learning the subgroups within the cluster. When classifying a new instance, the ap- proach attempts to find the cluster to which it is closest, then uses the decision model on each cluster to make a final decision. Experimental results show that the proposed method outperform individual classifiers, majority voting and classic Stacking method.

关 键 词: 分类器集成 聚类 元学习

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 白景坤
作者 王泽欢
作者 汤俊
作者 洪明
作者 孙宗锋

相关机构对象

机构 暨南大学
机构 华南理工大学
机构 广东工业大学管理学院
机构 中山大学
机构 中山大学数学与计算科学学院

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊