帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

混合属性数据集的基于近邻连接的两阶段聚类算法
A Two-Phase Clustering Algorithm Based on Near Neighbor Connection for Mixed Data Set

作  者: ;

机构地区: 重庆三峡学院计算机科学与工程学院

出  处: 《计算机工程与科学》 2012年第9期135-142,共8页

摘  要: 面对混合属性数据集的数据预处理需求,本文在给出若干定义及相关性质之后,提出了一种基于近邻连接的两阶段聚类算法。为提高算法的时间效率,给出了算法改进的思路与技术。多个人工数据集和UCI标准数据集的仿真实验结果表明,对于一些具有明显聚类分布结构的数据集,该算法经常能取得比k-means算法和AP算法更好的聚类精度,说明它具有一定的有效性。为进一步推广并在实际中发掘出该算法的应用价值,最后给出了几点研究展望。 In order to effectively preprocess some mixed data sets,this paper first gives some definitions and related properties,then presents a two-phase clustering algorithm based on near neighbor connection. To improve the time efficiency of this algorithm, some improving ideas and techniques are described. Through the simulation experiments of some artificial data sets and UCI standard data sets, we can verify that this clustering algorithm can often obtain better clustering quality than the k-means algorithm and the AP algorithm when facing to some data sets with apparent clusters. So we can say that this clustering algorithm has certain value. In the end,several research expectations are given to disinter and popularize this method.

关 键 词: 混合属性 聚类特征 初级聚类 近邻图

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 欧阳建国
作者 欧晓万
作者 于涛
作者 殷炼乾
作者 黄晓宇

相关机构对象

机构 华南理工大学
机构 中山大学
机构 华南师范大学
机构 中共韶关市委党校
机构 中山大学政治与公共事务管理学院

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊