帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

改进的混合属性数据聚类算法
Improved clustering algorithm for mixture data sets

作  者: ; ; ;

机构地区: 徐州师范大学计算机科学与技术学院

出  处: 《计算机工程与设计》 2007年第20期4850-4852,共3页

摘  要: k-prototypes是目前处理数值属性和分类属性混合数据主要的聚类算法,但其聚类结果对初值有明显的依赖性。对k-prototypes初值选取方法进行了分析和研究,提出一种新的改进方法。该方法有更高的稳定性和较强的伸缩性,可减少一定程度的上随机性。实际数据集仿真结果表明,改进算法是正确和有效的。 The k-prototypes algorithm has become popular technique in solving mixed numeric and categorical data clustering problems in different application domains. However, it requires random selection of initial points for the clusters. So it is obvious that outputs are especially sensitive to initial. Different initial points often lead to considerable distinct clustering results. The method of random selection is analysed and a method of searching initial starting points is proposed through grouping data sets. Experiments show that new initialization method leads to better accurate and scalable.

关 键 词: 数据挖掘 聚类 原型算法 混合型数据 相异度

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 洪明
作者 汤俊
作者 孙宗锋
作者 谷斌
作者 钟美华

相关机构对象

机构 华南理工大学
机构 中山大学
机构 暨南大学
机构 华南师范大学
机构 暨南大学管理学院

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊