导 师: 毛雪岷
授予学位: 硕士
作 者: ;
机构地区: 合肥工业大学
摘 要: 随着科学技术的不断发展,在各个行业中积累了大量的数据,但是,我们面对如此庞大数据的时候,经常会感到迷茫,不能够从这些数据中提取出对我们有用的知识,造成“数据丰富,信息贫乏”这种现状。在这种情况下,数据挖掘技术应运而生,它能够帮助我们从大量数据中提取出有价值的知识模式,被认为是最具发展前景的一项关键技术。@@聚类分析技术是数据挖掘的一项重要功能,近年来,聚类分析技术得到蓬勃的发展,出现了很多的聚类分析方法,例如,基于划分的方法、层次聚类方法、密度聚类方法、模型聚类方法等。这些方法在处理一般性问题时表现效果很好,但是,传统的聚类分析技术主要是针对结构化类型的数据和非结构化类型的文本进行聚类分析的,而对于案例这种半结构化类型数据的聚类分析的研究相对较少,因此,本文主要是在传统聚类分析技术基础之上提出一种全新的案例聚类分析技术。@@本文首先,简要的介绍了数据挖掘的概念、功能、所使用的方法与技术以及数据挖掘在现实生活中的应用。其次,介绍了案例的表示以及案例库的构造基本知识,主要包括基于关系数据库的案例表示和基于xml的案例表示。再次,介绍了聚类分析的相关概念,主要包括聚类的定义、步骤、所使用的数据结构及数据类型、聚类的方法和聚类的典型要求。最后,在前面章节所介绍的案例的表示以及聚类分析的基本知识基础之上,提出了针对案例的聚类分析技术,即基于几何光滑度的案例聚类方法,并对该方法进行了详细的阐述。@@关键词:数据挖掘;聚类分析;共享最近邻;相似度;光滑度。
关 键 词: 数据挖掘 聚类分析 共享最近邻 相似度 光滑度
领 域: [自动化与计算机技术] [经济管理] [社会学]