导 师: 李师贤;印鉴
学科专业: H1202
授予学位: 博士
作 者: ;
机构地区: 中山大学
摘 要: 硬件技术的飞速发展带来了一个新的问题,数据产生与获得的速度大大超过了数据处理能力。为此一类新型的应用——数据流应用应运而生,其中数据流挖掘以其实用性吸引了大量计算机研究者。 数据流聚类问题是数据流挖掘领域中最有活力的方向之一。本文讨论了数据流聚类三个方面的问题,首先针对任意形状的数据流模型聚类问题和当前著名数据流聚类算法clustream的不足,提出了一种基于空间划分和组合的聚类算法aclustream,然后针对数据流爆发现象提出了一种基于核密度估计理论和空间网格划分的数据结构——观察点矩阵,并为其设计了一种根据数据流流速大小自动调节运算精度的算法。最后针对现有多数据流聚类模型对数据流数目敏感的问题提出了一种全新的多数据流聚类模型——cmo模型。论文中对本文提出的算法与现有解决此类问题的方法进行了详细的分析、比较。理论分析和大量的实验结果都表明,本文的方法与现有方法相比有很大的提高。
分 类 号: [TP311.131]
领 域: [自动化与计算机技术] [自动化与计算机技术]