帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于模糊粒度计算的文本聚类研究
Research of text clustering based on fuzzy granular computing

作  者: ; ; ; ;

机构地区: 北京科技大学计算机与通信工程学院

出  处: 《计算机工程与应用》 2010年第13期53-55,共3页

摘  要: 典型的文本聚类算法是一种硬划分,但是实际上由于中文文本的多样性和大量性更适合进行软划分,模糊集理论的提出为这种软划分提供了有力的分析工具。传统的模糊聚类方法大都是通过对隶属度的矩阵逐步迭代得到模糊等价矩阵或模糊划分的方法实现聚类,这个过程需要大量的存储空间。基于模糊粒度计算的文本聚类算法是在文档集合的模糊粒度空间上给定一个归一化的距离函数d(di,d)j,对距离小于粒度dλ的文本进行动态聚类。通过实验证明此方法在解决文本聚类问题时具有降低计算复杂度和空间复杂度,适于大量文本的聚类处理。 The typical algorithm of text clustering is a"Hard Partition"one.Actually,Chinese text is better to treat with"Soft Partition"for its diversity and largeness.The fuzzy-set theory supplies a powerful analyzing tool to this"Soft partition".Traditional fuzzy text clustering methods mostly get the fuzzy equivalent matrix or fuzzy division by iterating the matrix of membership degree.Huge storage space is necessary for that process.The text clustering based on fuzzy granular computing will work as:First a normalized distance function d(di,d)j in the fuzzy granularity space of text set is provided,and then the function is used to do a dynamic clustering work to text who has a less distance than granularity dλ.Approved by the test,this method has such advantages on reducing the computing complexity and space complexity,suitable for the status that many samples need to be processed.

关 键 词: 模糊 粒度计算 文本聚类 归一化距离函数

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 黄家兴
作者 周凌燕
作者 熊玲林
作者 宋华
作者 张春芳

相关机构对象

机构 中山大学
机构 广东外语外贸大学
机构 暨南大学
机构 中山大学人文科学学院哲学系
机构 华南师范大学

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊