中文会议: 第18届全国信息存储技术学术会议论文集
会议日期: 2012-07-12
会议地点: 无锡
主办单位: 中国计算机学会
机构地区: 广东轻工职业技术学院计算机工程系
出 处: 《第18届全国信息存储技术学术会议》
摘 要: 网页的内容信息对于提高聚类质量来说并不完全够用,针对网络社区网页之间存在的天然链接关系,本文提出了一种挖掘用户标签的增强型社区网页聚类算法。本文采用多种距离度量方法,并将网页之间的链接关系挖掘出来,包括相同用户链接,相同标签链接和相同用户相同标签链接信息,然后将社区网页的内容信息相似度和社区网页的链接关系结合起来判断社区网页所属的类别。实验表明,提出的算法是有效的。
领 域: [自动化与计算机技术] [文化科学]