帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

大规模社交网络中社区挖掘算法研究

导  师: 陆克中;李荣华

授予学位: 硕士

作  者: ();

机构地区: 深圳大学

摘  要: 从图数据中挖掘出互相连接紧密的社区结构是一项具有重大商业价值和社会效益的前沿技术。近年来,随着图数据规模的不断扩大,社区挖掘的复杂性越来越高,这就迫切需要提出一些面向海量图数据的社区挖掘算法加以支持。本论文深入分析了面向大规模图数据的社区挖掘技术所面临的挑战,提出了一种基于MapReduce结构聚类(Structural Clustering Algorithm for Networks)的社区挖掘算法MRSCAN以及一种基于k-core-truss的社区子图模型。具体地,本文的工作主要包括以下2部分内容:(1)提出基于MRSCAN的社区挖掘算法。SCAN是一种知名的基于密度的图聚类算法。不同于一般的聚类算法,该算法不仅能够很好地找到图中的聚类结构,而且还能发现图中的桥接节点和离群节点,在现实应用背景中有着重要的意义。然而,随着图数据规模越来越大,传统的SCAN算法(复杂度为O(m),m为图中边的条数)很难处理大规模的图数据。例如,在具有超过数百万个节点和边的大规模图数据环境中使用传统SCAN算法进行处理基本不可行。为此,本文提出的第一个基于MapReduce的算法MRSCAN来解决SCAN算法的可扩展性问题。首先,MRSCAN分布式地计算图节点之间的结构相似性以及求出核心节点;然后,提出对核心节点维度扩展的概念,将图中的点是否为核心进行维度扩展,使得每个节点在合并聚类时能够被识别是否为核心节点;最后,提出两种分布式合并聚类的算法,通过观察提出一般的合并聚类算法,再利用最小化核心编号对其进行算法层面的优化。在多个真实的网络数据集上进行大规模测试,实验结果验证了MRSCAN算法的有效性和可扩展性。(2)提出了一种新的社区子图模型:k-core-truss。该模型能够很好地解决现有的k-core、k-truss模型所存在的缺陷。基于该模型,给定社交图数据中一个或多个查询用户,实现在大规模的社交

关 键 词: 图数据 社区挖掘 图结构聚类

领  域: []

相关作者

作者 汤俊
作者 洪明
作者 孙宗锋
作者 谷斌
作者 钟美华

相关机构对象

机构 华南理工大学
机构 广东金融学院法律系
机构 中山大学
机构 广州大学
机构 华南师范大学

相关领域作者