帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于稀疏子集分析的轨迹社区发现

导  师: 陈平华; 谢嘉

授予学位: 硕士

作  者: ();

机构地区: 广东工业大学

摘  要: 随着对互联网中的社会关系网络的研究热度不断提高,物理世界中的轨迹移动网络也得到越来越多的关注。如何挖掘不同用户在同一时间片段内轨迹移动的相似性,从中得到准确的轨迹特征信息,已经成为研究轨迹的重点。但是在现实生活中,用户行为活动产生的轨迹数据都是比较密集的,轨迹的数量在时间片段上的变化是递增的,轨迹的地理信息在地图上的显示却是无章法的,并且用户在日常活动中的移动轨迹存在着行为交叉的问题,因此,对轨迹集的数据进行有效的行为特征分析增加了难度。轨迹数据主要包括用户编码、时间点、经度、纬度和所在地理位置的水平面高度这五个特征。针对密集性大和交叉程度高的轨迹数据的行为分析时,考虑到水平高度差影响较小,本文将轨迹数据转换成由经度纬度定义的时间序列,提出一种基于单源空间特征模型的稀疏子集分析算法,首先,对用户移动的轨迹之间进行空间相似度测量,然后对相似性程度进行稀疏分析,最后进行全局最优的子集聚类。本文算法框架主要如下:(1)针对计算轨迹之间相似性度量准确性的问题,采用了时间序列挖掘-动态时间归整原理来归整长度不同的轨迹之间的最小距离,并使用这个距离矩阵定义轨迹的空间相似度矩阵。同时采用对特征矩阵进行行稀疏化,使得稀疏子集在矩阵中得到更好的表现。(2)通过对每条轨迹经纬度准确的空间建模,从中获得代表该数据集信息量的具有相似度特征的轨迹,这些轨迹和周边轨迹信息保持着最小的距离度量,即周边轨迹可以用特征轨迹来代表。(3)设置特征轨迹的标签,将标签扩散到具有相似性关系的其他轨迹中,不同标签群形成不同的轨迹组,每个轨迹组都代表一个相对独立的社区。社区内轨迹之间具有相似度,而社区与社区之间关联的信息量比较少,保证了聚类分析的特点。针对北京市内所有出租车一周内的行驶轨迹数据集进行实验,分析目标函数在不同约束参数下,轨迹集的聚类个数和聚类簇分布。同时,将本文算法与稠密子图检测算法进行对比,通过对聚类结果和算法运行时间的比较,证明了我们方法的高效性。更多还原

关 键 词: 社区发现 轨迹 稀疏子集 [5108622]聚类

分 类 号: [TP311.13]

领  域: []

相关作者

作者 李贤枢
作者 张增船
作者 汤俊
作者 洪明
作者 孙宗锋

相关机构对象

机构 华南理工大学
机构 中山大学
机构 华南师范大学
机构 中山大学人文科学学院哲学系
机构 中山大学政治与公共事务管理学院

相关领域作者