帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于微博用户的行为分析与应用研究

导  师: 杨立洪

授予学位: 硕士

作  者: ;

机构地区: 华南理工大学

摘  要: 微博在社交网络中占据重要地位,是人们快速获取各种最新资讯的平台,其随时性、时效性特点一直备受大众喜爱。一方面微博为大众提供娱乐休闲、生活服务的信息分享和交流;另一方面也实现消息的裂变传播。新浪微博作为国内最主流、最具人气的社交网站一直位于Alexa排名前列。对微博历史数据进行研究可以寻找微博热词,定位公众关心的焦点问题,同时根据用户评论,也可以间接了解公众的价值导向。目前国内对微博的三大用户行为:转发、评论和点赞进行综合研究的文献较少。因此,本文重点研究建立用户行为的整体预测模型。具体研究内容如下:第一,本文从博文内容、用户行为和时间分布这三方面来选取模型特征。首先,针对博文内容进行挖掘,选取文本特征关键词。其次,针对不同用户的转发次数分布的不均衡性,利用FCM(模糊C均值)算法对微博用户的转发数进行模糊聚类,通过各簇权重来刻画用户的历史记录。然后,针对用户发表微博的时间分布特点,计算出不同时刻微博用户的平均转发、评论和点赞数。显然,一条微博如果是在用户最大可能性登录微博平台的时间段内发布,则这条微博被阅读的可能性会得到极大提高。最后,本文综合以上特征构建了距离加权KNN模型和FCM加权KNN预测模型。第二,本文选用整体评分作为模型衡量指标,比较普通KNN算法模型,距离加权KNN模型和FCM加权KNN模型的预测效果。本文同时考虑了文本特征词个数对模型预测结果的影响,分别选出100、150、200、250、300个不等的文本特征词作为预测模型的输入,观察整体评分的波动情况。最后,通过对三种算法的比较,本文得出当文本特征词个数为100时,FCM加权KNN预测模型能实现26.62%的整体评分且高于普通KNN算法和距离加权KNN算法。说明在实验范围内FCM加权KNN模型能挖掘出更多微�

关 键 词: 微博用户 行为分析 文本挖掘 算法 加权

领  域: [] []

相关作者

作者 吴柯
作者 廖剑锐
作者 沈元怿
作者 赵卫军
作者 林志鹏

相关机构对象

机构 华南理工大学
机构 中山大学
机构 暨南大学
机构 华南理工大学工商管理学院
机构 华南理工大学新闻与传播学院

相关领域作者