帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

一种基于作者建模的微博检索模型
Microblog Retrieval via Author Based Microblog Expansion

作  者: ; ;

机构地区: 中国科学院计算技术研究所

出  处: 《中文信息学报》 2014年第2期136-143,共8页

摘  要: 近年来,微博的发展令人瞩目,微博检索已经成为一个重要的研究课题。而微博具有文本内容短、更新快、融合社交网络等特点,这些特点使微博的检索不同于传统的web检索。该文首先分析了传统的向量空间模型、概率模型以及基本的语言模型直接用于微博检索将面临的问题;接着在语言模型框架下提出了利用作者信息对微博内容进行扩展的思想,即利用作者信息重新估计微博的语言模型;然后针对话题模型在短文档训练中存在的问题,提出了使用作者的文档话题模型来进一步扩展微博的内容;最后在TREC公开数据集上进行了实验。实验结果表明,可以通过合理使用作者信息来有效的提高微博检索的效果。 In recent years, the development of the microblogging is impressive. The microblogging retrieval has be- come an important research topic. Microblog texts are short, quick updated, and circulated overthe social network, which makes themicroblogging search different from the traditional web search. In this paper, we first comparethe traditional vector space model, probabilistic model and the basic language model in microblog search. Thenwe propo- seto expand the microblog textvia the author informationto improve the retrieval. Asfor the issue caused by theshort document occurred in the topic model training, we usethe author's topic model to further extend the content of mi- croblogging. Tested on the twitter data set,the results show thatthe proposed author modelcan improve the retrieval effects in microblogging search task.

关 键 词: 微博 作者模型 微博检索 平滑

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 庞菊香
作者 康秋实
作者 康超
作者 廖伟导
作者 廖刚

相关机构对象

机构 中山大学
机构 暨南大学
机构 华南师范大学
机构 华南理工大学
机构 广东外语外贸大学

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊