帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

新闻数据流的在线事件检测
Online event detection in news stream

作  者: ; ; ; ; ; ;

机构地区: 浙江大学计算机科学与技术学院

出  处: 《浙江大学学报(工学版)》 2011年第6期1006-1012,共7页

摘  要: 针对新闻数据流事件检测算法在实时性、准确率等方面存在的问题,提出一种面向新闻数据流的在线事件检测方法.事件的发生往往伴随着构成该事件的特征(即关键词)在相应时间段内出现的频率明显上升,将这些特征称为突发特征.运用分布拟合检验检测构成新闻数据流的特征在某一时间段内新闻报道中出现频率的分布是否发生明显变化,并进一步利用左边检验确认该时间段内的所有突发特征.分析突发特征的相关性,采用进化谱聚类算法将相关性较高的突发特征聚类在一起构成事件.在路透社新闻数据集第一卷上应用了本算法,验证了该方法能够有效地发现突发特征,并实时地检测出发生的事件,检测出的事件同实际事件有很高的符合度. Event detection in news stream is an important research area in topic detection and tracking community.Unfortunately,most of the existing event detection methods are offline and inaccurate.An online event detection algorithm in news stream was introduced.An event consists of a set of bursty features that demonstrates bursty rises in corresponding keywords frequency as the related events emerge.Goodness-of-fit test was applied to find out these features with obvious changes in distribution of term frequency in a news document.Left side significance test was further used to validate all the bursty features occurred in a time span.Finally,evolutionary spectral clustering was applied to group highly correlated bursty features into bursty events.Experiments on the Reuters Corpus Volume 1 show that the proposed method can effectively identify bursty features and timely detect events.The detected events are consistent with corresponding events in real life.

关 键 词: 在线事件检测 进化谱聚类 假设检验 新闻数据流

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 庞菊香
作者 康秋实
作者 康超
作者 廖伟导
作者 廖刚

相关机构对象

机构 中山大学
机构 暨南大学
机构 华南师范大学
机构 华南理工大学
机构 广东外语外贸大学

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊