帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

一种基于主题词集的自动文摘方法
Automatic summarization method based on thematic term set

作  者: ; ; ;

机构地区: 华南理工大学计算机科学与工程学院

出  处: 《计算机应用研究》 2011年第4期1322-1324,共3页

摘  要: 提出一种基于主题词集的文本自动文摘方法,用于自动提取文档文摘。该方法根据提取到的主题词集,由主题词权重进行加权计算各主题词所在的句子权重,从而得出主题词集对应的每个句子的总权重,再根据自动文摘比例选取句子权重较大的几个句子,最后按原文顺序输出文摘。实验在哈工大信息检索研究室单文档自动文摘语料库上进行,使用内部评测自动评估方法对获得的文摘进行评价,总体F值达到了66.07%。实验结果表明,该方法所获得的文摘质量高,较接近于参考文摘,取得了良好的效果。 This paper proposed an automatic summarization method based on thematic term set for automatic extracting Abstracts from Chinese documents.According to the extracted thematic term set,the method calculated the sentence weights by the weights of the thematic terms,then got the corresponding total weight of each sentence,and selected several sentences with higher weight by percentage,and finally,output the summarization sentences by original order.Experiments were conducted on HIT IR-lab text summarization corpus,and utilized intrinsic automatic evaluation measures to evaluate the performance of the proposed method.Experimental results show that the proposed method achieves 66.07% upon the F-measure,which suggests it can generate higher quality summarization,nearly to the reference Abstract,achieving very good performance.

关 键 词: 自动文摘 主题词集 句子权重 自然语言处理

领  域: [自动化与计算机技术] [自动化与计算机技术] [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 晏懋思
作者 王志军
作者 乔东枝
作者 卢炳卫

相关机构对象

机构 广东外语外贸大学
机构 中山大学资讯管理学院
机构 深圳大学外国语学院
机构 华南农业大学
机构 华南农业大学图书馆

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊