帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

文本自动分类技术研究综述
A Summary of Research on Automatic Text Classification Technologies

作  者: ; ;

机构地区: 广东外语外贸大学国际工商管理学院

出  处: 《情报理论与实践》 2012年第2期123-128,共6页

摘  要: 文章从文本表示、特征选择、分类算法、常用基准语料以及评估指标等方面对近年来的研究成果进行综述并讨论。认为短文本分类和多语言文本分类管理是新出现的重要且紧迫的问题,并对这两个问题以及数据集偏斜、多层分类、标注瓶颈等几个关键问题进行重点讨论。最后总结并展望这些研究内容。 Research results in automatic text classification in resent years are summarized and discussed from the perspective of text representation,feature selection,classification algorithm,commonly-used benchmark corpuses and evaluation indices.It's believed that short-text classification and multilingual text organization are the newly-emerging important and urgent problems.This paper focuses on discussing these two problems as well as several other key problems such as class imbalance,hierarchical classification and labeled corpus bottleneck.Finally,the paper summarizes and forecasts these researches.

关 键 词: 自动分类 文本分类 文本处理 综述

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 李利梅
作者 周凌燕
作者 肖可
作者 朱成
作者 曹雨婷

相关机构对象

机构 广东外语外贸大学
机构 中山大学
机构 华南师范大学经济与管理学院
机构 深圳大学
机构 北京语言大学

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊