帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于词条频率的特征选择算法研究

中文会议: 中文信息处理前沿进展——中国中文信息学会二十五周年学术会议

会议日期: 2006-11-21

会议地点: 北京

主办单位: 中国中文信息学会

作  者: ; ; ; ;

机构地区: 中国科学院计算技术研究所

出  处: 《中国中文信息学会二十五周年学术会议》

摘  要: 特征选择是解决文本分类中特征空间高维性的难题的有效方法.在文本分类中经常用到的自动特征选择方法都将词条在文档中出现一次和出现多次的情况同等对待,因而忽略了词条频率(TF)信息.本文提出了加入TF信息的改进的特征选择方法,有效的利用了TF信息,从而提高了文本分类的精确度.试验结果表明,改进的特征选择方法的试验效果比原始的特征选择方法的效果有明显的提高.

关 键 词: 文本分类 特征选择 词条频率

领  域: [自动化与计算机技术]

相关作者

作者 李利梅
作者 周凌燕
作者 肖可
作者 朱成
作者 曹雨婷

相关机构对象

机构 广东外语外贸大学
机构 中山大学
机构 华南师范大学经济与管理学院
机构 深圳大学
机构 北京语言大学

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊