帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

文本分类中一种基于词类间概率分布的特征选择算法

中文会议: 搜索引擎与Web挖掘进展

会议日期: 2003-03-14

会议地点: 北京

主办单位: 中国计算机学会

出版日期: 2003-03-01

出版地: 北京

作  者: ; ;

机构地区: 华南理工大学信息网络工程研究中心

出  处: 《全国搜索引擎和网上信息挖掘学术讨论会》

摘  要: 特征选择在文本自动分类中扮演了比较关键的角色,本文在词的类间概率分布基础上,使用分布函数的区分度和相似度,将噪声词的去除和保留词的聚类相结合,提出了一种新的文本特征选择算法,实验结果表明,该算法具有较好的性能效果.

关 键 词: 文本分类 特征提取 类间分布 词聚类 区分度 相似度

领  域: [自动化与计算机技术] [自动化与计算机技术] [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 余伟兴
作者 李伟楠
作者 王志坚
作者 詹佳佳
作者 刘俊延

相关机构对象

机构 广东外语外贸大学
机构 中山大学
机构 深圳大学
机构 广东外语外贸大学思科信息学院
机构 深圳大学外国语学院

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊