中文会议: 搜索引擎与Web挖掘进展
会议日期: 2003-03-14
会议地点: 北京
主办单位: 中国计算机学会
出版日期: 2003-03-01
出版地: 北京
机构地区: 华南理工大学信息网络工程研究中心
出 处: 《全国搜索引擎和网上信息挖掘学术讨论会》
摘 要: 特征选择在文本自动分类中扮演了比较关键的角色,本文在词的类间概率分布基础上,使用分布函数的区分度和相似度,将噪声词的去除和保留词的聚类相结合,提出了一种新的文本特征选择算法,实验结果表明,该算法具有较好的性能效果.