作 者:
;
;
机构地区:
中山大学
出 处:
《科技信息》
2009年第4期172-173,共2页
摘 要:
从人工分类的角度看,标题、摘要及关键词中的词条对于文本分类具有更重要的作用,在特征选取中低DF值的词条可能更能代表文本的类别信息。针对以上两个问题,本文提出了基于类别核心词的特征选取方法。首先,从标题、摘要及关键词中提取类别核心词;然后,通过加权方式,强化它们在特征选取中的作用;最后在朴素贝叶斯分类方法上进行实验。实验结果表明,提出的方法能够有效提高中文文本的分类准确率。
关 键 词:
特征选取
类别核心词
朴素贝叶斯
文本分类
领 域:
[自动化与计算机技术]
[自动化与计算机技术]
[轻工技术与工程]