帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于结构特征的nBayes双层过滤模型
Structure-based bi-layer nBayes filtering model

作  者: ; ; ;

机构地区: 中国科学院计算技术研究所

出  处: 《计算机应用》 2006年第1期191-194,共4页

摘  要: 由于算法的简单和效果的出色,Na ve Bayes被广泛地应用到了垃圾邮件过滤当中。通过理论与实验分析发现,结构差异较大的邮件集特征分布差异也较大,这种特征分布差异影响到了Na ve Bayes算法的效果。在此基础上,论文提出了一种基于结构特征的双层过滤模型,对不同结构的邮件使用不同的Na ve Bayes分类器分开训练和学习。实验分析表明,Na ve Bayes使用该模型之后效果有明显的提高,已经与SVM非常接近。 Naǐve Bayes algorithm has been widely used in spam filtering, due to its simple mechanism and excellent performance. But when the structures are very different between two emall corpus, the feature distributions vary a lot. The diversity of the feature distributions also affects the performance of Naǐve Bayes. The problem above was analyzed, and a structure-based 2-layers nBayes filtering model was provided, which used different nBayes filter to train and classify mall of different structure, Experiments show that Naive Bayes algorithm's performance improves a lot with this model.

关 键 词: 机器学习 朴素贝叶斯 文本分类 垃圾邮件 基于内容的过滤

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 李利梅
作者 周凌燕
作者 肖可
作者 朱成
作者 曹雨婷

相关机构对象

机构 暨南大学
机构 华南师范大学
机构 广东外语外贸大学
机构 中山大学
机构 华南理工大学

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊