帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于多过滤器集成学习的在线垃圾邮件过滤
Online Spam Filtering Based on Ensemble Learning of Multi-filter

作  者: ; ;

机构地区: 国防科学技术大学计算机学院

出  处: 《中文信息学报》 2008年第1期67-73,共7页

摘  要: 垃圾邮件过滤就是在线对邮件做出Spam(垃圾)或Ham(非垃圾)的判断,这是一种根据客户反馈不断自学习的过程。本文抽取邮件的语言特征和行为特征构建多个简单过滤器,然后采用集成学习方法组合这些简单过滤器,获得了比简单过滤器更高的性能。实验表明单一特征学习的计算复杂性低、速度较快,而集成学习的效果更好。本文提出的将SVM集成学习用于邮件过滤的方法,在各种集成学习方法中效果最好。 Spam filtering is defined as a task trying to label Emails with Spam or Ham in an online situation, which is essentially a self learning procedure with user's feedback. There are already some simple filters applying the linguistic features or behavior features. In this paper, we use the ensemble learning method to combine multi filter and achieve a higher performance than the single one could. The experiment result shows the single feature learning is fast and the ensemble learning has better effects, in which the proposed SVM ensemble method has the highest performance.

关 键 词: 计算机应用 中文信息处理 垃圾邮件过滤 机器学习 集成学习 支持向量机

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 刘洋
作者 占勇
作者 洪雁
作者 程雪宁
作者 瞿娜娜

相关机构对象

机构 华南理工大学
机构 深圳职业技术学院
机构 广东药科大学
机构 暨南大学图书馆
机构 汕头大学图书馆

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊