帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于模糊自适应粒子群的垃圾邮件过滤新方法
Novel spam filtering method based on fuzzy adaptive particle swarm optimization

作  者: ; ; ; ; ; ;

机构地区: 吉林大学计算机科学与技术学院

出  处: 《吉林大学学报(工学版)》 2011年第3期716-720,共5页

摘  要: 提出了一种新的垃圾邮件过滤方法(NSFM),从高维的文本特征中删除冗余的特征,选择对分类精度提高有贡献的特征,从而提高了垃圾邮件过滤的分类准确率。提出了一种模糊自适应粒子群(IFAPSO),通过模糊控制,动态的调控粒子群的惯性权重、学习因子和粒子数量比。NSFM包含核心特征选择、特征选择、垃圾邮件过滤3个阶段,第一阶段利用信息增益求取每个特征的信息值,构建核心特征集合,生成一定数量的核心特征子集;第二阶段根据核心特征子集对IFAPSO进行初始化,利用模糊控制器对粒子群进行自适应的调节,完成特征选择;第三阶段使用支持向量机对最优的特征子集分类,完成垃圾邮件过滤。本文采用PU1、Ling-Spam、SpamAssassin数据集数,通过多种对比实验证明:本方法自适应性强,可选择到较优的特征子集,有效地提高了分类精度,提升了垃圾邮件过滤的性能,具有较高的实用价值。 A Novel Spam Filtering Method (NSFM) is proposed, which removes redundant attributes from the high dimensional attributes, and selects the attributes, which contribute to the classification accuracy, thus, to improve the classification rate of spare filtering. A fuzzy adaptive particle swarm algorithm is developed, which can dynamically control the inertia weight, learning factor and particle number factor using fuzzy control. The NSFM consists of three stages, kernel feature selection, feature selection and spare filtering. In the first stage, information gain is employed to calculate the infarmation value of each feature, and construct a kernel feature set, thereby obtaining a number of kernel feature subsets. In the second stage, according to the kernel feature subset, IFAPSO is initialized and adjusted adaptively using the fuzzy controller, thus finishing spam filtering. In the final stage, support vector machine is used to classify the optimal feature subset and finish spare filtering. In this paper, PUI, I.ing-Spam and SpamAssassin data sets are utilized. Through many comparative experiments, it is confirmed that the proposed method is adaptable and can select better feature subsets, thereby enhancing the classification accuracy rate effectively, and building up the performance of spare filtering. The NSFM has important practical value.

关 键 词: 人工智能 特征选择 粒子群 模糊控制 垃圾邮件过滤 支持向量机

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 张有松
作者 王家君
作者 谢毓祯
作者 丁凤华
作者 吴贺俊

相关机构对象

机构 华南理工大学
机构 中山大学
机构 中山大学人文科学学院逻辑与认知研究所
机构 华南师范大学
机构 华南理工大学工商管理学院

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊