摘要:随着网络应用的普及,网络安全问题也随之而来,网络攻击也朝着多样化,复杂化和分布式的方向发展。入侵检测系...随着网络应用的普及,网络安全问题也随之而来,网络攻击也朝着多样化,复杂化和分布式的方向发展。入侵检测系统是发现攻击的第二道防线,其可以对网络中事件进行实时监控,是一种主动的防御技术,弥补防火墙的不足。近年来,随着机器学习的发展,使现有入侵检测与处理有了更为有效的机制,面对大规模的网络数据,由于机器学习算法本身的缺陷和不稳定性,目前仍存在检测准确率低和误报率高,并且检测效率低等难题,研究基于机器学习的网络入侵检测技术具有重要的理论意义和应用价值。本文的主要研究工作包括:(1)介绍了网络入侵检测技术的研究背景和研究意义,综述了国内外研究现状,概括了入侵检测和机器学习相关的理论知识,总结了常见的入侵检测技术,分析了入侵检测常用的机器学习算法。(2)针对网络数据存在大量冗余特征导致检测算法效率和准确率降低的问题,研究基于改进的随机森林(Improved Random Forest)特征选择算法和支持向量机(SVM)的入侵检测方法,通过权重投票融合基于OOB数据分类正确性和曲线下面积置换两种特征重要性度量方法,采用序列向后搜索策略,搜索获得了最优特征子集,解决了实验中数据存在冗余问题。设计了在KDD CUP99数据集上的仿真实验,进行了检测效率和检测准确率的实验结果比较和分析。(3)针对现有的入侵检测算法适应性不强以及检测准确率低的问题,研究基于深度学习多分类器集成方法。采用stacking技术对SVM、NB、KNN、DT等四个分类器的集成,解决了权重投票的集成学习技术只能学习分类器之间线性关系的问题,克服了单个分类算法的缺陷。设计了五层神经网络的仿真实验,并进行了实验结果进行了比较和分析。本文的创新之处包括:(1)提出了一种改进的基于IRF-SVM入侵检测方法,通过改进随机森林特征选择算法,使用权重投票技术融合基于OOB数据分类正确性和曲线下面积置换两种特征重要性度量方法,解决网络数据中存在冗余特征的问题。在KDD CUP99数据集上的实验结果表明,该方法对Normal、DOS、Probe、R2L、U2R的检测准确率分别为98.35%、98.72%、97.63%、93.64%、96.85%,比经典的SVM模型的检测准确率有较好的提高。(2)提出了一种基于深度学习多分类器集成的入侵检测方法,该方法通过深度学习算法集成了SVM、NB、KNN、DT四个分类器,增强了检测算法的稳定性。实验结果表明,该方法对Normal、DOS、Probe、R2L、U2R检测准确率分别为99.76%、99.88%、99.42%、98,63%、98.52%,明显高于基于权重投票算法的分类准确率。更多还原显示全部