摘要:当今互联网飞速发展,传统的防火墙、控制访问等防护措施已经不能满足日益增长的网络安全需求。作为具有主动...当今互联网飞速发展,传统的防火墙、控制访问等防护措施已经不能满足日益增长的网络安全需求。作为具有主动防御功能的入侵检测,以其能够弥补传统安全手段不足,增强网络系统的安全性,而日益受到研究人员的重视。如今的网络攻击手段千变万化,这也导致通过统计模型或利用算法构建攻击模式库的传统入侵检测方法对未知类型入侵行为束手无策。除此之外,如何在海量的网络流量和系统日志、审计信息中快速有效的发现入侵行为,也是现今入侵检测研究的热点。针对上述问题,本文将改进的聚类和离群点挖掘算法引入到入侵检测中,具体工作如下:(1)深入研究了入侵检测技术,并对入侵检测的定义、模式和分类进行了详细介绍。除此之外,通过分析国内外研究现状,并结合当今网络安全所面临的问题,指出了入侵检测研究的实际意义。(2)详细研究了聚类算法,对聚类算法的定义和分类进行了详细介绍。针对网络流量数据激增,传统聚类算法效率较低的问题,提出改进的聚类算法MFCBR,并将该聚类算法应用到入侵检测之中。(3)深入研究了离群点挖掘算法,详细介绍了离群点挖掘算法的定义和分类。针对传统入侵检测方法无法检测未知类型入侵行为的问题,提出基于网格查询的局部离群点挖掘算法LOGD,并将该离群点算法应用到入侵检测之中。(4)对实验标准数据集KDD CUP 99进行了简单介绍和预处理,实验中通过分层采样获得训练集和测试集,对检测出的异常数据进行标记,通过对比不同算法检测结果的准确率和误检率,验证算法的有效性。此外还引入合成数据集,通过实验结果图像,来呈现不同算法的测试结果。实验结果表明,本文提出的算法在KDD CUP 99数据集和合成数据集上都具有较高的检测准确率,这也证明该本文提出的算法具有较好的普适性,且具有一定的理论和实用价值。本文的创新点在于以下两个方面:(1)提出改进的聚类算法MFCBR,该聚类算法利用网格中心密度差进行网格合并,再利用网格质心与中心间的距离关系来处理边界网格的噪声数据,以此来提高聚类精度。(2)提出基于网格查询的局部离群点挖掘算法LOGD。该算法将被检测数据分配到划分的网格之中,当需要计算数据的k近邻时,就可以从该数据所在的网格或最近邻网格中查找,这样极大较少了算法k近邻距离的计算量,加快了检测速度。更多还原显示全部