导 师: 迟乐军
学科专业: H12
授予学位: 硕士
作 者: ;
机构地区: 哈尔滨工业大学
摘 要: 随着互联网的不断发展,网络所承载的业务类型不断增加,并呈现复杂化趋势。在网络安全方面也由传统的基于网络层的控制方式转变为面向业务流的控制方式。网络承载业务类型的快速更新以及网络检测对抗技术的方展,使得依据网络数据包头信息进行业务分类的准确性已经无法满足需求,面向数据包承载内容的深度包检测技术(Deep Packet Inspection: DPI)成为当前业务流识别的主要手段。本文首先对深度包检测中基于正则表达式的识别分类技术进行探讨,重点对正则表达式在实际应用中存在的匹配效率和高空间复杂度问题及其解决方法进行了阐述和分析。在此基础上,针对匹配效率问题,提出了两个分组算法:贪婪式合并分组算法和关联式合并分组算法,通过分组合并使得在提高匹配效率的同时减少内存消耗。针对DFA的冗余内存表现为状态转换表中的无效转换和由于通配符带来的重复转换问题,提出了基于位图与索引表技术的DFA状态表示方法,大大压缩了单个状态的内存利用量;根据不同DFA状态转换表之间存在的相同转换的现象,提出了基于转换函数共享的内存压缩方法。通过使多个DFA状态共享一个转换表,来缩减转换表之间存在的相同转换带来的内存膨胀。实验结果表明本文提出的算法在分组合并结果及内存压缩方面均优于以前的同类算法。在上述算法的基础上,本文实现了基于特征匹配的网络业务流识别系统中的业务流识别模块,并阐述了系统的总体设计思想和实现方法。实际运行结果表明系统具有很好的性能并且内存占用少。目前系统已经投入使用,取得了较好的应用效果。
分 类 号: [TP393.08]
领 域: [自动化与计算机技术] [自动化与计算机技术]