导 师: 李巍华;叶鸣
授予学位: 硕士
作 者: ();
机构地区: 华南理工大学
摘 要: 道路交通环境下的行人检测,是车辆智能驾驶系统中环境感知的一项重要任务,也是车辆后续路径规划、决策、控制的基础。 以道路交通环境下的行人为研究对象,在BDD100K(Berkeley Deep Drive)数据集上对比了传统行人检测方法和基于深度学习的行人检测方法。考虑目标检测的精度和速度,选定YOLOv3作为行人检测算法的基础框架。并自行采集了广州市区道路交通环境下的交通视频,建立了一个行人数据集PD2018。 为了发挥YOLOv3框架的优势,最大化利用计算资源,对YOLOv3网络模型参数进行了优化。具体包括,根据数据集中行人宽高的先验知识采用K-means++聚类算法获得最优anchorbox宽高,对比不同anchorbox数量模型性能确定anchorbox的最佳数量;对比不同输入图片尺寸对模型浮点计算量和性能的影响,提出一种宽高不等输入图片尺寸的模型;针对模型定位精度不高的问题,对模型背景预测框训练阈值和损失函数中坐标预测误差权重进行优化、选取。 针对道路交通环境中行人成像尺寸较小的特点,对YOLOv3网络结构进行了改进。在YOLOv3基础网络的浅层增加更细致的特征提取层,同时增加网络在大尺度特征层上的检测输出,得到改进的网络模型YOLO-M,并通过PD2018数据集进行测试验证。结果表明,YOLO-M在满足实时检测的条件下,检测精度明显提高。 为提高YOLO-M模型鲁棒性,解决漏检问题,分场景引入KCF滤波算法和Kalman滤波算法,并对Kalman滤波算法提出相应改进。实验表明,引入KCF滤波算法可以降低单行人场景中算法的漏检率,提高检测速度,但误检率受YOLO-M误检的影响较大;引入Kalman滤波算法会使速度下降,但可以有效降低多行人场景中算法的漏检率。