导 师: 胡永健
授予学位: 硕士
作 者: ();
机构地区: 华南理工大学
摘 要: 行人检测是指应用相关视觉技术判断输入数据中是否存在行人并给出具体的位置信息,属于目标检测领域的聚焦和细分,经过多年的发展,行人检测技术已经被广泛应用于智能安防和辅助驾驶等领域。在深度学习技术的推动下,当前主流的行人检测算法在许多公开数据集上取得了不俗的表现,但是对于复杂背景下的行人检测,由于环境光照、背景纹理和行人衣着等因素的影响,当前基于深度学习的行人检测算法的检测效果并不理想,依旧存在诸多问题尚未解决。针对上述问题,本文基于深度学习技术对复杂背景下的行人检测算法进行了研究。主要成果如下: 1、提出一种基于SSD与Inception的复杂背景行人检测算法。针对SSD模型在复杂背景下行人特征提取能力不足的问题,结合InceptionBlock和特征融合等方式对SSD模型的多尺度特征提取网络进行改进,在特定特征层间共享上下文信息,提升多尺度特征提取网络的行人特征提取能力,提高模型在复杂背景下的行人检测召回率。 2、基于SSD结合DenseNet与Inception提出两种适用于复杂背景的行人检测算法。针对SSD模型前置基础网络特征提取能力不足的问题,结合DenseNet和InceptionBlock的特性对SSD模型的整体结构进行改进,通过更改前置基础网络和增加子模块的方式提升SSD模型在复杂背景下的行人特征提取能力,提高其在复杂背景下的整体行人检测性能。 3、提出一种基于FocalLoss的自适应焦点损失函数。针对FocalLoss无法有效应用于复杂背景行人检测任务的问题,通过改进FocalLoss的平衡系数和聚焦参数的选取机制,在训练过程中动态调整相关参数的数值,提升其对正负样本及难易样本的区分能力,使其能够更加有效地训练出适用于复杂背景的行人检测模型。