导 师: 张见威
授予学位: 硕士
作 者: ();
机构地区: 华南理工大学
摘 要: 行人重识别是指匹配在无重叠视域的摄像机中出现的同一个行人图像的过程。近年来与行人重识别相关的论文高速增长,该技术已成为智能视频监控系统的重要分支。行人重识目前面临着光照、姿态、视角等变化面临的挑战。目前行人重识别的相关研究有从手工提取特征到自动学习特征,从基于图片的重识别到基于视频的重识别,从封闭重识别到开放重识别的趋势。行人重识别基本步骤分为特征提取和距离度量两个基本步骤。本文设计了一个用于提取特征的深度网络FT-FFN(Fine-tunning Feature Fusion Network)。一方面,该网络将CNN特征与低层视觉特征借助全连接层融合在一起。在令网络训练识别行人属性的过程中,反向传播、更新权值的过程中低层视觉特征会影响CNN网络部分的调整,使CNN特征朝与低层视觉特征互补的方向变化。另一方面,在借助训练其识别行人属性的微调过程中,网络融合层输出特征的区分能力得到了很大增强,最终使网络输出的融合层特征具有优良的区分能力。此外,FT-FFN的输出层能产生行人的语义属性,本文讨论语义属性的特征的种类、频率和区别能力,改进了一种中层属性权重的优化方法,并将属性特征与融合层特征结合用于行人重识别。本文在PETA数据集上进行了中层语义属性的实验和测试,在VIPeR、PRID 450s和CUHK01数据集上进行了行人重识别的实验设计和测试,结果表明FT-FFN对中层语义属性的判断较为准确,FT-FFN产生的融合特征具有良好的区分能力。更多还原
领 域: []