帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于时空DenseNet的人体动作识别

导  师: 韩国强;李仁德

授予学位: 硕士

作  者: ();

机构地区: 华南理工大学

摘  要: 计算机视觉领域的快速发展,使得计算机对视频内容进行理解变成了可能。人体动作识别作为视频理解中最为重要的部分之一,是计算机视觉领域一个热门且极具挑战性的研究方向。人体动作识别具有广阔的应用前景,在日常生活中的各个领域(比如自动驾驶辅助、体育动作分析和智能视频监控等)发挥着重要的作用。但是,当前人体动作识别依然存在较多挑战性因素尚未被很好地解决,比如不同个体间的差异和运动速度的不同,可能造成人体动作的类内差变大而类间差变小的情况;视频中的光照、视角变化等问题对最终的识别结果造成影响等等。本文在充分总结前人研究工作的基础上,分析当前人体动作识别领域的不足,进而提出基于时空的DenseNet算法解决视频分析中的人体动作识别问题。本文的主要工作贡献在于:首先,本文提出了三维DenseNet。由于视频是由图片序列组成的,仅对于单张图片提取特征会导致视频在时间维度上的信息丢失。为了得到时间维度上的信息,本文将用于单张图片分类的DenseNet网络模型从二维扩展到三维,使网络模型能够在时间维度上对视频图片序列进行特征提取,引入三维卷积和三维池化操作,有效应用于人体动作识别。然后,本文提出了基于时空DenseNet的人体动作识别方法。以三维DenseNet作为基础网络结构,构建时空DenseNet。时空DenseNet网络具有两条信息流,空间流和时间流,空间流网络接受固定长度的图片序列作为输入,时间流网络接受固定长度的动态信息图序列作为输入。空间流网络和时间流网络各自的预测结果在最终分类层进行融合,得到动作识别结果。此外,由于视频序列的时间信息和空间信息是独立而又相互联系的,本文还在时空DenseNet的空间流和时间流之间进行了时空信息融合。为了更好的提取时空特征,本文提出了不同�

关 键 词: 人体动作识别 双流卷积神经网络 时空

领  域: []

相关作者

相关机构对象

相关领域作者