帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于深度学习的行为识别与旅游场景分类关键技术研究

导  师: 许勇

授予学位: 博士

作  者: ();

机构地区: 华南理工大学

摘  要: 互联网及多媒体技术的迅猛发展,深刻影响着人们生活的方方面面,每天产生大量的视觉数据。视觉数据的爆炸式增长,影响并推动计算机视觉领域中研究课题的研究发展,例如目标识别、行为识别、场景分类与理解、图像分割等。而且每个研究课题都具有广泛的应用背景,比如行为识别在人机交互、视频监控和关键帧提取等任务中有着较高的应用价值。除此之外,每个研究方向具有本身的线索,用于提高模型的表达能力,例如行为识别的人体姿势和场景识别的分类层次结构。因此,如何设计任务相关的线索,并嵌入到模型中是一个重要的研究方向。本文涉及计算机视觉中的两个研究课题:行为识别与旅游场景分类。我们研究如何在深度模型基础上设计任务相关的高级线索,提升模型的表达能力。针对两种不同的视觉任务,我们分别提出了基于高级线索的行为识别与旅游场景分类的方法:第一种是基于知识原语的静态图像中的行为识别方法;第二种是基于线索增强的深度神经网络的静态图像中的行为识别方法;第三种是基于多阶段的迁移模型的旅游场景分类方法。在三种方法中,前两种是处理静态图像中的行为识别任务,分别采用人体姿势和人体部分的高级线索,最后一种方法采用分类层次结构的高级线索,处理旅游场景分类任务。第一种则采用了多阶段的卷积和pooling操作,也可以认为是一种简化的神经网络;后两种方法均采用了卷积神经网络框架。本文的研究成果和创新点概括如下:1、本文提出了一种基于知识原语的静态图像中的行为识别方法。我们采用了人体姿势的高级线索编码图像中的行为。给定一幅测试图像,首先利用无监督特征学习方法学习与任务相关的滤波器组,然后经过多阶段的卷积、pooling和非线性操作提出特征,再使用BoF框架描述图像中的行

关 键 词: 行为识别 旅游场景 神经网络 线索 迁移学习

领  域: []

相关作者

作者 王晓晶
作者 薛琼
作者 张阿妮
作者 朱怀意
作者 詹裕河

相关机构对象

机构 华南理工大学
机构 暨南大学
机构 中山大学
机构 华南理工大学工商管理学院
机构 中山大学地理科学与规划学院旅游发展与规划研究中心

相关领域作者