导 师: 文元美
授予学位: 硕士
作 者: ();
机构地区: 广东工业大学
摘 要: 物体识别是计算机视觉领域一个重要的研究方向,其主要目的是为了让计算机可以“看”懂真实世界中的物体,让计算机拥有感知物体的能力。在图像数据激增的时代,计算机自动识别图像中物体的能力将极大地提高人们处理图像、挖掘图像和管理图像的工作效率,因而有着巨大的应用前景。 深度传感器的出现使得新一代相机可以获取物体的RGB-D图像,其中的深度图像弥补了RGB图像中缺少的物体空间结构信息。如何将RGB-D图像与物体识别技术有效地结合起来,提高物体识别准确率成为了计算机视觉领域的一个新的研究热点。 本文围绕RGB-D物体识别技术,针对RGB-D图像融合及预测模型搭建问题,开展了基于张量分解与卷积神经网络的RGB-D物体识别方法的研究。提出了基于张量分解的RGB-D融合方法和基于边缘检测的卷积核数量确定方法。本文主要贡献如下: (1)设计了基于张量分解与卷积神经网络的 RGB-D 物体识别总体框架。该框架包含RGB-D图像融合及预测模型搭建两个模块。其中RGB-D图像融合模块主要包括图像预处理和张量分解;预测模型搭建模块中采用卷积神经网络模型作为预测模型。 (2)针对 RGB-D 物体识别中如何有效利用深度图像中的空间结构信息来提高识别准确度的问题,提出了基于张量分解的RGB-D图像融合方法。该方法主要借鉴张量分解的优势——擅长处理多模态数据,创造性地用张量分解方法解决RGB-D图像融合问题。该方法首先分析RGB-D图像数据性质,再构造成对应的张量;然后,利用Tucker方法对张量进行分解,获得因子矩阵;最后通过因子矩阵对原张量进行投影,获得融合后的RGB-D图像。仿真实验结果表明该方法可提高物体识别准确率,在三个子数据集中,分别可提高19%、7%和11%。 (3)针对卷积神经网�