导 师: 陈世峰
授予学位: 硕士
作 者: ();
机构地区: 中国科学院深圳先进技术研究院
摘 要: 近年来,随着互联网上图文数据的增多,图文检索受到了广泛关注。当前图文检索中面临着特征异质性和检索速度慢等问题,为了解决特征异质性的问题,本文提出了一种跨模态注意力机制模块来抽取更好的图文特征,该模块能够发掘图文特征之间相关联的信息,抽取出的特征能显著地提高图文检索的性能。同时为了提高检索时候的速度,本文用哈希来学习模态特征。跨模态哈希检索因拥有计算资源少,存储高效等特点,受到了广泛的关注。之前大部分研究工作是基于成对标签信息来生成二进制哈希码,而忽略了图文数据的类别标签信息。本文提出一种新的哈希码生成方法,该方法融合了图文数据中的类别标签信息。在算法中加入了类别标签损失函数来生成更好的哈希码。在三个图文数据集上的实验表明了本文方法有效性,特别是在IAPR TC-12数据集上,本文方法比当前最好的方法,在平均精度上提升了7.2%。同时,为了提升网络的运行速度,本文利用CCP对网络进行压缩,该方法在压缩AlexNet近20倍的情况下,能够保证网络的精度基本无损。更多还原
关 键 词: [6358619]哈希 跨模态 检索 深度学习 [2552035]特征抽取
分 类 号: [TP391.41;TP181]