帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于深度学习的图像和文本检索

导  师: 陈世峰

授予学位: 硕士

作  者: ();

机构地区: 中国科学院深圳先进技术研究院

摘  要: 近年来,随着互联网上图文数据的增多,图文检索受到了广泛关注。当前图文检索中面临着特征异质性和检索速度慢等问题,为了解决特征异质性的问题,本文提出了一种跨模态注意力机制模块来抽取更好的图文特征,该模块能够发掘图文特征之间相关联的信息,抽取出的特征能显著地提高图文检索的性能。同时为了提高检索时候的速度,本文用哈希来学习模态特征。跨模态哈希检索因拥有计算资源少,存储高效等特点,受到了广泛的关注。之前大部分研究工作是基于成对标签信息来生成二进制哈希码,而忽略了图文数据的类别标签信息。本文提出一种新的哈希码生成方法,该方法融合了图文数据中的类别标签信息。在算法中加入了类别标签损失函数来生成更好的哈希码。在三个图文数据集上的实验表明了本文方法有效性,特别是在IAPR TC-12数据集上,本文方法比当前最好的方法,在平均精度上提升了7.2%。同时,为了提升网络的运行速度,本文利用CCP对网络进行压缩,该方法在压缩AlexNet近20倍的情况下,能够保证网络的精度基本无损。更多还原

关 键 词: [6358619]哈希 跨模态 检索 深度学习 [2552035]特征抽取

分 类 号: [TP391.41;TP181]

领  域: [] []

相关作者

作者 温子梅
作者 陈先梅
作者 谢久书
作者 袁辉初
作者 李韧之

相关机构对象

机构 中山大学
机构 华南师范大学
机构 华南理工大学
机构 华南师范大学政治与行政学院
机构 华南师范大学物理与电信工程学院

相关领域作者