帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于主题嵌入词袋模型及标签词频分解的图像标注研究

导  师: 马丽红

授予学位: 硕士

作  者: ();

机构地区: 华南理工大学

摘  要: 伴随着互联网的发展和社交网络的成熟,图像信息以前所未有的规模进行传播。自动图像标注是目前实现高效地管理和检索海量图像数据的重要技术之一。本文研究自动图像标注方法中词袋模型主题语义表达、数据集标签完善和标注中的视觉近邻与语义近邻的问题。主要工作如下:1、针对词袋模型视觉单词表不表征图像主题,造成语义丢失的不足,构造了一个新的主题嵌入视觉单词表。以图像主题作为伴随信息,将纹理元特征以主题-子主题-分层特征树的方式组织,从而在词袋模型的直方图中通过语义聚集嵌入了主题信息。其中对训练集主题交错和未标主题的情况,利用标签词频分解向量法对训练集进行主题伴随信息生成。实验表明在主题模型的图像标注算法上,所提出的主题嵌入词袋模型比PLSA-Words算法原文中的词袋模型平均查准率提高9.8%,平均查全率高7.9%,调和平均数高9.2%。主题嵌入词袋模型不仅能够表达出图像的纹理元特征,而且含有图像的主题信息,有效改善了词袋模型表示图像特征和语义有效性。2、FastTag标注算法的标签补全模块使用的是布尔型特征代表标签的“有/无”,并未考虑同一图像标签之间的语义重叠程度,标签语义相关特性也并非二值变量。本文提出了基于词频分解向量的改进FastTag标注算法,用标签词频分解向量的取值连续化方法代表标签,使标签语义之间的重叠比例合理的量化,提出新的联合损失函数寻优方法,用于训练标签补全分类器和标签预测分类器。实验表明改进的FastTag算法比FastTag算法平均查准率高1%,标注出标签种类个数提升了1个,在训练集图像标签个数少的情况下标注结果要好。表明改进的FastTag算法能够对图像标签进行有效地扩充。3、针对FastTag标注算法对部分图像标注准确率低的问题,提出了结合标签与特征的图�

关 键 词: 自动图像标注 词袋模型 标签补全 最近邻模型 标签词频分解向量

领  域: []

相关作者

作者 黄玉兰
作者 于艳华
作者 王远远
作者 李伏岭
作者 徐志玮

相关机构对象

机构 暨南大学
机构 华南师范大学
机构 华南师范大学教育科学学院心理应用研究中心
机构 华南理工大学外国语学院
机构 暨南大学管理学院

相关领域作者