导 师: 郭雷
学科专业: H1104
授予学位: 博士
作 者: ;
机构地区: 西北工业大学
摘 要: 图像理解是一门从图像中自动获取信息的科学,其主要的技术包括图像分割,图像成份的建模,图像分析及推理。该领域的研究包括了开发图像(户内/室外,人,脸,树,大楼,等等)目标特征的自动提取方法以及实现图像解释的有关方法,这对诸如图片的数据库管理或自动建立是非常有益的。图像理解是人工智能中涉及基于输入图像解释来做出决策或完成一些控制系统的主要环节,其在医学和国防等领域中有着广阔的用途。 本文在总结近几年研究成果的基础上,给出了一个图像理解的基本框架结构,并对各部分的具体功能及实现进行详细的分析,文中对图像理解的研究主要分为六个部分。具体是:第一部分着重探讨图像理解方法,在这一部分中首先对当前有关的视觉感知理论进行介绍。简要地回顾低级视觉过程对目标的识别的作用,如从阴影或纹理中感知结构等,其主要目的是集中讨论图像理解方法。并对有关理论的生物学似然性进行了评定。这些来自心理的研究证据对不同的计算模型有着不同的结论,它们或支持于或矛盾于计算模型。除此之外还给出了最近有关生理学的研究成果,这些研究结果表明大脑中的3d信息处理是一个层次型的结构模式。第二部分主要涉及图像分割技术的实现,其主要用来检测目标的边界。重点给出了边缘检测后的再分割算法以及对分割后结果的评价分析方法;创新地提出了基于视觉感知的分割思想。第三个部分主要研究形状表示和分析的各种技术。形状的表示方法或基于边界(边的边之间的关系描述)或基于区域(利用边界检测算法生成的闭合区域)。这一部分主要给出了边界形状分析方法的回顾及链码表示技术。第四部分集中于理解技术与有关知识表示技术的集成以及感知推理方法的研究。第五部分讨论有关图像理解中基于特征相似性匹配及特征匹配方法,该部分是通过应用来自分割算法的信息结果来进行目标识别和推理。由特征匹配构成的识别阶段是源于景象区域,而使用的推理方式主要是不确定推理。最后给出了一个基于跑道理解算法来设计的仿真跟踪系统。 本论文围绕图像理解的一些关键技术进行了一些探索性的研究,研究的内容属于目前图像理解和图像处理领域的研究重点,具有较高的理论及实际的应用价值。其主要贡献在于系统地给出了一个基于视觉感知的图像理解方法实现,为进一步的研究打下了良好的基础。
关 键 词: 图像理解 图像分割 图像分析 模式识别 人工智能 视觉感知
分 类 号: [TP391.41]
领 域: [自动化与计算机技术] [自动化与计算机技术]