帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

面向人机交互的单目视频三维人体姿态估计研究

导  师: 陈纯

学科专业: H12

授予学位: 博士

作  者: ;

机构地区: 浙江大学计算机科学与技术学院

摘  要: 自动理解图像或者视频序列中的运动人体,一直是计算机视觉研究的重点。除了人类对通过机器探索和仿造自身的兴趣外,促使其成为研究热点的一个重要原因是电子设备的迅猛发展和由其带来的巨大应用市场。本文针对人机交互应用,着重研究单目视频下三维人体姿态估计。 单目视频三维人体姿态估计是计算机视觉研究中最具挑战性的问题之一。系统的观测输入为复杂自然图像,状态输出为高维人体姿态,由观测到状态的系统过程是动态且非线性的。此外,面向人机交互应用时,单目视频三维人体姿态估计系统的核心算法需同时满足准确、鲁棒和实时性要求,系统初始化过程应尽可能自动化.针对以上问题,本文依照模块分别展开研究,并将各部分算法集成至人机交互原型系统,从而实现基于单目视频三维人体姿态估计的人机交互. 本文将单目视频三维人体姿态估计研究划分为三部分关键技术:图像特征提取、人体姿态估计算法以及初始化过程的自动化。其中,图像特征提取研究针对普通低端摄像设备,提出了基于hsv色彩空间的图像特征提取算法,通过采用与人眼视觉感知一致的hsv空间提高图像特征提取的有效性和鲁棒性。针对人体姿态估计算法,本文提出了判别模型和生成模型相结合的三维人体姿态估计数学模型。通过判别模型确定目标姿态的子空间。进而通过生成模型求解目标姿态,充分发挥了判别式模型和生成式模型各自的优势。针对系统初始化过程,本文重点介绍了手工分割视频对象的框架和评价标准,为用户辅助采集训练数据提供便利,减少用户在系统初始化过程中的交互工作量. 根据以上核心算法设计,本文自行开发了基于肢体运动控制的新式人机交互实时系统。为验证系统的有效性,本文进一步开发了一款使用普通网络摄像头交互的简易游戏,为探讨基于人体运动的人机交互设计方法建立了实验平台。通过该平台,本文进行大量用户测试,并探讨这种新型人机交互在全新设计环境下面临的问题和机遇。测试结果表明了本文所提出的单目三维人体姿态估计系统的有效性,同时展示了此类基于人体运动的新型交互系统的独特魅力和广阔应用前景。

关 键 词: 计算机视觉 人机交互 单目视频 三维人体姿态

分 类 号: [TB18 TP11]

领  域: [一般工业技术] [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 熊银根
作者 林民才
作者 刘嘉伟
作者 叶英模
作者 胡晓胜

相关机构对象

机构 中山大学
机构 华南师范大学
机构 华南理工大学
机构 深圳信息职业技术学院
机构 中山职业技术学院

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 刘洪伟
作者 周国林