帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

动态视位模型及其参数估计
A Dynamic Viseme Model and Parameter Estimation

作  者: ; ;

机构地区: 清华大学信息科学技术学院计算机科学与技术系

出  处: 《软件学报》 2003年第3期461-466,共6页

摘  要: 视觉信息可以加强人们对语音的理解,但如何在可视语音合成中生成逼真自然的口形是个复杂的问题.在深入地研究了人们说话过程中口形变化的规律后,提出了一个基于控制函数混合的动态语音视位模型.并针对汉语发音的特点给出了一种系统的从训练数据学习模型参数的方法,这比依靠主观经验人为指定模型参数更为可靠.实验结果表明,视位模型和通过训练数据学习得到的模型参数可以有效地描述汉语发音过程中口形的变化过程. Visual information can improve speech perception. But how to synthesis the realistic mouth shape is a complex problem. After studying the rule of lip movement in speaking, a dominance blending dynamic viseme model for visual speech synthesis is proposed in this paper. Furthermore, considering the characteristic of Chinese speech, a systemic learning method is given to learn the model parameters from training data, which is more reliable than desire parameters according to subjective experience. Experimental results show that the dynamic viseme model and learning method are effective.

关 键 词: 动态视位模型 参数估计 可视语音 静态视位 动态视位 协同发音 语音合成 视觉信息

领  域: [电子电信] [电子电信]

相关作者

作者 严唯娜
作者 黄雪琪
作者 刘学群
作者 许罗迈
作者 屈萍

相关机构对象

机构 华南师范大学教育科学学院心理应用研究中心
机构 广东海洋大学
机构 深圳大学
机构 华南师范大学
机构 广州大学数学与信息科学学院

相关领域作者

作者 黄立
作者 毕凌燕
作者 廖建华
作者 王和勇
作者 郑霞