中文会议: 第九届全国多媒体技术学术会议论文集
会议日期: 2000-10-18
会议地点: 北京
主办单位: 中国计算机学会
出版方 : 中国计算机学会
出版日期: 2001-10-18
出版地: 北京
机构地区: 清华大学
出 处: 《第九届全国多媒体技术学术会议》
摘 要: 对于说话者人脸合成和视频综合编码,由语音或文本预测说话者口形是很重要的。通过对汉语发音及其相关图象的研究,该文提出一种汉音声母韵发音进行分类的方法,按类建立了与口形的对应关系,并得出各类声母的基本口形和韵母的口形变化曲线;另外,作者采用多层前馈神经网络实现了由语音信号倒谱系数及能量到部分口形参数的转换。
分 类 号: [TB912]