导 师: 蔡汉添
学科专业: H1002
授予学位: 硕士
作 者: ;
机构地区: 华南理工大学
摘 要: 随着多媒体数字化技术和网络技术的快速发展,人们在生活中接触到的数字音频越来越多。但由于以前设备比较落后,旧的音频资料在录制过程中会产生“咔咔”“兹兹”等噪音,而且音频在从旧介质翻新、录制、数字化、网络传输等过程中都可能受到破坏。因此,音频恢复技术已经成为近年来多媒体处理技术的重要课题之一。 由于个人电脑和网络广泛使用,旧的音频资料逐渐被数字化重建;新录制的音频被直接数字化存储;网络上传输的也是数字化的音频信息。由于数字音频信息被频繁读写或在网络上传输,数据丢失已成为其受损的主要原因。 传统的基于模型的插值方法一般只能对几百个样本进行插值,对于更多的样本则需要通过非常高阶的模型进行插值。但这种高阶模型插值的实现需要耗费大量的计算资源,这对于实现实时信号处理有很大的负面影响。本文对普通ar模型插值方法进行了改进。根据线谱对多项式加权和改变了普通ar模型的合成滤波器,选择合适的加权因子使其极点更加靠近单位圆,从而延长其脉冲响应时间,对更长的信号空缺进行有效插值。以较少的模型阶数获得更好的插值效果,提高了计算效率,为实时音频恢复提供了更好的插值方法。 对于0.1秒以上的信号空缺进行恢复,基于模型的插值方法已经不再适用。本文探讨了基于音频纹理插值的音频恢复方法。该方法将音频分段并提取每帧的mfcc特征参数,然后分析帧间的相似性音频纹理,将已知信号帧根据最大帧间转移概率并结合幅度变化趋势进行排序,用于代替丢失信号。该方法能用于1秒左右的信号空缺恢复。
分 类 号: [TP391]
领 域: [自动化与计算机技术] [自动化与计算机技术]