帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

声纹识别中语音特征参数提取方法的研究

导  师: 彭妙颜

授予学位: 硕士

作  者: ();

机构地区: 广州大学

摘  要: 声纹识别,又称说话人识别,其本质是利用说话者的语音信息识别出说话者的个人身份。近年来,随着互联网络的飞速发展,声纹识别技术日益受到重视。其作为生物认证技术的一种,具有诸多优点,在银行身份认证,公司异地考勤系统,近距离语音人机交互等领域得到了应用。声纹识别系统主要分为特征参数提取和识别模型建立两大部分。特征参数提取的质量直接关乎识别结果,因此特征参数提取是声纹识别系统最重要部分。说话者语音中包含个性信息和共性信息,个性信息是由个人发音器官的差异、发音声道的差异、发音节奏的差异等造成的,共性信息是同一语言构成中基本单元相同,共性信息主要用于语音识别。声纹识别中特征参数提取目的是提取个性信息,然而共性信息和个性信息交织在一起,目前很难做到只提取个性信息,往往提取的信息中含有共性信息。因此,本文重点研究声纹识别中语音特征参数提取方法。1)基于线性预测系数(LPC)和巴克倒谱系数(BFCC),本文将LPC融入BFCC中,得到线性预测巴克倒谱系数(LPBFCC),由于人类语音中清音和浊音的能量差别很大,又在LPBFCC的基础上加入每帧的短时能量,组成组合特征参数(ELPBFCC),用于声纹识别。在纯净的环境下,相比于MFCC、BFCC识别率分别提高了2.62%、2.46%。此外在噪声环境下,识别效果并不理想。LPC是基于声道模型的特征对噪声敏感,把噪声细节也融进了BFCC,从而导致其鲁棒性差。2)常见特征参数的提取过程中采用的是三角滤波器组,其在结构上单个滤波器内部下降趋势快平滑性不好,导致与前后子带间的联系丢失,进而影响准确率。本文采用高斯滤波器组代替三角滤波器组,一定程度上弥补了三角滤波器组的不足,滤波器组内部下降趋势减慢,增加了平滑性,增强了相邻子带间的联系性。3)针对采用高斯滤波器组�

关 键 词: 声纹识别 巴克频率倒谱系数 高斯滤波器组 准则 高斯混合模型

领  域: []

相关作者

作者 王文中
作者 张美红
作者 李增

相关机构对象

机构 暨南大学经济学院
机构 华南农业大学
机构 暨南大学
机构 深圳大学
机构 深圳大学经济学院

相关领域作者