摘要:便携式录音设备的普及使得数字音频资料的获取越来越方便,同时各种功能强大的多媒体编辑软件的出现也使得音...便携式录音设备的普及使得数字音频资料的获取越来越方便,同时各种功能强大的多媒体编辑软件的出现也使得音频的编辑和修改越来越容易。若这些被篡改的音频作为电子证据用于法庭等重要场合,将引起严重的社会问题。因此,通过数字音频篡改检测技术验证数字音频数据的可靠性有重要意义,在司法取证和新闻信息真伪鉴定等领域有着广泛的应用前景。数字音频篡改方式可分为语义篡改和属性篡改,本文的研究重点是数字音频语义篡改检测。针对两种典型的数字音频篡改方式,同段音频复制粘贴篡改和异源音频拼接篡改,分别提出一种检测算法。主要工作如下:1、针对同段音频复制粘贴篡改和异源音频拼接篡改,分别总结相应的检测流程。详细介绍并仿真了两篇文章中的算法并分析实验结果,同时指出算法的不足。2、针对同段音频复制粘贴篡改,提出了一种基于动态时间规整(Dynamic Time Warping,DTW)算法的检测方法。首先利用基频检测算法提取待测音频中各个字节的基频序列,然后通过DTW算法计算两两字节基频序列的匹配距离,最后与设定的阈值进行对比,确定待测音频是否存在复制粘贴篡改。另外,本文自建了中文语音数据库,包括男女录音人员分别用不同手机在四种录音环境中录制,用于构建篡改语音库。实验表明,在噪声条件下,该算法与同类算法相比有更好的检测性能。3、针对异源音频拼接篡改,提出了一种基于静音段的检测方法。首先提取表征录音设备信息的梅尔倒谱系数(Mel-Frequency Cepstrum Coefficient,MFCC),并通过广义线性区分性序列核函数(Generalized Linear Discriminative Sequence kernel,GLDS-kernel)扩展为超向量特征,然后利用滑动窗口计算相邻音频特征的相关系数,最后通过判断相关系数是否出现异常确定篡改的存在,并定位具体的篡改区域。实验表明,该算法能有效地检测并定位篡改,对加噪、重采样和压缩具有一定鲁棒性。更多还原显示全部
摘要:人工耳蜗(cochlear implant,CI)是帮助重度以上听力损失者恢复听力的主要手段,其基本工作原理是通过植入耳...人工耳蜗(cochlear implant,CI)是帮助重度以上听力损失者恢复听力的主要手段,其基本工作原理是通过植入耳蜗内的电极阵列直接刺激听神经,来代替缺失的毛细胞实现声电转换功能。由于语音信号所具有的高度冗余性,现代CI植入者仅利用少数通道的时域包络信息就能够在安静环境下进行一对一开放式交谈。对于噪声环境下的言语识别,由于CI产品无法为植入者提供足够的频率分辨率、时域精细结构等信息,其使用时的抗噪声掩蔽能力和音调辨识能力不高,导致CI植入者的聆听效果明显下降,直接影响了植入者的社会交往。在现有硬件结构基础上,研究CI言语处理策略,提高CI产品的抗噪声性能,是当前CI研究的关键前沿问题。针对CI植入者在噪声环境下的言语交流能力差的问题,本文介绍了几种典型的人工耳蜗降噪方案并对其降噪性能进行比较与分析。在参数维纳滤波降噪算法基础上,本文提出一种基于各子带的最优显示增益阈值(apparent Gain Threshold,aGT)的参数维纳滤波人工耳蜗降噪算法,通过优化参数,使得参数维纳滤波降噪算法性能得到提升。论文首先通过降噪后包络信噪比提高程度来评价几种典型降噪方案的降噪性能。理想噪声估计下性能分析表明,相比经典维纳滤波降噪算法,本文所提出算法对子带声学信号降噪和对子带包络信号降噪的降噪效果均有一定提高。然后采用基于改善的最小值递归平均的噪声估计(Improved Minima Controlled Recursive Averaging,IMCRA)、基于最小值统计跟踪算法的噪声估计两种实际噪声估计算法估计噪声谱,使用经典维纳滤波对子带声学信号和子带包络信号降噪,各自的性能分析得出最小值递归平均算法的降噪效果最佳。最后,通过声码器仿真声的正常人的汉语识别实验表明:相对于经典维纳增益的降噪算法,本文所提基于各子带最优aGT值的参数维纳滤波降噪算法在言语识别率上有较明显的提升。例如,在纯净汉语句子加-5dB的white噪声时,在IMCRA噪声估计下,本文所提算法相比经典维纳滤波对子带声学信号降噪和对子带包络信号降噪的平均单词识别率分别提升了12%和35.19%。更多还原显示全部