帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于LLR融合基频与MFCC的说话人性别识别
Speaker gender identification based on linear logistic regression fusion of the pitch and MFCC

作  者: ; ; (陈月朝);

机构地区: 北京大学深圳研究生院

出  处: 《华中科技大学学报(自然科学版)》 2013年第S1期184-187,共4页

摘  要: 提出了一种基于线性逻辑回归的方法,对利用基频和MFCC特征获得的分数进行融合来进行说话人的性别识别,其中包括了基于基频特征的单高斯模型和基于MFCC特征的混合高斯模型.采用语音库包括男性语音文件150个,女性语音文件190个.实验结果中识别率可高达97.65%,比传统单用基频或是MFCC特征的识别率都要高,具有更好的判别性能. A method based on linear logistic regression was proposed in this paper,which fused the scores for pitch and MFCC feature to discriminate the speaker′s gender.The voicebox for this paper included 150speech signals of male and 190speech signals of female.Experimental results show that the recognition rate can be as high as 97.65%,higher than that based on the traditional single fundamental frequency or MFCC feature,with better distinguish performance.

关 键 词: 音频信号处理 声流 鉴定 性别识别 基频 频率倒谱系数 线性逻辑回归

领  域: [电子电信] [电子电信]

相关作者

作者 李清梅
作者 董理
作者 陈华玲

相关机构对象

机构 华南师范大学
机构 中山大学
机构 深圳大学文学院
机构 香港中文大学

相关领域作者

作者 黄立
作者 毕凌燕
作者 廖建华
作者 王和勇
作者 郑霞