帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于粒子群优化-模糊聚类的说话人识别
Speaker recognition based on particle swarm optimizition and fuzzy clustering analysis

作  者: ; ; ;

机构地区: 华南理工大学电子与信息学院

出  处: 《深圳大学学报(理工版)》 2008年第2期178-183,共6页

摘  要: 基于粒子群优化(particle swarm optim ization,PSO)提出一种说话人识别算法—三粒子模糊C均值聚类算法.利用3个子群体,每个子群体由规模较小的3个粒子构成,寻求最佳说话人模型.在每次迭代中每个子群体按先后顺序执行PSO算法中的速度更新、位置更新操作和标准FCM算法,对说话人的训练语音数据进行粒子群优化-模糊的软聚类分析,得到聚类中心的最优解,作为该说话人的语音模型.此算法可避免粒子陷入局部最优聚类中心,较准确地记录和估计每个聚类中心的最佳移动方向和历史路径,从而使聚类中心向全局最优解靠近.实验表明,本算法始终稳定地取得优于LBG算法、FCM算法和FRLVQ-FVQ算法的说话人识别性能,对初始聚类中心依赖度低,可有效降低误识率. A new strategy for speaker recognition, triple-particle fuzzy C-means clustering (FCM), called TPFCM, was proposed. Three particle sub-swarms were used to search for the best speaker model based on conventional particle swarm optimization (PSO) algorithm, and the three particles were combined into a triple-particle in each sub-swarm. At each iteration, the triple-particle performed the basic PSO operations and the conventional FCM algorithm in sequence. The speakers' training data were clustered softly, and the best clustering centers were organized as the model of the speaker. This strategy prevented the particle from being trapped in a local optimum, memorizes and estimates the best direction the particle moves toward to the optimum clustering centers. Experimen- tal results demonstrate that the performance of this new strategy is much better than that of LBG, FCM, FRLVQFVQ consistently with lower speaker recognition error rates, and the dependence of the final optimum clustering solution on the selection of the initial clustering centers is reduced effectively.

关 键 词: 说话人识别 与文本无关 粒子群优化 模糊 均值聚类 三粒子群

领  域: [电子电信] [电子电信] [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 张兆民
作者 温重伟
作者 李昶
作者 杨义迅
作者 王和勇

相关机构对象

机构 广东工业大学
机构 华南理工大学
机构 暨南大学管理学院
机构 中山大学
机构 中山大学管理学院

相关领域作者

作者 毕凌燕
作者 王和勇
作者 杨涛
作者 谢惠加
作者 孟显勇