导 师: 张浩川
授予学位: 硕士
作 者: ();
机构地区: 广东工业大学
摘 要: 随着语音识别技术的日渐成熟,以及物联网的快速发展,使用语音进行人机交互得到了越来越多的应用。与此同时,声纹信息作为语音中包含的隐含信息,可以用来分辨说话人的身份。相比其它身份识别方案,例如指纹识别和人脸识别,声纹识别在方便性和成本控制等方面都具备优势。语音交互的普及使得声纹识别技术愈加受到重视,而深度学习在多领域的成功也给声纹识别技术带来了新的可能性。由于深度神经网络的计算复杂性,本地设备受性能所限,难以运行性能更好的复杂神经网络,因此当前很多相关应用都是通过云端部署模型以便得到更好的准确率,但却无法解决网络延时等因素导致的使用体验问题;声纹识别技术虽然发展多年,且具有非常好的前景,但目前主要的应用还是集中在一些专业领域,普罗大众极少能接触到,使得实用价值大打折扣。针对以上问题,本文中通过对孪生神经网络的深入研究,设计一套基于孪生神经网络的声纹识别方案,并实现了两个声纹识别系统。一是使用深度可分离卷积层代替普通的卷积层,减少模型的计算量,在计算能力有限的嵌入式平台上实现了一个声纹辅助认证系统,通过语音来进行快速准确的辅助认证,保障用户账户的安全,具有一定的实用价值。二是采用分支网络结构,并结合边缘计算技术,在智能家居的情景下,为满足不同用户的个性化需求,设计了一套智能声纹识别系统,系统自主对是否请求边缘节点参与识别进行判断,在提高更好的识别准确率的同时,又不完全依赖边缘节点,减少不必要的计算资源浪费,提高用户的使用体验。最后,通过仿真实验,对上述系统的可行性进行了验证,对声纹识别技术在未来的应用价值进行探索。更多还原
关 键 词: [1976804]声纹识别 深度学习 孪生网络 边缘计算
分 类 号: [TN912.34;TP183]