帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

语音触发SOC芯片的软硬件协同设计及低延时方案

导  师: 晋建秀;李辉宪

授予学位: 硕士

作  者: ();

机构地区: 华南理工大学

摘  要: 随着信息技术的发展,非接触式人机交互以其方便快捷的特点受到广泛关注。而自然语言作为人类主要的沟通方式,其与机器识别技术相结合的交互方式因具有非接触式交互的诸多优点成为人工智能领域的研究热点之一。随着语音识别技术的进步,人们已经可以通过简单的语音指令让机器系统完成相应的操作。随着移动互联网的兴起,语音交互技术在移动终端也得到了广泛应用。但移动终端往往采用电池供电,而长时间处于识别状态将消耗大量的能量,因此移动终端系统往往采用按键或者屏幕触摸的方式来激活语音交互系统。藉此,人们提出设计一款低功耗语音触发芯片来解决长时间识别的问题。但是,低功耗同时又制约了语音触发芯片的计算能力。如何在有限的计算能力下,提供快速、准确的识别结果成为一种挑战。本文通过研究MFCC特征提取过程、GMM-HMM语音识别算法和VAD检测算法,在详尽分析算法各步骤的运算时间和主要运算的基础上,根据分析的结果提出了一套低延时的优化方案。该低延时优化方案包括硬件优化和软件优化。硬件上,采用SRAM作为程序空间载体,加速CPU取指的速度;设计硬件乘加运算和单高斯似然度计算单元,加速主要耗时的计算。软件上,则采用了空间换时间的方式,利用查找表、多项式拟合和合并相同HMM状态的概率计算等方法降低系统识别的时延。基于该优化方案,本文通过利用软硬件协同方法,设计了一款以AndesCore N10为核心的语音触发SOC芯片,并完成了对基于该芯片的语音触发系统进行测试。本文设计的SOC芯片采用TSMC 0.13um工艺制作,核心为AndesCore N10.,外设包括高精度Sigma-Delta ADC,GPIO,SPI等模块。基于该SOC芯片的语音触发系统平均时延为9.952ms,识别率和误识别率分别为95.5%和0.5%。在日常办公环境下,系统误触发次数小于1次/天。研

关 键 词: 非接触式人机交互 语音触发 算法 片上系统

领  域: []

相关作者

相关机构对象

机构 东莞理工学院文学院
机构 广东技术师范学院计算机科学学院

相关领域作者