帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

口语对话系统中的对话行为识别研究

导  师: 黄沛杰

授予学位: 硕士

作  者: ;

机构地区: 华南农业大学

摘  要: 面向任务(task-oriented)的限定领域(restricted domain)口语对话系统(spoken dialogue system,SDS)因专于某一特定的任务,能帮助人们完成更多的问题和工作,比开放领域的聊天机器人更有研究和应用价值。对话行为(dialogue act,DA)识别是处理用户话语的关键环节,是后续对话控制和应答的基础。在研究进展中,DA识别通常被当作短文本分类问题,但口语对话系统话语通常具有的噪音多、特征稀疏和主题不明确等特点,DA识别仍然存在许多挑战。  根据用户话语是否携带领域语义信息,本文将其分为领域内(in domain,ID)话语和领域外(out of domain,OOD)话语,并在手机导购领域口语对话系统的对话语料中验证了ID和OOD话语分别单独进行DA识别的方法,能有效地提升口语对话系统的总体DA识别准确率,从而确定了ID和OOD话语分离进行DA识别优化研究的方案。  在ID话语的DA识别上,综合使用多种词汇、语法、语义等特征,并利用长短期记忆人工神经网络(long-short term memory,LSTM)的序列性刻画对话历史等上下文信息,使得对话行为识别从单句扩展到语境中的理解。而在OOD话语的DA识别方面,考虑到卷积神经网络(convolutional neural network,CNN)在特征表达方面的优势以及随机森林(random forest,RF)模型良好的泛化能力,本文提出一种CNN-RF混合模型的OOD话语DA识别方法,综合了基于CNN的局部特征提取器和基于随机森林模型的DA分类器。  本文的实验数据来自于所在研究室实现的中文手机导购口语对话系统。DA类别是以国际标准化组织拟订的新对话行为标注体系(ISO24617-22012)为基础,参考SWBD-DAMSL对话行为标注拟定的,包括5种ID话语DA和25种OOD话语DA。各种DA识别模型通过交叉验证的方式进行了参数选择。实验表明,本文提出的ID和OOD话语的DA方

关 键 词: 口语对话系统 行为识别 聊天机器人

领  域: [] []

相关作者

相关机构对象

相关领域作者