帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

面向客服对话文本的意见挖掘研究

导  师: 王振宇

授予学位: 硕士

作  者: ();

机构地区: 华南理工大学

摘  要: 企业客服作为客户进行信息反馈的重要渠道之一,蕴含着大量有价值的信息,对服务质量监控、用户需求挖掘和产品改进有着重要的意义。以往由于语音识别技术不足,客服语音的分析主要依赖于人工监听,存在成本高和覆盖范围不足的问题。随着语音识别技术的发展,客服语音识别后的数据变得更可靠。本文针对客服语音识别后的文本进行意见挖掘中的命名实体识别、评价要素抽取和评价搭配关系识别三个方面进行研究。在命名实体识别方面,本文针对客服对话文本存在音近错误和标注数据少的问题,在条件随机场的框架下,引入了无声调拼音和方言混淆拼音两种模糊音特征,并利用已有领域知识构建部分标注数据,高模型在较少完全标注数据下的性能。通过实验证明,引入模糊音特征和部分标注数据均能高命名实体识别模型的性能,其中产品名识别的F1值达到79%,机构名识别的F1值达到84%。在评价要素抽取方面,本文基于双向传播框架,先后对外部语料和客服对话文本语料进行评价要素的抽取。其中,针对外部语料较为规范的特点,本文设计了11种依存句法关系规则;针对客服对话文本噪音多的特点,本文加入基于窗口和词性的规则和支持度阈值来抽取关系词对,迭代识别得到候选评价要素集合,再通过词频过滤和词向量相似度取准确评价要素。通过实验证明,引入外部语料的评价要素和基于词向量相似度的低频词取方法,均能升客服对话文本语料中评价要素抽取的性能。在评价搭配关系识别方面,本文从候选搭配组合的合理性和搭配上下文两个角度来设计特征,在支持向量机模型下,对所有候选搭配进行关系识别。通过实验证明,同时结合两个角度的特征能有效地高评价搭配关系识别模型的性能。

关 键 词: 意见挖掘 命名实体识别 属性词抽取 情感词抽取 评价搭配抽取

领  域: []

相关作者

作者 葛宁
作者 谢建国
作者 温清
作者 刘俊延
作者 刘汉锋

相关机构对象

机构 华南师范大学
机构 暨南大学
机构 中山大学
机构 广州大学
机构 广东外语外贸大学

相关领域作者