帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于BI-LSTM-CRF模型的中文分词法

作  者: (张子睿); (刘云清);

机构地区: 长春理工大学电子信息工程学院

出  处: 《长春理工大学学报:自然科学版》

摘  要: 递归神经网络能够很好地处理序列标记问题,已被广泛应用到自然语言处理(NLP)任务中。提出了一种基于长短期记忆(LSTM)神经网络改进的双向长短期记忆条件随机场(BI-LSTM-CRF)模型,不仅保留了LSTM能够利用上下文信息的特性,同时能够通过CRF层考虑输出标签之间前后的依赖关系。利用该分词模型,通过加入预训练的字嵌入向量,以及使用不同词位标注集在Bakeoff2005数据集上进行的分词实验,结果表明:BI-LSTM-CRF模型比LSTM和双向LSTM模型具有更好的分词性能,同时具有很好地泛化能力;相比四词位,采用六词位标注集的神经网络模型能够取得更好的分词性能。

分 类 号: [TP391.1]

相关作者

作者 庞菊香
作者 康秋实
作者 康超
作者 廖伟导
作者 廖刚

相关机构对象

机构 中山大学
机构 暨南大学
机构 华南师范大学
机构 华南理工大学
机构 广东外语外贸大学

相关领域作者

作者 庞菊香
作者 康秋实
作者 康超
作者 廖伟导
作者 廖刚