帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于HMM的百科辞典文本中知识点划分方法

中文会议: 第二届全国学生计算语言学研讨会论文集

会议日期: 2004-08-26

会议地点: 北京

主办单位: 中国中文信息学会

作  者: ; ;

机构地区: 北京工业大学计算机学院

出  处: 《第二届全国学生计算语言学研讨会》

摘  要: 在百科全书条目文本中,往往以几个不同的侧面说明一个条目,一个侧面构成有关这一条目的一个知识点.属于同一类型的条目文本中总是重复出现有限的几个知识点,这些知识点构成了有关该类型的知识点集合,并且这些知识点在该类型中不同的条目文本中的分布有较强的规律性.在条目文本中划分出这些知识点是百科全书中知识提取过程的重要一环.本文中提出了一种基于隐马尔科夫(HMM)模型的划分方法,利用知识点在条目文本中的转移规律以及知识点的词特征分布来判断每个句子的知识点类别,从而达到划分知识点的目的.实验表明这个方法能取得较好的结果,在《中国大百科全书》地理卷的中国县市类型的条目文本中的实验结果的正确率为91.8﹪.

关 键 词: 百科辞典 知识获取 自然语言处理

分 类 号: [T]

领  域: [一般工业技术]

相关作者

作者 晏懋思
作者 王志军
作者 乔东枝
作者 卢炳卫
作者 周群

相关机构对象

机构 广东外语外贸大学
机构 中山大学
机构 华南师范大学
机构 暨南大学
机构 华南理工大学

相关领域作者

作者 许治
作者 万良勇
作者 宋舒
作者 黄佑军
作者 王应密