帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

一种被定义项的识别策略
A recognition strategy using definienda

作  者: ; ;

机构地区: 北京语言大学

出  处: 《当代语言学》 2007年第1期33-38,共6页

摘  要: 被定义项即是带定义性描述的词或词组。被定义项的识别对于文本检索、文本标引、文本分类、机器翻译、术语数据库的建立与更新等自然语言处理工作具有重要意义。由于被定义项可以出现在定义中的任何一个位置,缺乏明显的位置信息,识别它们具有一定的困难。本文提出了一种在定义模板的基础上抽取被定义项的识别策略,同时考虑被定义项的上下文环境,将抽取出的候选项进行词性组合过滤,针对嵌套与非嵌套候选词的词长与词频,给出不同的处理方法。实验取得了较好的效果,有效地解决了被定义项的识别问题。 Definienda are the words and phrases with definitional descriptions.The fact that definienda lack the position information poses as a difficulty in recognizing them.This paper proposes the method based on definition extraction patterns,with the consideration of context,the rule of part of speech sequence filtering,different strategies of word length and frequency processing to non-nested and nested candidates.Experiments show satisfactory results.

关 键 词: 自然语言处理 被定义项 识别 智能匹配

领  域: [语言文字]

相关作者

作者 晏懋思
作者 王志军
作者 乔东枝
作者 卢炳卫

相关机构对象

机构 广东外语外贸大学
机构 中山大学资讯管理学院
机构 深圳大学外国语学院
机构 华南农业大学
机构 华南农业大学图书馆

相关领域作者

作者 彭川
作者 彭晓春
作者 徐云扬
作者 成海涛
作者 曾小敏