中文会议: 语言计算与基于内容的文本处理
会议日期: 2003-08-09
会议地点: 哈尔滨
主办单位: 中国中文信息学会;中国计算机学会;中国人工智能学会
出版日期: 2003-08-01
出版地: 北京
作 者: ;
机构地区: 中国社会科学院民族学与人类学研究所
出 处: 《全国第七届计算语言学联合学术会议》
摘 要: 本文定义和描述了现代藏语句法组块的基本类型以及相关的形式标记,并在此基础上提出藏语自动分词的组块方法.而实施组块分词方法的措施包括按照一定顺序原则识别组块的形式标记,通过各类标记函数集、辅助词表,以及从组块中抽取的锯法信息确定组块的边界,然后对组块进行分词和词性标注.进一步的设想是对组块进行归并,使其与藏语句法成分形成一致关系,达到消除嵌套组块和利于句法理解的目的.
分 类 号: [TP391.1 H214]
领 域: [自动化与计算机技术] [自动化与计算机技术] [语言文字]