帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

汉英双语语料库自动对齐研究

导  师: 夏培肃;张祥

学科专业: H1201

授予学位: 博士

作  者: ;

机构地区: 中国科学院计算技术研究所

摘  要: 该文对汉英双语语料库对齐工作进行了详尽的考察和研究,取得了以下成果:1、针对英语句子边界的歧义,该文提出了一种基于规则、错误驱动的英语句子边界辨识规则学习算法;2、双语语料库自动段落对齐在以往的许多研究中没有受到应有的重视,该文阐述了双语语料库段落对齐的重要性和必要性;3、在汉英句子对齐中,提出了一种基于综合信息的汉英句子对齐方法,既避免了长度方法的信息的不足,又避免过多词对进行匹配的复杂计算;4、在汉英词汇对齐过程中,该文采用位置变形距离进行冲突和消解.在此基础上,该文提出引入部分匹配规则以及多元匹配等等方法进行词汇对匹配的扩充.对于未匹配的词汇对,该文还提出一种基于翻译共现概率的词汇对齐方法;5、该文将以上多个过程结合在一起,给出了一个汉英双语语料库对齐的完整的实现.

关 键 词: 自然语言处理 语料库 双语语料库 对齐

分 类 号: [TP392]

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 晏懋思
作者 王志军
作者 乔东枝
作者 卢炳卫

相关机构对象

机构 广东外语外贸大学
机构 中山大学资讯管理学院
机构 广东科技学院
机构 深圳大学外国语学院
机构 华南农业大学

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊