帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于深层特征抽取的日文词义消歧系统
Japanese word sense disambiguation system based on deep feature extraction

作  者: ; ; ; (田中贵秋);

机构地区: 北京科技大学计算机与通信工程学院

出  处: 《北京科技大学学报》 2010年第2期263-269,共7页

摘  要: 词义消歧的特征来源于上下文.日文兼有中英文的语言特性,特征抽取更为复杂.针对日文特点,在词义消歧逻辑模型基础上,利用最大熵模型优良的信息融合性能,采用深层特征抽取方法,引入语义、句法类特征用于消解歧义.同时,为避免偏斜指派,采用BeamSearch算法进行词义序列标注.实验结果表明,与仅使用表层词法类特征方法相比,本文构造的日文词义消歧系统的消歧精度提高2%~3%,动词消歧精度获得5%的改善. The features of word sense disambiguation (WSD) come from the context. Japanese has linguistic features of both Chinese and English at the same time, thus the feature extraction of Japanese is more complicated. Considering Japanese features, based on the proposed WSD logic model and applying the characteristics of information integration of the maximum entropy model, WSD was solved by the deep feature extraction method, introducing semantics and syntactics features. Meanwhile, for preventing the skewed assignment of lonely word sense, the word sense tagging of word sequences was completed with the BeamSearch algorithm. Experiment results show that compared with WSD methods which only focus on the surface lexical features, the disambiguation accuracy of the Japanese WSD system proposed in this paper increases 2% to 3% , and the WSD accuracy of verbs improves 5%.

关 键 词: 自然语言处理 词义消歧 最大熵模型 特征抽取

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 晏懋思
作者 王志军
作者 乔东枝
作者 卢炳卫

相关机构对象

机构 广东外语外贸大学
机构 中山大学资讯管理学院
机构 暨南大学文学院
机构 深圳大学外国语学院
机构 深圳职业技术学院

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊