帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于互连网的术语定义获取系统
A Web-Based Term Definition Extracting System

作  者: ; ; ; ;

机构地区: 北京工业大学计算机学院

出  处: 《中文信息学报》 2004年第4期37-43,共7页

摘  要: 文中介绍了一个实验性的基于互联网的术语定义获取系统 ,可以方便、迅速的从互连网上查找术语的定义以及与定义有关的内容 ,给用户迅速获得新生术语以及新技术词汇的定义方面的知识提供方便。系统采用一组术语定义的语言学模式 ,以多线程方式高效下载网页 ,并从中匹配符合术语定义模式的文本段落 ,再经一定后续处理 ,形成返回给用户的结果。系统中使用的语言学模式是在一定量的科技期刊语料库中获取的。试验结果表明系统的运行效率高 。 This paper presented an experimental Web Based term definition retrieval system. It can provide the users convenient way to obtain definition related knowledge of newly emerged terms, like Clone, ADSL, etc. The system mainly consists of two modules: web crawling module and term definition matching module. Based on multi thread architecture, the web crawling module downloads web pages efficiently, in which the term definition matching module searches for the term definitions simultaneously with a set of term definition related linguistic patterns. The term definition patterns used in the system are obtained from technology journal corpora. Experiment shows that the system can retrieve term definitions effectively from web and the accuracy of the retrieved result is acceptable.

关 键 词: 人工智能 自然语言处理 术语定义 信息抽取

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 刘华
作者 詹佳佳
作者 黄讴
作者 张艺
作者 龙丽

相关机构对象

机构 中山大学
机构 中山大学人文科学学院逻辑与认知研究所
机构 中山大学资讯管理学院
机构 广东外语外贸大学
机构 广东技术师范学院

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊