导 师: 朱连章
授予学位: 硕士
作 者: ;
机构地区: 中国石油大学华东
摘 要: 目前对于文本知识的知识获取途径有三种方法:(1)自动知识获取(2)半自动知识获取(3)非自动知识获取,通过三种途径的比较,找出一种更为适合的方法--半自动的知识获取方法。利用半自动的知识获取抽取到相关知识,保证了所获取知识的一致性、完备性和精确性。对概念本体通过知识分析,合一求精算法来获得一个完备的知识库。 本文将本体论引入到文本知识的修正与获取中,通过分析比较选择一种最为适合的知识获取方法。利用概念修正、合一求精算法将文本知识转化为规范化的文本知识。保证所获取到一致的、完备和精确的概念描述,通过对文本的编译、分析和知识连接最后生成知识库。 本论文首先介绍了文本知识的特点,并举例说明了不同知识源的知识之间存在的一些重要问题:不一致性,知识粒度不同和知识精度不同等。基于上述问题,我们提出了基于概念联通的知识获取方法。该方法有两大部分组成:第一部分是基于概念联通的合一算法,用来合并相同的概念,以尽量保证概念的属性/关系以及属性值/关系值等的完备性和精确性;第二部分是编译系统。该系统通过对文本的编译、分析修正和知识连接而最后生成知识库。 实践证明,这种知识修正和获取方法是可行的、有效的。利用合一算法可以加快文本知识到规范化文本知识的转化过程,保证所获取到一致的、完备和精确的概念描述,从而提高文本知识获取的效率和质量,进一步整合和优化创建的概念本体和公理,以便更高效地获取领域知识。 在本文的发展中将涉及到很多基本知识,这些基本知识将在第2-4章里面一一介绍。为了更好的掌握这些基本知识,我们在文章中还举了一些例子。
关 键 词: 文本知识 本体论 知识获取 知识连接 合一算法 整合优化
分 类 号: [TP391.3]
领 域: [自动化与计算机技术] [自动化与计算机技术]