帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

Deep Web数据源发现和语义标注技术研究
The Research on Technology of Deep Web Source Discovery and Semantic Annotation

导  师: 崔志明

学科专业: 081203

授予学位: 硕士

作  者: ;

机构地区: 苏州大学

摘  要: 随着Internet技术的快速发展,Web数据库得到了广泛应用。这些Web数据库能够根据用户提交的请求,将其内容以HTML页面的形式动态呈现出来。对于传统搜索引擎来说,这部分页面信息并不能被索引到,我们称之为Deep Web。最近几年的研究成果表明,Deep Web蕴含着大量有价值的信息,这些信息与市场需求高度相关。因此,Deep Web已成为一个研究重点,受到研究人员更多的关注。 本文首先介绍了Deep Web的研究框架,然后对Deep Web数据源发现技术和Deep Web语义标注技术进行了深入研究,并提出相应的算法和模型。最后,设计和实现了一个面向图书领域的垂直搜索引擎原型系统。 本文研究的主要内容包括: /(1/)介绍了Deep Web研究的基本框架,并对Deep Web数据库分类和Web数据抽取问题作了概述。 /(2/)分析了传统搜索引擎的工作原理,在此基础上提出一种基于搜索引擎的Deep Web数据源发现方法。 /(3/)根据从国外相关研究中得到的一些启发,提出一种Deep Web数据源间的交叉标注方法。 /(4/)设计和实现了一个图书领域的垂直搜索引擎原型系统,并对上文提出的技术在该垂直搜索引擎上的应用做了分析。 本文还对文中提出的方法和技术进行了实验设计,通过对实验结果的分析进一步验证本文提出的技术方法是有效的。 With the rapid development of Internet technology, Web databases have became prevalent on the Web. Based on user’s request, Web databases display their contents in the form of HTML pages dynamically. The whole information embedded in these pages called as Deep Web can not be acquired by traditional search engines. Recently, the research results show that Deep Web contains a great amount of information which is highly relevant to market demand. Therefore Deep Web served as a research emphasis has been paid more and more attention. This paper firstly describes the research framework of Deep Web, then focuses on technology of Deep Web source discovery and Deep Web semantic annotation. In addition, we propose relevant algorithm and model. Finally, a vertical search prototype system for book domain is presented and accomplished. The main works of this paper include: /(1/) Introduce the basis framework of Deep Web research, then summarize the problem of Deep Web database classification and Web data extraction. /(2/) Analyze the working principle of traditional search engine and propose a new approach of Deep Web source discovery based on search engine. /(3/) Propose a novel approach of Deep Web semantic annotation according to the inspiration from foreign related work. /(4/) Accomplish a vertical search prototype system for book domain and analyze the application of the technology mentioned before. This paper also designs experiments to implement the algorithms and technology mentioned. Experimental results validate that our solution is effective.

关 键 词: 搜索引擎 数据源发现 语义标注 数据集成

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 丁培
作者 庄小妹
作者 苏庆佳
作者 黄彩容
作者 李鹏程

相关机构对象

机构 华南理工大学
机构 中山大学
机构 华南师范大学经济与管理学院
机构 中山大学资讯管理学院信息管理系
机构 华南师范大学

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊