帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于Web元数据的定题信息采集
Topic-specific information gathering based on Web metadata

作  者: ; ; ;

机构地区: 华中科技大学控制科学与工程系系统工程研究所

出  处: 《系统工程与电子技术》 2007年第2期281-284,共4页

摘  要: 针对定题Web检索技术,研究了元数据在定题Web信息采集中的重要作用。设计了基于Web元数据的主题扩展系统及定题信息采集系统,并给出了系统实现的具体步骤。同时提出了基于Web元数据的多种定题信息采集策略。实验证明经主题扩展的Web元数据可作为网页主题相关性的重要判别依据,带增益的元数据平均权值启发式采集策略算法具有较好的性能。 Topic-specific Web search engine is a new direction of information retrieval. Rather than collecting and indexing all accessible Web documents, the topic-specific Web search system restricts its crawl boundary to find links that likely to be most relevant to the given topic. Topic-specific information gathering is the sticking point in the full system. The significance of Web metadata in topic-specific information gathering is discussed. Meanwhile, based on Web metadata, a topic expansion system and a topic-specific information gathering system are designed and a new approach for guiding crawlers to gather topic relevant pages is proposed. Experimental results indicate that the proposed approach has better performance.

关 键 词: 数据处理 网络信息 信息采集 采集策略

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 邹伟娟
作者 张惠文
作者 康鹏
作者 黎晓春
作者 魏海燕

相关机构对象

机构 华南理工大学
机构 中山大学
机构 广东工业大学
机构 华南师范大学
机构 中山大学资讯管理学院信息管理系

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊