帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于模板的Web信息提取系统的设计与实现
Design and Realization of Template-Based Web Crawler

作  者: ; ;

机构地区: 华南理工大学软件学院

出  处: 《计算机技术与发展》 2011年第11期105-108,112,共5页

摘  要: 随着Web上信息的迅速扩展,Web信息提取技术正应用于搜索引擎、用户兴趣挖掘以及个性化信息获取等多种应用和研究中。文中通过采用模板技术,设计并实现Web招聘信息提取系统。该系统根据已配置的模板,从各高校就业中心网站提取招聘信息,结构化并存入内嵌HSQL数据库中。基于已采集的信息,进行个性化搜索,找到用户所需招聘信息。试验结果表明,该系统能够完成信息的提取和个性化搜索,具有很好的实际效用。另外,由于该系统采用java和内嵌HSQLDB开发,具有高度的平台移植性和很好的移动便捷性。 With information rapidly expanding in the Web,extracting information for Web page is applying many fields. Design and realize a Web Crawler by using template technology. This Crawler extracts information from employment online of college through configured templates, structure information and store in the In-Process HSQLDB. Based on information stored in.database, perform custom- ized search and find useful recruitment informatious for user. Experimental results show that this system is able to complete the extraction of recruitment information and customized search. This system has high practicability. In addition,the system is developed by java and In -Process HSQLDB, so has the high platform portability and very good convenience.

关 键 词: 信息提取 模板 内嵌 个性化搜索

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 廖剑锐
作者 黄燕佩
作者 汪雅君
作者 薛学彦
作者 钱丽艳

相关机构对象

机构 中山大学
机构 南方医科大学外国语学院
机构 广州大学
机构 华南师范大学
机构 广州中医药大学人文社科学院

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊