文献详情 - Gdtheory理论粤军网|广东智库信息化平台

全部文献媒体文章报刊论文会议论文学位论文出版专著研究报告课题成果特色专题

高级检索

您现在所在的位置：网站首页 > 知识中心 > 文献详情

文献详细_{Journal detailed}

基于XML的Web信息采集系统设计与实现

收藏

作　　者： ;

机构地区： 蚌埠学院

出　　处： 《齐齐哈尔大学学报：自然科学版》 2017年第2期25-28,共4页

摘　　要： 设计基于XML的Web信息采集系统,抽取出HTML页面中半结构化数据后,将清洗、解析后的数据置入My SQL数据库中。通过将类型相似页面的节点信息和字段描述配置于XML文件中,改进了网页对应独立抽取模板的方法,有效地提高了Web信息采集的效率和准确性。实验结果表明,基于XML的Web信息采集系统能够满足信息抽取的需求。

关键词： 信息采集抽取规则

分类号： [TP393.09]

领　　域： [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者郑嘉曦: 作品数：5被引量：5; 供职机构：广州民航职业技术学院; 发文主题：高职学生;体育锻炼;应用网络;职业信息;人际关系;视域;手机依赖;主观幸福感;自我认同感;互联网技术;信息采集;高职教育;促进就业

作者晁倩娜: 作品数：4被引量：4; 供职机构：深圳大学机电与控制工程学院; 发文主题：促进大学生就业;大学生就业工作;职业信息;社会保障;失业;农村大学生;主要经验和做法;就业门路;就业难;集对;信息采集;高校毕业生

作者张慧宁: 作品数：1被引量：4; 供职机构：广东石油化工学院; 发文主题：智能化;实验室安全;嵌入式技术;信息采集;高校

作者吴元欣: 作品数：1被引量：0; 供职机构：中山大学; 发文主题：统一建模语言;协同办公;面向对象;信息采集;城市管理信息化

作者何文聪: 作品数：1被引量：7; 供职机构：广东水利电力职业技术学院土木工程系; 发文主题：职业信息;互联网络;信息采集;信息应用

相关机构对象

机构华南理工大学: 作者数：19075; 发文主题：模型,甲烷,订单农业,协商模型,零售商,供应链管理,绩效关系,供应链协调,制造商,催化剂,知识创新,关系承诺,利益分配,变质性物品,企业,技术创新,虚拟企业,知识分享,供应链协调模型,订货量,石墨烯,研究生教育,可控提前期,时变需求,实证研究,价格折扣,管理创新,信息共享,运营绩效,战略管理,货栈,协整关系研究,滞后支付,创新绩效,库存路径问题,订购,报童模型,信息不对称,创新型企业,销售商,内向型,博弈,甲醇电氧化,创新管理,直接甲醇燃料电池,外向型,智慧城市,风险规避,生命周期,车辆路径问题,供应链协作,供应链,员工创新行为,协整检验,动态面板,共性技术,德行领导,

机构华南师范大学: 作者数：20338; 发文主题：教师成长,宏观经济,社会主义实践,中国梦,二重性质,马克思主义经济学,人生哲学,有效教学,中国货币政策,教育科研,克鲁格曼,教育叙事研究,教育研究,政治经济学,人民内部矛盾,新自由主义,校本教研,人性,哲学发展,课程改革,老师,教育行动研究,卢卡奇,学校教育,动物精神,马克思哲学,凯恩斯主义,人类社会发展规律,西方经济学,因果,教学研究,社会主义市场经济,中国共产党,教师,实证研究,诺贝尔经济学奖,教育现象学,英美文学,埃尔斯特,实证检验,校本教学研究,中国化马克思主义,社会主义建设规律,唯物史观,经济政策,社会存在本体论,异化,日常教学,社会主义发展道路,叙事研究,早期西方马克思主义,教学理念,马克思主义,人民币国际化,历史唯物主义,萨金特,教育叙事,世界货币,本体论,

机构广东工业大学: 作者数：3693; 发文主题：物流服务,生态位,技术生态位,颠覆性创新,绩效关系,消费需求不足,机会主义,环境动态性,物流业,探索式学习,产业技术创新战略联盟,制造业服务化,招标书,突变级数法,企业,技术创新,能力,政府科技投入,第三方物流供应商,中介效应,创业导向,物流发展,企业竞争优势,物流成本,实证研究,动态环境,战略联盟,第三方物流,全要素生产率,管理理论,组织柔性化,实证分析,管理研究,时间节奏,物流市场,竞争优势,分析方法,企业管理,激励机制,博弈,时间序列分析,企业绩效,珠三角制造业,博弈分析,物流产业,利用式学习,企业文化,物流标准化建设,珠三角,一带一路,协同创新,制造业,区域品牌,组织学习,营销团队建设,

机构中山大学: 作者数：27151; 发文主题：电视节目,用户,实证研究,家居,硬件,视域,异构,权利,分布式存储,蓝牙,启迪,从严治党,音乐门铃,领导干部,加密方法,中间件,党内权力,数字电视,权力监督,制度反腐,实体化,数字家庭,民主监督,社会主义国家执政党,马克思主义,监控系统,视频图像,中间件系统,数据传输方法,毛泽东,中国特色社会主义,风险评估,中国共产党,邓小平,素质教育,青年农民工,嵌入式,

机构广州大学地理科学学院: 作者数：234; 发文主题：网络化管理,可行性,班级管理,市场竞争态,思想教育,旅游开发,高校辅导员队伍建设,入境旅游,心理问题剖析,办学定位,旅游区,人口统计学,心理健康,就业问题,就业现状,独生子女,城郊旅游,营销策略,高校班级,古村落旅游,空间分异,旅游空间结构,空间结构,加强高校,大学新生,客源地,客源分析,导生,余荫山房,高校学风建设,隔代教育,岭南园林,组阁,客源市场,旅游地,问卷调查,学生党员,人生导师,

相关领域作者

作者李文姬: 作品数：3被引量：0; 供职机构：广州市社会科学院; 发文主题：云计算;中国社科院;中科院;社会信息服务;数据库;数字图书馆;网络;信息服务;信息资源

作者邵慧君: 作品数：9被引量：21; 供职机构：文学院; 发文主题：粤方言;粤语;综论;语音比较;语音数据库;语音特点;战国时期;第一人称代词;送气;同源;代词系统;清分;厦门话;小称;海话;儿尾;方言词汇;白话;变调;变音

作者杜松华: 作品数：2被引量：0; 供职机构：广东工业大学; 发文主题：社交媒体;农业现代化;企业;电子商务;可持续发展;共生共赢

作者周国林: 作品数：22被引量：54; 供职机构：广东金融学院; 发文主题：产业共性技术;上市公司;实证研究;组织承诺;董事会;动漫产业集群;产业集群;影响因素;语言学习;证券市场;证券市场风险;人力资源发展战略;社会主义新农村;生态系统;生态学思考;实证分析;市场壁垒;企业形象设计;区域经济合作;区域经济均衡

作者邢弘昊: 作品数：8被引量：0; 供职机构：广东省社会科学院; 发文主题：营销管理创新;在线广告;支付功能;视觉中心;数据库技术;通信设施;亲情服务;主流媒体;自我革新;最大多数人;网络媒体发展;网民规模;媒介竞争;媒体;民族性特征;目标受众;精神文化产品;新媒体;活跃度;技术门槛

联系方式

电话：020-38800179

邮箱：gdtheory@126.com

地址：广州市天河区天河北路618号广东社会科学中心

邮编：510635

友情链接

扫一扫手机浏览

广东省社会科学院·广东省哲学社会科学数据库·广东智库版权所有 Copyright©2012 gdtheory.cn All Rights Reserved.

违法和不良信息举报中心举报邮箱：jubao@cqvip.com 粤ICP备10080020号-3