文献详情 - Gdtheory理论粤军网|广东智库信息化平台

全部文献媒体文章报刊论文会议论文学位论文出版专著研究报告课题成果特色专题

高级检索

您现在所在的位置：网站首页 > 知识中心 > 文献详情

文献详细_{Journal detailed}

基于XML的政府公文信息抽取中间件的设计与实现
Design and implementation of information extracting middleware for government archives based on XML technology

下载全文在线阅读

收藏

作　　者： ; ;

机构地区： 深圳职业技术学院计算机工程学院软件工程系

出　　处： 《计算机工程与设计》 2007年第5期1158-1160,共3页

摘　　要： 超文本信息抽取是Internet信息重组的重要手段。通过对政府公文信息格式进行了研究,提出了一种基于XML的信息抽取中间件模型,通过基于串匹配与串频统计相结合的分词处理、利用遗传算法的词类标注以及基于改进的隐马尔科夫模型的XML模板自动填充,可以快速的对Internet上的政府公文信息进行信息重组,以供相关应用系统使用。 Information extraction is one of the most important way to reorganize the HTML text. Through researching on the format of government archives. The information extracting middleware module based on XML technology is given, step by word segmenting based on string match and string frequency stat, POS tagging based on heredity arithmetic theory, XML Template filling based on HMM model, that can reorganize the government archives with XML formatting rapidly.

关键词： 政府公文信息抽取中间件分词处理词类标注模板填充

领　　域： [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者崔晶盈: 作品数：3被引量：15; 供职机构：香港中文大学; 发文主题：政府公文;英文;殖民地;人口比例;中文;小学语文;课程衔接;教学内容;港英政府

作者王仁强: 作品数：26被引量：178; 供职机构：四川外国语大学; 发文主题：词类标注;兼类词;汉英词典;现代汉语词典;第;版;异化;语料库;实证研究;基于语料库;归化;引论;印欧语;英国国家语料库;英语主位;用法调查;语法;语法隐喻;语料库语言学;语言

作者姜明宇: 作品数：3被引量：1; 供职机构：惠州经济职业技术学院; 发文主题：语文词典;语言;中词;双重性格;宗教;文化;短语;婚姻;无名的裘德;爱情;悲剧命运;词汇;词类标注

作者姜文振: 作品数：10被引量：31; 供职机构：肇庆学院文学院; 发文主题：音变;非自主动词;词类标注;音变现象;语文词典;语义;语义特征;普通话水平测试;轻声词;重叠式;东北方言;现代汉语教材;献疑;动作动词;句法;句法功能;形容词;汉语;黑龙江方言;儿化

作者詹佳佳: 作品数：6被引量：18; 供职机构：中山大学; 发文主题：国外图书馆学;博士论文;博士学位论文;词聚类;情报领域;情报学;文摘;竞争情报;信息可视化;信息抽取;信息抽取系统;演进分析;博硕士论文;词频分析

相关机构对象

机构华南理工大学: 作者数：19075; 发文主题：模型,甲烷,订单农业,协商模型,零售商,供应链管理,绩效关系,供应链协调,制造商,催化剂,知识创新,关系承诺,利益分配,变质性物品,企业,技术创新,虚拟企业,知识分享,供应链协调模型,订货量,石墨烯,研究生教育,可控提前期,时变需求,实证研究,价格折扣,管理创新,信息共享,运营绩效,战略管理,货栈,协整关系研究,滞后支付,创新绩效,库存路径问题,订购,报童模型,信息不对称,创新型企业,销售商,内向型,博弈,甲醇电氧化,创新管理,直接甲醇燃料电池,外向型,智慧城市,风险规避,生命周期,车辆路径问题,供应链协作,供应链,员工创新行为,协整检验,动态面板,共性技术,德行领导,

机构中山大学: 作者数：27151; 发文主题：电视节目,用户,实证研究,家居,硬件,视域,异构,权利,分布式存储,蓝牙,启迪,从严治党,音乐门铃,领导干部,加密方法,中间件,党内权力,数字电视,权力监督,制度反腐,实体化,数字家庭,民主监督,社会主义国家执政党,马克思主义,监控系统,视频图像,中间件系统,数据传输方法,毛泽东,中国特色社会主义,风险评估,中国共产党,邓小平,素质教育,青年农民工,嵌入式,

机构广东工业大学: 作者数：3693; 发文主题：物流服务,生态位,技术生态位,颠覆性创新,绩效关系,消费需求不足,机会主义,环境动态性,物流业,探索式学习,产业技术创新战略联盟,制造业服务化,招标书,突变级数法,企业,技术创新,能力,政府科技投入,第三方物流供应商,中介效应,创业导向,物流发展,企业竞争优势,物流成本,实证研究,动态环境,战略联盟,第三方物流,全要素生产率,管理理论,组织柔性化,实证分析,管理研究,时间节奏,物流市场,竞争优势,分析方法,企业管理,激励机制,博弈,时间序列分析,企业绩效,珠三角制造业,博弈分析,物流产业,利用式学习,企业文化,物流标准化建设,珠三角,一带一路,协同创新,制造业,区域品牌,组织学习,营销团队建设,

机构华南师范大学: 作者数：20338; 发文主题：教师成长,宏观经济,社会主义实践,中国梦,二重性质,马克思主义经济学,人生哲学,有效教学,中国货币政策,教育科研,克鲁格曼,教育叙事研究,教育研究,政治经济学,人民内部矛盾,新自由主义,校本教研,人性,哲学发展,课程改革,老师,教育行动研究,卢卡奇,学校教育,动物精神,马克思哲学,凯恩斯主义,人类社会发展规律,西方经济学,因果,教学研究,社会主义市场经济,中国共产党,教师,实证研究,诺贝尔经济学奖,教育现象学,英美文学,埃尔斯特,实证检验,校本教学研究,中国化马克思主义,社会主义建设规律,唯物史观,经济政策,社会存在本体论,异化,日常教学,社会主义发展道路,叙事研究,早期西方马克思主义,教学理念,马克思主义,人民币国际化,历史唯物主义,萨金特,教育叙事,世界货币,本体论,

机构广州大学地理科学学院: 作者数：234; 发文主题：网络化管理,可行性,班级管理,市场竞争态,思想教育,旅游开发,高校辅导员队伍建设,入境旅游,心理问题剖析,办学定位,旅游区,人口统计学,心理健康,就业问题,就业现状,独生子女,城郊旅游,营销策略,高校班级,古村落旅游,空间分异,旅游空间结构,空间结构,加强高校,大学新生,客源地,客源分析,导生,余荫山房,高校学风建设,隔代教育,岭南园林,组阁,客源市场,旅游地,问卷调查,学生党员,人生导师,

相关领域作者

作者李文姬: 作品数：3被引量：0; 供职机构：广州市社会科学院; 发文主题：云计算;中国社科院;中科院;社会信息服务;数据库;数字图书馆;网络;信息服务;信息资源

作者邵慧君: 作品数：9被引量：21; 供职机构：文学院; 发文主题：粤方言;粤语;综论;语音比较;语音数据库;语音特点;战国时期;第一人称代词;送气;同源;代词系统;清分;厦门话;小称;海话;儿尾;方言词汇;白话;变调;变音

作者杜松华: 作品数：2被引量：0; 供职机构：广东工业大学; 发文主题：社交媒体;农业现代化;企业;电子商务;可持续发展;共生共赢

作者周国林: 作品数：22被引量：54; 供职机构：广东金融学院; 发文主题：产业共性技术;上市公司;实证研究;组织承诺;董事会;动漫产业集群;产业集群;影响因素;语言学习;证券市场;证券市场风险;人力资源发展战略;社会主义新农村;生态系统;生态学思考;实证分析;市场壁垒;企业形象设计;区域经济合作;区域经济均衡

作者邢弘昊: 作品数：8被引量：0; 供职机构：广东省社会科学院; 发文主题：营销管理创新;在线广告;支付功能;视觉中心;数据库技术;通信设施;亲情服务;主流媒体;自我革新;最大多数人;网络媒体发展;网民规模;媒介竞争;媒体;民族性特征;目标受众;精神文化产品;新媒体;活跃度;技术门槛

联系方式

电话：020-38800179

邮箱：gdtheory@126.com

地址：广州市天河区天河北路618号广东社会科学中心

邮编：510635

友情链接

扫一扫手机浏览

广东省社会科学院·广东省哲学社会科学数据库·广东智库版权所有 Copyright©2012 gdtheory.cn All Rights Reserved.

违法和不良信息举报中心举报邮箱：jubao@cqvip.com 粤ICP备10080020号-3