文献详情 - Gdtheory理论粤军网|广东智库信息化平台

全部文献媒体文章报刊论文会议论文学位论文出版专著研究报告课题成果特色专题

高级检索

您现在所在的位置：网站首页 > 知识中心 > 文献详情

文献详细_{Journal detailed}

面向信息检索的xml文档节点语义研究

收藏

导　　师： 万常选

学科专业： H1203

授予学位： 硕士

作　　者： ;

机构地区： 江西财经大学

摘　　要： 可扩展标记语言xml已经成为数据交换的重要格式，并且广泛应用在数字图书馆、科学数据库以及互联网等领域。随着xml文档的广泛应用，对于xml文档检索的研究已逐渐成为信息检索领域的一个重要研究方向。目前对于xml信息检索的研究已经取得了一定的成果，但是排序的精确度不高。对xml检索结果的排序直接关系到xml信息检索的性能，但现有的xml检索结果排序模型考虑了词项在xml文档中出现的统计特性，但没考虑词项所在的位置，即视xml文档中各节点具有同等的重要性。然而，节点在整个xml文档中的角色不同，因此，相同内容出现在不同节点中，应该具有不同的权重，即不同的节点具有不同的语义权重。本文提出了一种基于向量空间模型的xml节点语义权重自动获取方法，该方法主要是通过对节点与文档的相似性计算来获取节点的语义权重。实验数据选择wiki部分数据集，专家对各节点语义权重的手工标注结果与该模型自动标注结果的pearson相关系数达到0.827，说明该节点语义标注模型能够较好地分析节点在xml文档中的重要性，有利于改善排序效果。另外，还进行了svd实验，在实验中根据奇异值分解重新生成了新的语义权重，通过比较我们发现经过svd后的权重模型与专家标注的pearson相关系数高达0．928，这说明分解后的效果更好。

关键词： 信息检索可扩展标记语言文档节点语义文档向量空间模型

领　　域： [自动化与计算机技术] [自动化与计算机技术] [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者彭远森: 作品数：1被引量：4; 供职机构：华南理工大学化学与化工学院传热强化与过程节能教育部重点实验室; 发文主题：生命周期;可扩展标记语言;信息集成;信息建模;信息模型

作者杨艳萍: 作品数：6被引量：2; 供职机构：广东技术师范学院; 发文主题：档案管理;档案保密工作;档案编研工作;档案工作;档案利用;档案信息;档案业务工作;档案意识;档案资源建设;育人机制;涉密档案;电子文件归档;电子政务;文档;民生档案;信息化社会;各项工作;信息记录;高校;保密工作

作者康全礼: 作品数：8被引量：24; 供职机构：汕头大学高等教育研究所; 发文主题：大学本科;教学改革;高等教育学;本科教学;本科教育;数据可视化;硕士培养;通才教育;文档;理论体系构建;民国时期;教育改革;教育结构;教育模式研究;工程教育;高等教育;学科建设;本科教学改革;工程;大学教育

作者黄俊明: 作品数：2被引量：1; 供职机构：暨南大学; 发文主题：可扩展标记语言;可扩展商业报告语言;会计电算化;信息披露;网络财务报告;财务报告

作者杜津媛: 作品数：2被引量：6; 供职机构：广东工业大学管理学院; 发文主题：语义网;元数据标准;中资银行;资源描述框架;网络信息组织;金融创新;可扩展标记语言;加入;过渡期

相关机构对象

机构中山大学资讯管理学院: 作者数：446; 发文主题：残障人士,信息系统管理,英国议会,档案公共服务,档案开放利用,图书馆学,图书馆,公民权利,灾难,公共,图书馆史,声明,档案公布,档案法规,档案服务工作,档案利用,硕士教育,灾区重建,中国图书馆史,导航,档案鉴定,数字化档案信息,社会角色,知识产权,档案学专业,档案学教育,英文文献,再设计,国际图联,档案利用权,考释,程序规制,资产性,石刻拓片,用户服务,档案开放,图书馆协会,档案,档案利用服务,公民隐私权保护,知识自由政策,权利行使,访谈录,知识自由,档案学,书目控制,知识管理,奖项,专业硕士,释文,现行文件服务,图书馆权利,真人,学术论文,图书馆集成系统,

机构中山大学: 作者数：27151; 发文主题：电视节目,用户,实证研究,家居,硬件,视域,异构,权利,分布式存储,蓝牙,启迪,从严治党,音乐门铃,领导干部,加密方法,中间件,党内权力,数字电视,权力监督,制度反腐,实体化,数字家庭,民主监督,社会主义国家执政党,马克思主义,监控系统,视频图像,中间件系统,数据传输方法,毛泽东,中国特色社会主义,风险评估,中国共产党,邓小平,素质教育,青年农民工,嵌入式,

机构中山大学资讯管理学院信息管理系: 作者数：271; 发文主题：档案管理,图书馆事业,群分析,被引半衰期,数据库建设,图书馆学,因特网,语种,社会,文件生命周期理论,档案馆建设,档案管理理论,档案传播,档案公布,档案工作,引文分析,档案法规,著者,档案信息服务,档案利用,档案法,档案法制建设,新中国,网络建设,统计分析,档案管理体制,档案学研究,图书馆管理,载文分析,档案工作者,图书馆社会学,图书馆工作,档案服务功能,索引,科学计量学,市场经济,国外信息,法律效力,档案,档案利用者,载文统计分析,网络环境,档案学,档案人才,文献计量学,电子文件,职业化,档案管理现代化,档案工作实践,电子文件鉴定,信息政策法规,档案事业,档案管理机构,档案观念,期刊影响因子,本体论,档案馆网站,

机构中山大学资讯管理学院资讯管理系: 作者数：414; 发文主题：周年,职业倦怠,文体特征,互操作框架,相似度计算,图书馆,专业教育,情报学,图书馆员职业,社区建设,教学,数字仓储,图书馆专业人才,人力资源管理,文体分析,特曼,档案学教育,图书馆事业史,图书馆管理,人文社会科学,文本挖掘,网络学术,平等权利,公共图书馆理念,图书馆服务,职业倦怠现象,输入法,异构,语义相似度,信息资源共享,实体关系抽取,网络信息保存,网络环境,图书情报教育,社区信息服务,中国图书馆学,营销策略,看图,自由权利,公共图书馆思想,知识抽取,图书馆目标,数字参考服务,视障人士,图书馆学教育,信息查询行为,用户研究,研究方法,图书馆使命,相似度算法,图书馆权利,人文社科,网页去噪,隐私权,图书馆核心价值观,读者满意度调查,

机构华南师范大学经济与管理学院: 作者数：2327; 发文主题：支持向量机,公司成长性,模型,养老基金,经济发展,神经网络,工资体系,文献计量分析,公平,图书馆,有限状态图,财务杠杆,路向,自由现金流,上市公司,内部资本市场,第一大股东,劳动关系,股利政策,双重代理关系,开源软件,投资者保护,股权制衡,社会保障,知识图谱,企业,资本结构,数字图书馆建设,债务期限结构,经济合作,供应商融资,市场运行效率,规模经济,支持向量机分类,就业结构,文本分类,数字图书馆,实证分析,跨国经营,经济定位,聚类分析,数据挖掘,云计算,股权结构,可视化分析,集中度,集团内部资本,大样本,证券指数,数据挖掘研究,劳动力市场,企业成长性,现金持有量,社会和谐,公司治理,政治市场,经济结构,

相关领域作者

作者李文姬: 作品数：3被引量：0; 供职机构：广州市社会科学院; 发文主题：云计算;中国社科院;中科院;社会信息服务;数据库;数字图书馆;网络;信息服务;信息资源

作者邵慧君: 作品数：9被引量：21; 供职机构：文学院; 发文主题：粤方言;粤语;综论;语音比较;语音数据库;语音特点;战国时期;第一人称代词;送气;同源;代词系统;清分;厦门话;小称;海话;儿尾;方言词汇;白话;变调;变音

作者杜松华: 作品数：2被引量：0; 供职机构：广东工业大学; 发文主题：社交媒体;农业现代化;企业;电子商务;可持续发展;共生共赢

作者周国林: 作品数：22被引量：54; 供职机构：广东金融学院; 发文主题：产业共性技术;上市公司;实证研究;组织承诺;董事会;动漫产业集群;产业集群;影响因素;语言学习;证券市场;证券市场风险;人力资源发展战略;社会主义新农村;生态系统;生态学思考;实证分析;市场壁垒;企业形象设计;区域经济合作;区域经济均衡

作者邢弘昊: 作品数：8被引量：0; 供职机构：广东省社会科学院; 发文主题：营销管理创新;在线广告;支付功能;视觉中心;数据库技术;通信设施;亲情服务;主流媒体;自我革新;最大多数人;网络媒体发展;网民规模;媒介竞争;媒体;民族性特征;目标受众;精神文化产品;新媒体;活跃度;技术门槛

联系方式

电话：020-38800179

邮箱：gdtheory@126.com

地址：广州市天河区天河北路618号广东社会科学中心

邮编：510635

友情链接

扫一扫手机浏览

广东省社会科学院·广东省哲学社会科学数据库·广东智库版权所有 Copyright©2012 gdtheory.cn All Rights Reserved.

违法和不良信息举报中心举报邮箱：jubao@cqvip.com 粤ICP备10080020号-3