文献详情 - Gdtheory理论粤军网|广东智库信息化平台

全部文献媒体文章报刊论文会议论文学位论文出版专著研究报告课题成果特色专题

高级检索

您现在所在的位置：网站首页 > 知识中心 > 文献详情

文献详细_{Journal detailed}

改进空间向量模型及其在文档自动分类系统中的应用

收藏

导　　师： 朱焱

学科专业： H1203

授予学位： 硕士

作　　者： ;

机构地区： 西南交通大学

摘　　要： 文档自动分类作为信息处理技术的关键技术之一，具有重要的理论和应用价值。目前文档自动分类在信息处理方面的应用大致有：搜索引擎技术、邮件分类、电子会议、信息过滤等很多方面。现有文档自动分类技术的特征提取环节，在文档不规范性、算法的局限性等诸多原因的制约下，特征向量中没有体现文档的语义信息。为了降低这种现象对文卡当自动分类准确度的影响，提高文档自动分类的召回率和准确率，很多的研究人员在这个方面做了大量工作，取得了很多的成果。本论文主要研究了文档自动分类各个环节的算法原理，简要的阐述了文档自动分类的发展、应用和现状，详细地描述了空间向量模型的原理与实现方法，重点地论述了改进后的空间向量模型在文档自动分类系统中的应用，将段落向量、词距向量与传统的空间向量模型相结合应用到文档的特征提取当中。另外，重点论述了一种改进的中文分词算法在文档自动分类系统中的应用，将概率统计模型和词语查找树模型应用到中文分词中。试验结果表明，改进后的向量空间模型显著的提高了文档自动分类的准确率和召回率，既能完整的体现文档含义，又能加入文档的语义信息，有利于分类的进一步处理。改进后中文分词算法效果明显，进一步提高了向量空间模型表示文档的质量。

关键词： 空间向量模型信息处理文档自动分类特征提取中文分词算法

分类号： [TP391.1]

领　　域： [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者杨艳萍: 作品数：6被引量：2; 供职机构：广东技术师范学院; 发文主题：档案管理;档案保密工作;档案编研工作;档案工作;档案利用;档案信息;档案业务工作;档案意识;档案资源建设;育人机制;涉密档案;电子文件归档;电子政务;文档;民生档案;信息化社会;各项工作;信息记录;高校;保密工作

作者康全礼: 作品数：8被引量：24; 供职机构：汕头大学高等教育研究所; 发文主题：大学本科;教学改革;高等教育学;本科教学;本科教育;数据可视化;硕士培养;通才教育;文档;理论体系构建;民国时期;教育改革;教育结构;教育模式研究;工程教育;高等教育;学科建设;本科教学改革;工程;大学教育

作者周凌燕: 作品数：2被引量：0; 供职机构：北京语言大学; 发文主题：特征提取;文本分类;聚类研究;词典编撰;词汇

作者屈萍: 作品数：3被引量：5; 供职机构：中山大学教育学院; 发文主题：市场化改革;视觉信息;特征提取;体育视频分析;镜头分类;竞技体育;公共体育场馆;公共体育服务;公私合作伙伴关系;广州体育馆;业余性;大学精神

作者徐优平: 作品数：9被引量：9; 供职机构：广东外语外贸大学国际商务英语学院; 发文主题：法院调解;语言选择;互明;法官;英译策略;语篇信息;原型范畴理论;的字结构;弱化;说服;话语标记语;交际;信息处理;信息交换;形合;法律法规;法律英语;法律语篇;法律语言学;长句翻译

相关机构对象

机构广东外语外贸大学: 作者数：8857; 发文主题：创业研究,法治,语言学,战略性技术,系统功能语法,行政体制改革,语言维度,词汇语法,部门行政职权,主语,语法,双语词典,私有财产权,行政行为,创业决策,企业动态能力,语态,下行,级差,网络营销,语言模式,企业,可持续发展,具体行政行为,公法保护,法律规制,创业者,绿色营销,行政权,文体学,电子商务,人际,行政诉讼,服务型政府,实证研究,行政法治,汉语,营销研究,行政法,司法审查,系统功能语言学,组织知识,行政主体,企业家决策,动态能力,文化,企业绩效,语篇,法治视野,语义,韩礼德,英汉大词典,绿色消费,风险感知,商务背景,廊桥遗梦,持续竞争优势,公共行政,行政相对人,

机构华南师范大学: 作者数：20338; 发文主题：教师成长,宏观经济,社会主义实践,中国梦,二重性质,马克思主义经济学,人生哲学,有效教学,中国货币政策,教育科研,克鲁格曼,教育叙事研究,教育研究,政治经济学,人民内部矛盾,新自由主义,校本教研,人性,哲学发展,课程改革,老师,教育行动研究,卢卡奇,学校教育,动物精神,马克思哲学,凯恩斯主义,人类社会发展规律,西方经济学,因果,教学研究,社会主义市场经济,中国共产党,教师,实证研究,诺贝尔经济学奖,教育现象学,英美文学,埃尔斯特,实证检验,校本教学研究,中国化马克思主义,社会主义建设规律,唯物史观,经济政策,社会存在本体论,异化,日常教学,社会主义发展道路,叙事研究,早期西方马克思主义,教学理念,马克思主义,人民币国际化,历史唯物主义,萨金特,教育叙事,世界货币,本体论,

机构华南理工大学工商管理学院: 作者数：3266; 发文主题：统计量,随机前沿模型,农村劳动力迁移,随机前沿分析,管理层激励,实证研究,公司绩效,经济增长,抑价,产权性质,知识溢出效应,企业业绩,融资约束,实证分析,融资困境,商业银行,模拟,企业税负,知识外溢,中小企业,增长极,上市公司,融资决策,空间计量模型,并购绩效,企业研发投入,有效性,外商直接投资,成本控制,收敛,投资者法律保护,股权性质,农村劳动力,方法,企业,技术创新,认股权证,国有企业,技术并购,资本结构,股权激励,面板数据,政府干预,指标体系,公司治理,并购,

机构汕头大学: 作者数：2028; 发文主题：教育体制,课程设置,马克思主义大众化,教育规律,就业指导,价值论,教育改革,人才培养模式改革,人民主体性,专业教育,课程编制,自由教育,民生视角,网络舆论,高等教育,课程实施,通识教育课程,高等教育思想,社会形态理论,逻辑思路,教学,生态女性主义,通识课程,课程改革,高校课程,大学办高职,大学生,知识经济,高职教育,高校教学改革,批判性思维,教学改革,耻感,思维结构,高校,中国高校,德性,课程,社会主义核心价值体系,课程体系,他者,教育质量,主体间性,人文关怀,大学通识教育,美国高校,道德层次,教学质量,绩效,耻感文化,社会风尚,社会主义荣辱观,特点及启示,中国大学生,哲学探讨,哲学建构,通识教育,道德信仰,

机构华南师范大学教育信息技术学院电化教育系: 作者数：39; 发文主题：教育现代化,建构主义,作文教学,主题内容,交互性,作文能力,电教教材,多媒体计算机,阅读教学,小学语文教学,网络技术,识字教学,教学理论,超媒体,信息技术教育课程,存储量,网络课程开发,国际理解教育,视频影像,小学生作文,知识库,信息教育,多媒体和网络技术,创造性教育,体数据,作文教学模式,课程开发,学习者,广东高校,教学问题,建构主义学习理论,网络教育,科学教育,小学语文,解压缩,脚本设计,教育内容,学习者特征,多媒体编辑软件,设计原理,电化教育,三维模型,电教中心,教学研究,信息高速公路,环境,多媒体教学软件,现代媒体,

相关领域作者

作者李文姬: 作品数：3被引量：0; 供职机构：广州市社会科学院; 发文主题：云计算;中国社科院;中科院;社会信息服务;数据库;数字图书馆;网络;信息服务;信息资源

作者邵慧君: 作品数：9被引量：21; 供职机构：文学院; 发文主题：粤方言;粤语;综论;语音比较;语音数据库;语音特点;战国时期;第一人称代词;送气;同源;代词系统;清分;厦门话;小称;海话;儿尾;方言词汇;白话;变调;变音

作者杜松华: 作品数：2被引量：0; 供职机构：广东工业大学; 发文主题：社交媒体;农业现代化;企业;电子商务;可持续发展;共生共赢

作者周国林: 作品数：22被引量：54; 供职机构：广东金融学院; 发文主题：产业共性技术;上市公司;实证研究;组织承诺;董事会;动漫产业集群;产业集群;影响因素;语言学习;证券市场;证券市场风险;人力资源发展战略;社会主义新农村;生态系统;生态学思考;实证分析;市场壁垒;企业形象设计;区域经济合作;区域经济均衡

作者邢弘昊: 作品数：8被引量：0; 供职机构：广东省社会科学院; 发文主题：营销管理创新;在线广告;支付功能;视觉中心;数据库技术;通信设施;亲情服务;主流媒体;自我革新;最大多数人;网络媒体发展;网民规模;媒介竞争;媒体;民族性特征;目标受众;精神文化产品;新媒体;活跃度;技术门槛

联系方式

电话：020-38800179

邮箱：gdtheory@126.com

地址：广州市天河区天河北路618号广东社会科学中心

邮编：510635

友情链接

扫一扫手机浏览

广东省社会科学院·广东省哲学社会科学数据库·广东智库版权所有 Copyright©2012 gdtheory.cn All Rights Reserved.

违法和不良信息举报中心举报邮箱：jubao@cqvip.com 粤ICP备10080020号-3