文献详情 - Gdtheory理论粤军网|广东智库信息化平台

全部文献媒体文章报刊论文会议论文学位论文出版专著研究报告课题成果特色专题

高级检索

您现在所在的位置：网站首页 > 知识中心 > 文献详情

文献详细_{Journal detailed}

基于Session的特征选择

收藏

中文会议： 软件技术进展2003''全国软件与应用学术会议(NASAC)论文集

会议日期： 2003-10-01

会议地点： 北京

主办单位： 中国计算机学会

出版日期： 2003-11-01

出版地： 北京

作　　者： ; ; ;

机构地区： 华南理工大学

出　　处： 《2003''全国软件与应用学术会议》

摘　　要： 随着网络技术的发展,网络数据的存在形式越来越多,其中有很大一部分数据是以新闻组、讨论组、BBS和邮件列表的形式存在.上述这种数据称为Session数据,虽然它们现在的组织结构及体现的价值并不像网站那样直接,想念在不远的将来,我们很多重要的信息来源都离不开这些数据.为了降低对Session数据研究的复杂性,本研究以微软公司的PSS数据(一系列领域相关的邮件列表)为蓝本,分析了用传统文本分类学习方法研究Session数据的困难和不足之处以及探索用于处理Session数据新的研究方法的必要性.在上述前提下,本研究提出了两个层次的特征选择方法来改善性能.首先使用基于Session的特征选择模型(包括过滤无用邮件模型和基于Session摘要模型)对Session数据进行第一次处理,然后沿用传统的文本分类学习方法将Session数据视为普通的文本进行传统的特征选择.最后还提出了为Session中每封电子邮件标注关键词的应用.通过在原型系统上进行实验,验证了本研究提出的基于Session特征选择模型的有效性,并展望如何推广应用到更为复杂的Session数据类型上.

关键词： 特征选择文本挖掘文本分类降维事例检索网络数据

领　　域： [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者卢禹: 作品数：2被引量：0; 供职机构：中山大学管理学院; 发文主题：商业模式创新;所有权;企业绩效;区域产业集群;网络数据;网络特征;国际贸易环境

作者廖剑锐: 作品数：1被引量：0; 供职机构：中山大学; 发文主题：文本挖掘;信息获取;信息提取;选股;系统

作者沈元怿: 作品数：1被引量：0; 供职机构：华南理工大学; 发文主题：数据挖掘;决策树算法;计算机信息检索;分词技术;文本挖掘

作者赵卫军: 作品数：4被引量：23; 供职机构：广东金融学院图书馆; 发文主题：数据挖掘技术;图书馆;图书馆数字化建设;文本挖掘;科技情报服务;可行性;新建本科院校;基于;信息管理;关联数据;服务架构;服务外包;高校图书馆知识;挖掘;业务外包

作者李利梅: 作品数：5被引量：26; 供职机构：深圳大学; 发文主题：大学学科;统计分析;统计工作;统计人员素质;统计手段;网络舆情;文本分类;销量;教育统计;监测预警;高校舆情;股票市场;法律规范;房地产市场;高校管理;大数据;大学生

相关机构对象

机构中山大学: 作者数：27151; 发文主题：电视节目,用户,实证研究,家居,硬件,视域,异构,权利,分布式存储,蓝牙,启迪,从严治党,音乐门铃,领导干部,加密方法,中间件,党内权力,数字电视,权力监督,制度反腐,实体化,数字家庭,民主监督,社会主义国家执政党,马克思主义,监控系统,视频图像,中间件系统,数据传输方法,毛泽东,中国特色社会主义,风险评估,中国共产党,邓小平,素质教育,青年农民工,嵌入式,

机构广东外语外贸大学: 作者数：8857; 发文主题：创业研究,法治,语言学,战略性技术,系统功能语法,行政体制改革,语言维度,词汇语法,部门行政职权,主语,语法,双语词典,私有财产权,行政行为,创业决策,企业动态能力,语态,下行,级差,网络营销,语言模式,企业,可持续发展,具体行政行为,公法保护,法律规制,创业者,绿色营销,行政权,文体学,电子商务,人际,行政诉讼,服务型政府,实证研究,行政法治,汉语,营销研究,行政法,司法审查,系统功能语言学,组织知识,行政主体,企业家决策,动态能力,文化,企业绩效,语篇,法治视野,语义,韩礼德,英汉大词典,绿色消费,风险感知,商务背景,廊桥遗梦,持续竞争优势,公共行政,行政相对人,

机构中山大学资讯管理学院资讯管理系: 作者数：414; 发文主题：周年,职业倦怠,文体特征,互操作框架,相似度计算,图书馆,专业教育,情报学,图书馆员职业,社区建设,教学,数字仓储,图书馆专业人才,人力资源管理,文体分析,特曼,档案学教育,图书馆事业史,图书馆管理,人文社会科学,文本挖掘,网络学术,平等权利,公共图书馆理念,图书馆服务,职业倦怠现象,输入法,异构,语义相似度,信息资源共享,实体关系抽取,网络信息保存,网络环境,图书情报教育,社区信息服务,中国图书馆学,营销策略,看图,自由权利,公共图书馆思想,知识抽取,图书馆目标,数字参考服务,视障人士,图书馆学教育,信息查询行为,用户研究,研究方法,图书馆使命,相似度算法,图书馆权利,人文社科,网页去噪,隐私权,图书馆核心价值观,读者满意度调查,

机构华南师范大学经济与管理学院: 作者数：2327; 发文主题：支持向量机,公司成长性,模型,养老基金,经济发展,神经网络,工资体系,文献计量分析,公平,图书馆,有限状态图,财务杠杆,路向,自由现金流,上市公司,内部资本市场,第一大股东,劳动关系,股利政策,双重代理关系,开源软件,投资者保护,股权制衡,社会保障,知识图谱,企业,资本结构,数字图书馆建设,债务期限结构,经济合作,供应商融资,市场运行效率,规模经济,支持向量机分类,就业结构,文本分类,数字图书馆,实证分析,跨国经营,经济定位,聚类分析,数据挖掘,云计算,股权结构,可视化分析,集中度,集团内部资本,大样本,证券指数,数据挖掘研究,劳动力市场,企业成长性,现金持有量,社会和谐,公司治理,政治市场,经济结构,

机构华南理工大学工商管理学院: 作者数：3266; 发文主题：统计量,随机前沿模型,农村劳动力迁移,随机前沿分析,管理层激励,实证研究,公司绩效,经济增长,抑价,产权性质,知识溢出效应,企业业绩,融资约束,实证分析,融资困境,商业银行,模拟,企业税负,知识外溢,中小企业,增长极,上市公司,融资决策,空间计量模型,并购绩效,企业研发投入,有效性,外商直接投资,成本控制,收敛,投资者法律保护,股权性质,农村劳动力,方法,企业,技术创新,认股权证,国有企业,技术并购,资本结构,股权激励,面板数据,政府干预,指标体系,公司治理,并购,

相关领域作者

作者李文姬: 作品数：3被引量：0; 供职机构：广州市社会科学院; 发文主题：云计算;中国社科院;中科院;社会信息服务;数据库;数字图书馆;网络;信息服务;信息资源

作者邵慧君: 作品数：9被引量：21; 供职机构：文学院; 发文主题：粤方言;粤语;综论;语音比较;语音数据库;语音特点;战国时期;第一人称代词;送气;同源;代词系统;清分;厦门话;小称;海话;儿尾;方言词汇;白话;变调;变音

作者杜松华: 作品数：2被引量：0; 供职机构：广东工业大学; 发文主题：社交媒体;农业现代化;企业;电子商务;可持续发展;共生共赢

作者周国林: 作品数：22被引量：54; 供职机构：广东金融学院; 发文主题：产业共性技术;上市公司;实证研究;组织承诺;董事会;动漫产业集群;产业集群;影响因素;语言学习;证券市场;证券市场风险;人力资源发展战略;社会主义新农村;生态系统;生态学思考;实证分析;市场壁垒;企业形象设计;区域经济合作;区域经济均衡

作者邢弘昊: 作品数：8被引量：0; 供职机构：广东省社会科学院; 发文主题：营销管理创新;在线广告;支付功能;视觉中心;数据库技术;通信设施;亲情服务;主流媒体;自我革新;最大多数人;网络媒体发展;网民规模;媒介竞争;媒体;民族性特征;目标受众;精神文化产品;新媒体;活跃度;技术门槛

联系方式

电话：020-38800179

邮箱：gdtheory@126.com

地址：广州市天河区天河北路618号广东社会科学中心

邮编：510635

友情链接

扫一扫手机浏览

广东省社会科学院·广东省哲学社会科学数据库·广东智库版权所有 Copyright©2012 gdtheory.cn All Rights Reserved.

违法和不良信息举报中心举报邮箱：jubao@cqvip.com 粤ICP备10080020号-3