文献详情 - Gdtheory理论粤军网|广东智库信息化平台

全部文献媒体文章报刊论文会议论文学位论文出版专著研究报告课题成果特色专题

高级检索

您现在所在的位置：网站首页 > 知识中心 > 文献详情

文献详细_{Journal detailed}

基于类别分布的特征选择框架

收藏

中文会议： 第四届全国信息检索与内容安全学术会议论文集

会议日期： 2008-11-15

会议地点： 北京

主办单位： 中国中文信息学会

作　　者： ; ; ;

机构地区： 中国科学院计算技术研究所

出　　处： 《第四届全国信息检索与内容安全学术会议》

摘　　要： 极高的特征维数使文本分类变得复杂和费时,为此非常需要有效的特征降维方法.目前已有很多种特征选择方法,但据我们所知,没有一种独立的特征选择方法能够在非平衡语料上取得很好的效果.本文依据特征在类别间的分布特点提出了基于类别分布的特征选择框架.该框架能够利用特征的分布信息选出具有较强区分能力的特征,同时可以给类别灵活地分配权重,分配较大的权重给稀有类别则提高稀有类别的分类效果,所以它适合于非平衡语料,也具有很好的扩展性.另外,文中解释说明了OCFS和基于类别分布差异的特征过滤方法是该框架的特例.基于该框架文中给出了具体的特征选择方法,Retuers-21578语料及复旦大学语料等两个非平衡语料上的实验表明,它们的宏平均和微平均F1效果都好于IG, CHI和OCFS.

关键词： 特征选择非平衡语料类别分布文本分类

分类号： [T]

领　　域： [一般工业技术]

相关作者

作者李利梅: 作品数：5被引量：26; 供职机构：深圳大学; 发文主题：大学学科;统计分析;统计工作;统计人员素质;统计手段;网络舆情;文本分类;销量;教育统计;监测预警;高校舆情;股票市场;法律规范;房地产市场;高校管理;大数据;大学生

作者周凌燕: 作品数：2被引量：0; 供职机构：北京语言大学; 发文主题：特征提取;文本分类;聚类研究;词典编撰;词汇

作者肖可: 作品数：5被引量：12; 供职机构：华南师范大学经济与管理学院; 发文主题：网络伦理学;竞争情报软件;竞争情报系统;计算机伦理学;信息伦理学;国外信息;统计分析;文本分类

作者朱成: 作品数：2被引量：0; 供职机构：广东外语外贸大学; 发文主题：语义翻译;纽马克;文本分类;文化因素;交际翻译;翻译方法;译本

作者曹雨婷: 作品数：1被引量：1; 供职机构：暨南大学外国语学院; 发文主题：网络舆情;文本分类;监测预警;高校舆情;大数据;大学生

相关机构对象

机构广东外语外贸大学: 作者数：8857; 发文主题：创业研究,法治,语言学,战略性技术,系统功能语法,行政体制改革,语言维度,词汇语法,部门行政职权,主语,语法,双语词典,私有财产权,行政行为,创业决策,企业动态能力,语态,下行,级差,网络营销,语言模式,企业,可持续发展,具体行政行为,公法保护,法律规制,创业者,绿色营销,行政权,文体学,电子商务,人际,行政诉讼,服务型政府,实证研究,行政法治,汉语,营销研究,行政法,司法审查,系统功能语言学,组织知识,行政主体,企业家决策,动态能力,文化,企业绩效,语篇,法治视野,语义,韩礼德,英汉大词典,绿色消费,风险感知,商务背景,廊桥遗梦,持续竞争优势,公共行政,行政相对人,

机构中山大学: 作者数：27151; 发文主题：电视节目,用户,实证研究,家居,硬件,视域,异构,权利,分布式存储,蓝牙,启迪,从严治党,音乐门铃,领导干部,加密方法,中间件,党内权力,数字电视,权力监督,制度反腐,实体化,数字家庭,民主监督,社会主义国家执政党,马克思主义,监控系统,视频图像,中间件系统,数据传输方法,毛泽东,中国特色社会主义,风险评估,中国共产党,邓小平,素质教育,青年农民工,嵌入式,

机构华南师范大学经济与管理学院: 作者数：2327; 发文主题：支持向量机,公司成长性,模型,养老基金,经济发展,神经网络,工资体系,文献计量分析,公平,图书馆,有限状态图,财务杠杆,路向,自由现金流,上市公司,内部资本市场,第一大股东,劳动关系,股利政策,双重代理关系,开源软件,投资者保护,股权制衡,社会保障,知识图谱,企业,资本结构,数字图书馆建设,债务期限结构,经济合作,供应商融资,市场运行效率,规模经济,支持向量机分类,就业结构,文本分类,数字图书馆,实证分析,跨国经营,经济定位,聚类分析,数据挖掘,云计算,股权结构,可视化分析,集中度,集团内部资本,大样本,证券指数,数据挖掘研究,劳动力市场,企业成长性,现金持有量,社会和谐,公司治理,政治市场,经济结构,

机构深圳大学: 作者数：3155; 发文主题：个人经济收入,主体性,国学,中国文化,贴近生活,公有制,经济发展,当代新儒家,现代新儒学,高校德育,按劳分配,中国经济特区,文明对话,社会主义条件,儒学,所有者,诠释学,真善美,私有经济,道德交往,所有制关系,德育价值,熊十力,市场经济体制,道德教育,儒学研究,中国哲学史,马克思主义创始人,儒家伦理,哲学建设,现代企业制度,社会主义劳动者,新儒学,市场经济,社会主义核心价值观,哲学基础,道德对话,思想道德修养与法律基础课教学,西方哲学,牟宗三,思想道德建设,商品经济,思想道德教育,人格,社会主义经济,经济特区,邓小平理论,思想道德观念,德育,人力资本,思想政治教育,文化复兴,政治文明,审美消费,儒家,移民文化,哲学史,经学,中国哲学,

机构北京语言大学: 作者数：2; 发文主题：粤语,疑问语调,功能词,语法形式,词典编撰,词汇,句末,语义,地图模型,文本分类,语气助词,特征提取,二语习得,习得顺序,聚类研究,是非问句,

相关领域作者

作者许治: 作品数：3被引量：8; 供职机构：华南理工大学; 发文主题：珠三角;卷烟包装;科学基金;高新技术产业发展;共同体

作者万良勇: 作品数：47被引量：396; 供职机构：华南理工大学; 发文主题：内部资本市场;实证研究;上市公司;企业;企业集团;机会主义;公司并购;公司治理;融资约束;社会网络;企业投资效率;网络位置;利益侵占;独立董事;论争;逻辑框架;金融生态环境;金融危机;金融危机冲击;会计信息管制

作者宋舒: 作品数：8被引量：7; 供职机构：茂名职业技术学院; 发文主题：思想政治理论课教学;高职院校思想政治理论课;正当防卫;实效性;思想政治理论课实践教学;思想政治素质;校园文化;教学有效性;经济法;化工专业;新校区校园;高职思想政治理论课;高职学生;高职院校;工学结合模式;岗位群;学校建筑

作者黄佑军: 作品数：39被引量：73; 供职机构：佛山职业技术学院; 发文主题：企业;会计师事务所;影响因素;制造业;实证研究;企业绩效;珠三角;资本结构;高职会计;股权结构;核心竞争力;核心竞争力评价;博弈分析;财务管理专业;层次分析法;应用型人才;营销创新;营销方案

作者王应密: 作品数：15被引量：93; 供职机构：华南理工大学; 发文主题：研究生教育;院校研究;全日制工程硕士;全日制硕士专业学位;研究生培养;应用型人才;政策文本;职业资格;认可度;实践课程;实践能力培养;数据仓储;数据库建设;硕士培养模式;硕士学位论文;硕士研究生;全日制;全日制工程硕士研究生

联系方式

电话：020-38800179

邮箱：gdtheory@126.com

地址：广州市天河区天河北路618号广东社会科学中心

邮编：510635

友情链接

扫一扫手机浏览

广东省社会科学院·广东省哲学社会科学数据库·广东智库版权所有 Copyright©2012 gdtheory.cn All Rights Reserved.

违法和不良信息举报中心举报邮箱：jubao@cqvip.com 粤ICP备10080020号-3