文献详情 - Gdtheory理论粤军网|广东智库信息化平台

全部文献媒体文章报刊论文会议论文学位论文出版专著研究报告课题成果特色专题

高级检索

您现在所在的位置：网站首页 > 知识中心 > 文献详情

文献详细_{Journal detailed}

基于全局性确定聚类中心的文本聚类
Text clustering based on global center-determination

下载全文在线阅读

收藏

作　　者： ; ; ; ;

机构地区： 广东商学院数学与计算科学学院

出　　处： 《计算机工程与应用》 2011年第10期147-150,共4页

摘　　要： 文本聚类关键是有效解决特征词向量选择及特征词权重计算方法、文本相似度计算方法、聚类中心确定等三个问题。针对相关算法在三个关键环节上存在的问题,提出了适合自由文本特点的特征词权重计算方法和文本相似度计算方法;在此基础上提出了改进的CBC算法,从全局上自适应地确定文本集中的各个聚类中心。算法在实验中准确地确定了各个聚类中心,并在两个文本集上分别获得88.50%和94.00%的聚类准确率。 The three key points of text clustering are feature selection and weight calculation,texts similarity calculation and cluster center determination.This paper proposes two new methods based on the characteristic of free texts for feature-weight calculation and texts similarity calculation separately.Then an improved CBC algorithm is proposed to determine the cluster centers adaptively and globally.This algorithm produces all cluster center correctly,and obtains precision of 88.50% and 94.00% for two different text-set separately.

关键词： 文本聚类全局性聚类质心特征词集

领　　域： [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者严玉清: 作品数：14被引量：39; 供职机构：广东外语外贸大学; 发文主题：模型驱动体系结构;家庭;有感;道德;元模型;神经网络;神经网络方法;实例分析;数据挖掘;第三产业;统计意义;排队论;奇偶性;最小一乘;网络训练;对称性;模型驱动开发;教育;聚类中心;积分

作者黄家兴: 作品数：5被引量：21; 供职机构：华南师范大学经济与管理学院; 发文主题：银行竞争;德尔菲法;知识图谱;社会网络分析;实证研究;图书馆应用;图书推荐;推荐引擎;谱分析;网站评价;文本聚类;协同过滤;链接分析;聚类分析;聚类研究;多维尺度分析;信息计量学;共词分析;共链分析

作者董兵团: 作品数：3被引量：0; 供职机构：中共深圳市委党校; 发文主题：党的建设;社会和谐;全局性;文化大革命;根本性;党群关系;党群和谐

作者黄林军: 作品数：6被引量：5; 供职机构：中山大学; 发文主题：用户需求;软件开发平台;生存之道;企业;企业间竞争;企业信息化工程;企业信息化建设;企业信息化战略;全局性;组织架构;项目实施;利益相关者;快速响应;环境政策;信息化管理;信息化平台;个性化服务;个性化开发;信息化咨询;管理流程

作者彭勇涛: 作品数：9被引量：24; 供职机构：暨南大学管理学院; 发文主题：企业家精神;奥秘;战略架构;制胜;团队精神;农村人口;农民问题;农业基础;企业管理;企业核心能力;企业联盟;企业战略管理;企业战略联盟;企业战略思想;全局性;中小企业;务农;逻辑分析;模仿创新;进取精神

相关机构对象

机构中山大学资讯管理学院信息管理系: 作者数：271; 发文主题：档案管理,图书馆事业,群分析,被引半衰期,数据库建设,图书馆学,因特网,语种,社会,文件生命周期理论,档案馆建设,档案管理理论,档案传播,档案公布,档案工作,引文分析,档案法规,著者,档案信息服务,档案利用,档案法,档案法制建设,新中国,网络建设,统计分析,档案管理体制,档案学研究,图书馆管理,载文分析,档案工作者,图书馆社会学,图书馆工作,档案服务功能,索引,科学计量学,市场经济,国外信息,法律效力,档案,档案利用者,载文统计分析,网络环境,档案学,档案人才,文献计量学,电子文件,职业化,档案管理现代化,档案工作实践,电子文件鉴定,信息政策法规,档案事业,档案管理机构,档案观念,期刊影响因子,本体论,档案馆网站,

机构华南师范大学经济与管理学院: 作者数：2327; 发文主题：支持向量机,公司成长性,模型,养老基金,经济发展,神经网络,工资体系,文献计量分析,公平,图书馆,有限状态图,财务杠杆,路向,自由现金流,上市公司,内部资本市场,第一大股东,劳动关系,股利政策,双重代理关系,开源软件,投资者保护,股权制衡,社会保障,知识图谱,企业,资本结构,数字图书馆建设,债务期限结构,经济合作,供应商融资,市场运行效率,规模经济,支持向量机分类,就业结构,文本分类,数字图书馆,实证分析,跨国经营,经济定位,聚类分析,数据挖掘,云计算,股权结构,可视化分析,集中度,集团内部资本,大样本,证券指数,数据挖掘研究,劳动力市场,企业成长性,现金持有量,社会和谐,公司治理,政治市场,经济结构,

机构暨南大学管理学院: 作者数：2481; 发文主题：审计定价,公允价值,企业内部控制,网誉认证,会计准则,增值税转型,作业基础预算,影响因素,利益相关者,上市公司,资本市场,成本控制,全面预算管理,企业并购过程,财务会计,企业,平衡记分卡,审计目标,问卷调查,资产质量,知识经济,会计信息,实证研究,董事会特征,家族控股,会计,战略管理,债转股,信息披露,社会资本,内部财务制度,核心能力,企业内部财务,股权结构,企业管理,盈余管理,金融工具会计准则,企业财务制度,企业商誉,所有权,家族企业,内部控制制度,资产公允价值,中国会计,社会网络分析,企业集团,公允价值会计,中小投资者保护,未来经济利益,公司治理,免疫系统,负商誉,

机构中共深圳市委党校: 作者数：287; 发文主题：台湾对外关系,台湾岛,农村基层民主,经济增长,马克思主义中国化,执政实践,灾难,造势,道德规范,中华民族,党性意识,经贸战略,政治社会学,两岸关系,双层博弈,党中央第三代领导集体,制造业物流,时代,群众路线,中国传统文化,邓小平理论研究,科学发展观,执政能力建设,马英九,两个文明建设,思维艺术,道德教育,员工关系管理,中国公民社会,社会主义市场经济,哲学思考,知识经济,中国共产党,中共中央,社会主义,第三方物流,思想道德建设,执政资源,邓小平理论,政治体制改革,中国工人阶级,社会关系,邓小平战略思维,战略思维,统战工作,政治学分析,两岸和平统一,中国社会转型,台湾民众,邓小平社会主义,战术思维,地区物流,马克思主义,执政主体,人文地理,国家认同,邓小平建设有中国特色社会主义理论,

机构中山大学: 作者数：27151; 发文主题：电视节目,用户,实证研究,家居,硬件,视域,异构,权利,分布式存储,蓝牙,启迪,从严治党,音乐门铃,领导干部,加密方法,中间件,党内权力,数字电视,权力监督,制度反腐,实体化,数字家庭,民主监督,社会主义国家执政党,马克思主义,监控系统,视频图像,中间件系统,数据传输方法,毛泽东,中国特色社会主义,风险评估,中国共产党,邓小平,素质教育,青年农民工,嵌入式,

相关领域作者

作者李文姬: 作品数：3被引量：0; 供职机构：广州市社会科学院; 发文主题：云计算;中国社科院;中科院;社会信息服务;数据库;数字图书馆;网络;信息服务;信息资源

作者邵慧君: 作品数：9被引量：21; 供职机构：文学院; 发文主题：粤方言;粤语;综论;语音比较;语音数据库;语音特点;战国时期;第一人称代词;送气;同源;代词系统;清分;厦门话;小称;海话;儿尾;方言词汇;白话;变调;变音

作者杜松华: 作品数：2被引量：0; 供职机构：广东工业大学; 发文主题：社交媒体;农业现代化;企业;电子商务;可持续发展;共生共赢

作者周国林: 作品数：22被引量：54; 供职机构：广东金融学院; 发文主题：产业共性技术;上市公司;实证研究;组织承诺;董事会;动漫产业集群;产业集群;影响因素;语言学习;证券市场;证券市场风险;人力资源发展战略;社会主义新农村;生态系统;生态学思考;实证分析;市场壁垒;企业形象设计;区域经济合作;区域经济均衡

作者邢弘昊: 作品数：8被引量：0; 供职机构：广东省社会科学院; 发文主题：营销管理创新;在线广告;支付功能;视觉中心;数据库技术;通信设施;亲情服务;主流媒体;自我革新;最大多数人;网络媒体发展;网民规模;媒介竞争;媒体;民族性特征;目标受众;精神文化产品;新媒体;活跃度;技术门槛

联系方式

电话：020-38800179

邮箱：gdtheory@126.com

地址：广州市天河区天河北路618号广东社会科学中心

邮编：510635

友情链接

扫一扫手机浏览

广东省社会科学院·广东省哲学社会科学数据库·广东智库版权所有 Copyright©2012 gdtheory.cn All Rights Reserved.

违法和不良信息举报中心举报邮箱：jubao@cqvip.com 粤ICP备10080020号-3