文献详情 - Gdtheory理论粤军网|广东智库信息化平台

全部文献媒体文章报刊论文会议论文学位论文出版专著研究报告课题成果特色专题

高级检索

您现在所在的位置：网站首页 > 知识中心 > 文献详情

文献详细_{Journal detailed}

基于MapReduce的并行PLSA算法及在文本挖掘中的应用
MapReduce Based Parallel Probabilistic Latent Semantic Analysis for Text Mining

下载全文在线阅读

收藏

作　　者： ; ; ; ; ;

机构地区： 中国科学院计算技术研究所智能信息处理重点实验室

出　　处： 《中文信息学报》 2015年第2期79-86,共8页

摘　　要： PLSA(Probabilistic Latent Semantic Analysis)是一种典型的主题模型。复杂的建模过程使其难以处理海量数据,针对串行PLSA难以处理海量数据的问题,该文提出一种基于MapReduce计算框架的并行PLSA算法,能够以简洁的形式和分布式的方案来解决大规模数据的并行处理问题,并把并行PLSA算法运用到文本聚类和语义分析的文本挖掘应用中。实验结果表明该算法在处理较大数据量时表现出了很好的性能。 PLSA（（Probabilistie Latent Semantic Analysis） is a typical topic model. To enable a distributed computation of PLSA for the ever-increasing large datasets, a parallel PLSA algorithm based on MapReduce is proposed in this paper. Applied in text clustering and semantic analysis, the algorithm is demonstrated by the experiments for s its scalability in dealing with large datasets.

关键词： 概率主题模型并行语义分析

领　　域： [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者廖剑锐: 作品数：1被引量：0; 供职机构：中山大学; 发文主题：文本挖掘;信息获取;信息提取;选股;系统

作者沈元怿: 作品数：1被引量：0; 供职机构：华南理工大学; 发文主题：数据挖掘;决策树算法;计算机信息检索;分词技术;文本挖掘

作者赵卫军: 作品数：4被引量：23; 供职机构：广东金融学院图书馆; 发文主题：数据挖掘技术;图书馆;图书馆数字化建设;文本挖掘;科技情报服务;可行性;新建本科院校;基于;信息管理;关联数据;服务架构;服务外包;高校图书馆知识;挖掘;业务外包

作者许素辉: 作品数：2被引量：0; 供职机构：暨南大学; 发文主题：语法化;语法研究;语料库;语义分析;语用频率

作者郎晓秋: 作品数：3被引量：10; 供职机构：华南理工大学国际教育学院; 发文主题：副词;语言禁忌;语义分析;语用分析;对外汉语;汉语;汉语教学;词义

相关机构对象

机构暨南大学: 作者数：20971; 发文主题：行政手段,比较文学,法人资格,东亚货币合作,世界华文文学,三民主义,追寻,国际移民,双方当事人,文艺理论,法律地位,多角化经营战略,区域经济合作,经济法学,孙中山,国家所有权,母语教育,章程,网络,海外华文教育,横向经济联合,产权关系,专利法,文学传统,华裔美国文学,致辞,马来西亚华文教育,整体观,监事会,国有资产所有权,华族,全过程,汉语文学,冷战后,法律调整,全球语境,统战工作,海外华文文学研究,华文教育,辛亥革命时期,结构性权力,华人社会,海外华文文学,他者,文本阅读,涉外经济法规,粤港澳,经济法制,东南亚华人,新移民文学,人口比例,经济联合体,中国文学,企业集团,跨文化,社会参与,法制管理,文学概论,全球化语境,文艺学研究,

机构华南师范大学: 作者数：20338; 发文主题：教师成长,宏观经济,社会主义实践,中国梦,二重性质,马克思主义经济学,人生哲学,有效教学,中国货币政策,教育科研,克鲁格曼,教育叙事研究,教育研究,政治经济学,人民内部矛盾,新自由主义,校本教研,人性,哲学发展,课程改革,老师,教育行动研究,卢卡奇,学校教育,动物精神,马克思哲学,凯恩斯主义,人类社会发展规律,西方经济学,因果,教学研究,社会主义市场经济,中国共产党,教师,实证研究,诺贝尔经济学奖,教育现象学,英美文学,埃尔斯特,实证检验,校本教学研究,中国化马克思主义,社会主义建设规律,唯物史观,经济政策,社会存在本体论,异化,日常教学,社会主义发展道路,叙事研究,早期西方马克思主义,教学理念,马克思主义,人民币国际化,历史唯物主义,萨金特,教育叙事,世界货币,本体论,

机构广东外语外贸大学: 作者数：8857; 发文主题：创业研究,法治,语言学,战略性技术,系统功能语法,行政体制改革,语言维度,词汇语法,部门行政职权,主语,语法,双语词典,私有财产权,行政行为,创业决策,企业动态能力,语态,下行,级差,网络营销,语言模式,企业,可持续发展,具体行政行为,公法保护,法律规制,创业者,绿色营销,行政权,文体学,电子商务,人际,行政诉讼,服务型政府,实证研究,行政法治,汉语,营销研究,行政法,司法审查,系统功能语言学,组织知识,行政主体,企业家决策,动态能力,文化,企业绩效,语篇,法治视野,语义,韩礼德,英汉大词典,绿色消费,风险感知,商务背景,廊桥遗梦,持续竞争优势,公共行政,行政相对人,

机构中山大学人文科学学院中文系: 作者数：582; 发文主题：鲁迅作品,语形,中国性,诗词,考论,苏过,尤袤,华文文学研究,隐逸文化,身份认同,华文文学,叙事性,马华文学,话语建构,文体形态,语文学习,本土性,彷徨,悖谬,重读,吊诡,文体,话语,鲁迅小说,指瑕,身份,新华文学,现实主义,异声,原乡,韵式,适用度,暧昧,文学研究,旧体诗词,知识容量,故事新编,赠送,和文,宏大,宋代,政治哲学,虚构,新马华文文学,文学观念,悼亡词,本土,

机构华南师范大学文学院: 作者数：833; 发文主题：审美意蕴,意识形态,当代美学,出版,中国马克思主义美学,通俗文学,鲁迅研究,中国现代文学,周全,文学研究会,小说,影视艺术,中国当代文论,审美理论,美学研究,知识分子,伊格尔顿,中国马克思主义,马克思主义美学,中国文论,文学批评,话语,伙计,人性,范式转换,翻译,文学创作,后现代主义,文学场域,审美意识形态,文学研究,前期创造社,文化唯物主义,文学社团,马克思主义,英国马克思主义,马克思主义文学批评,文学理论研究,社团研究,中国当代文学,文化研究,英国文化研究,文学观念,意象,创造社,文学理论,文化领导权,

相关领域作者

作者李文姬: 作品数：3被引量：0; 供职机构：广州市社会科学院; 发文主题：云计算;中国社科院;中科院;社会信息服务;数据库;数字图书馆;网络;信息服务;信息资源

作者邵慧君: 作品数：9被引量：21; 供职机构：文学院; 发文主题：粤方言;粤语;综论;语音比较;语音数据库;语音特点;战国时期;第一人称代词;送气;同源;代词系统;清分;厦门话;小称;海话;儿尾;方言词汇;白话;变调;变音

作者杜松华: 作品数：2被引量：0; 供职机构：广东工业大学; 发文主题：社交媒体;农业现代化;企业;电子商务;可持续发展;共生共赢

作者周国林: 作品数：22被引量：54; 供职机构：广东金融学院; 发文主题：产业共性技术;上市公司;实证研究;组织承诺;董事会;动漫产业集群;产业集群;影响因素;语言学习;证券市场;证券市场风险;人力资源发展战略;社会主义新农村;生态系统;生态学思考;实证分析;市场壁垒;企业形象设计;区域经济合作;区域经济均衡

作者邢弘昊: 作品数：8被引量：0; 供职机构：广东省社会科学院; 发文主题：营销管理创新;在线广告;支付功能;视觉中心;数据库技术;通信设施;亲情服务;主流媒体;自我革新;最大多数人;网络媒体发展;网民规模;媒介竞争;媒体;民族性特征;目标受众;精神文化产品;新媒体;活跃度;技术门槛

联系方式

电话：020-38800179

邮箱：gdtheory@126.com

地址：广州市天河区天河北路618号广东社会科学中心

邮编：510635

友情链接

扫一扫手机浏览

广东省社会科学院·广东省哲学社会科学数据库·广东智库版权所有 Copyright©2012 gdtheory.cn All Rights Reserved.

违法和不良信息举报中心举报邮箱：jubao@cqvip.com 粤ICP备10080020号-3