文献详情 - Gdtheory理论粤军网|广东智库信息化平台

文献详细_{Journal detailed}

基于MapReduce编程模型加权图边权值计算方法的研究

收藏

导　　师： 毛睿;冯禹洪

授予学位： 硕士

作　　者： (）;

机构地区： 深圳大学

摘　　要： 随着互联网技术的兴起以及大数据的发展,数据,已经渗透到很多行业。一方面,各种应用程序和社交网络产生的数据量日益增加,另一方面,数据趋于多样化和复杂化。随着数据量和数据类型的增加,研究人员对海量数据的挖掘和运用,可以从中获取更多隐藏的模式,发现更多的商业信息,从而实现增值价值。目前对数据挖掘的方法主要有:关联分析、协同过滤、聚类分析、回归分析、偏差分析等。但是许多数据挖掘方法都是基于图结构,然后辅之算法操作,使得数据间关联性充分表达,从而获取有价值的信息。海量数据的加权图构造对基于加权图论的数据挖掘至关重要,因此,基于加权图的数据挖掘中,实现大规模数据自动提取加权图是必不可少的。对于加权图的构造包括:(1)顶点确定;(2)特征提取;(3)边权值计算。其中加权图边的权值计算是一个计算密集型和I/O密集型的任务。当对海量数据计算时,单台机器由于内存等资源的限制,是相当耗时的,往往会随着计算量的增大而导致无法在特定的时间内完成任务。因此,为了克服单台机器资源的限制,本文围绕加权图构造方案展开研究,首次提出基于MapReduce编程模型加权图边权值计算方法的研究,并对其进行分类,实现和评估。首先,本文借助于流行的MapReduce并行分布式编程模型,提出边权值计算算法,并介绍如何将他们在MapReduce并行分布式框架中实现,从而实现加权图的自动构造。其次,加权图中边权值的准确度会影响数据挖掘的结果,本文结合当前的工作对边权值准确度进行测量。对于加权图边权值的准确性我们提出了综合性的评估方法,包括:边的数量、力度分布、社区构造、Hop-plot、和有效直径。最后,通过真实的社交网络数据集对提出的加权图边权值计算算法在执行时间、内存消耗、和磁盘使用方面做一个性能评

关键词： 提取加权图边权值计算相似性度量数据分析

领　　域： []

相关机构对象

机构中山大学: 作者数：27151; 发文主题：电视节目,用户,实证研究,家居,硬件,视域,异构,权利,分布式存储,蓝牙,启迪,从严治党,音乐门铃,领导干部,加密方法,中间件,党内权力,数字电视,权力监督,制度反腐,实体化,数字家庭,民主监督,社会主义国家执政党,马克思主义,监控系统,视频图像,中间件系统,数据传输方法,毛泽东,中国特色社会主义,风险评估,中国共产党,邓小平,素质教育,青年农民工,嵌入式,

机构暨南大学: 作者数：20971; 发文主题：行政手段,比较文学,法人资格,东亚货币合作,世界华文文学,三民主义,追寻,国际移民,双方当事人,文艺理论,法律地位,多角化经营战略,区域经济合作,经济法学,孙中山,国家所有权,母语教育,章程,网络,海外华文教育,横向经济联合,产权关系,专利法,文学传统,华裔美国文学,致辞,马来西亚华文教育,整体观,监事会,国有资产所有权,华族,全过程,汉语文学,冷战后,法律调整,全球语境,统战工作,海外华文文学研究,华文教育,辛亥革命时期,结构性权力,华人社会,海外华文文学,他者,文本阅读,涉外经济法规,粤港澳,经济法制,东南亚华人,新移民文学,人口比例,经济联合体,中国文学,企业集团,跨文化,社会参与,法制管理,文学概论,全球化语境,文艺学研究,

机构华南师范大学: 作者数：20338; 发文主题：教师成长,宏观经济,社会主义实践,中国梦,二重性质,马克思主义经济学,人生哲学,有效教学,中国货币政策,教育科研,克鲁格曼,教育叙事研究,教育研究,政治经济学,人民内部矛盾,新自由主义,校本教研,人性,哲学发展,课程改革,老师,教育行动研究,卢卡奇,学校教育,动物精神,马克思哲学,凯恩斯主义,人类社会发展规律,西方经济学,因果,教学研究,社会主义市场经济,中国共产党,教师,实证研究,诺贝尔经济学奖,教育现象学,英美文学,埃尔斯特,实证检验,校本教学研究,中国化马克思主义,社会主义建设规律,唯物史观,经济政策,社会存在本体论,异化,日常教学,社会主义发展道路,叙事研究,早期西方马克思主义,教学理念,马克思主义,人民币国际化,历史唯物主义,萨金特,教育叙事,世界货币,本体论,

机构中山大学管理学院: 作者数：2708; 发文主题：技术引进,顾客信任感,刑事诉讼法,司法制度,顾客忠诚感,信任感,司法鉴定,顾客满意感,扎根理论,忠诚感,沉默权,上市公司,诉讼法学,组织公平性,刑事诉讼,企业,跨国公司,服务公平性,授权,经济收益,买卖双方,满意感,电子商务,人权保障,顾客感知,情感性劳动,实证研究,刑事诉讼法学,暂缓起诉,服务质量,营销学,证明力,一线员工,消费者,司法完善,证明标准,企业管理,顾客满意程度,游客,心理受权,司法权威,服务业,在线旅游,正当程序,电子商务环境,顾客,服务氛围,顾客期望,自主创新,公正,

机构华南理工大学: 作者数：19075; 发文主题：模型,甲烷,订单农业,协商模型,零售商,供应链管理,绩效关系,供应链协调,制造商,催化剂,知识创新,关系承诺,利益分配,变质性物品,企业,技术创新,虚拟企业,知识分享,供应链协调模型,订货量,石墨烯,研究生教育,可控提前期,时变需求,实证研究,价格折扣,管理创新,信息共享,运营绩效,战略管理,货栈,协整关系研究,滞后支付,创新绩效,库存路径问题,订购,报童模型,信息不对称,创新型企业,销售商,内向型,博弈,甲醇电氧化,创新管理,直接甲醇燃料电池,外向型,智慧城市,风险规避,生命周期,车辆路径问题,供应链协作,供应链,员工创新行为,协整检验,动态面板,共性技术,德行领导,

基于MapReduce编程模型加权图边权值计算方法的研究

参考文献更多+

二级参考文献更多+

引证文献更多+

二级引证文献更多+

同被引文献更多+

耦合作品文献更多+

相关文献更多+

相关作者

相关机构对象

相关领域作者

基于MapReduce编程模型加权图边权值计算方法的研究

参考文献 更多+

二级参考文献 更多+

引证文献 更多+

二级引证文献 更多+

同被引文献 更多+

耦合作品文献 更多+

相关文献 更多+

相关作者

相关机构对象

相关领域作者

参考文献更多+

二级参考文献更多+

引证文献更多+

二级引证文献更多+

同被引文献更多+

耦合作品文献更多+

相关文献更多+