帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于spark的电商用户行为大数据分析的研究

导  师: 杜戈; 谢胜利

授予学位: 硕士

作  者: ();

机构地区: 广东工业大学

摘  要: 随着21世纪的到来,电商互联网的快速发展已经涉及到了各个角落,从而引起了电商用户数据量的增长。商家采取了很多措施来达到利润的最大化,其中涉及了对电商用户行为的分析与研究,并根据电商用户的行为特征来判断其购买行为。在日常的网络购物中,用户不经意的各种操作都会引起其最终的购买行为,但是其中很少会转化为实质性。利用用户的个人信息及网购的趋向来构建一套机器学习模型可以促进电商用户的购买行为。其中一方面可以提高电商用户购买的效率,另一方面可以增加卖家的整体收入水平。为了提高电子商务用户购买的比率,关键在于电商平台和推荐算法模型的构建,因此本文主要做了以下的研究:1、首先,介绍了电子商务用户行为的研究背景及其意义。在这个基础上研究了电商用户行为分析的相关技术,包括Spark平台的组件及相关用户行为分析模型的分类算法。2、其次,对某电商平台提供一段时间的用户行为数据,从而进行一系列的数据预处理,包括消除异常值、处理缺失的信息和其他初步工作,接着提出了时间序列的规则对原数据进行动态滑动窗口的处理。3、最后,分析了XGBoost模型三大参数的作用及意义,接着叙述了用户行为单一模型的构建和改进混合模型的设计,与Spark-XGBoost结合起来使用后对重要的参数进行调参优化,然后通过改进的Spark-XGBoost模型与传统机器学习方法通过对比实验来验证改进模型的优势及其可行性。通过以上的研究表明,基于Spark平台的XGBoost预测模型比一般传统的机器学习算法模型具有比较好的预测准确性和稳定性。本文的研究为电商用户行为预测提供了一种并行化的方法,这可以作为一种行之有效的预测电商行为的办法应用于日常生活之上。更多还原

关 键 词: [8506740]HADOOP [100401449]SPARK [9283420]大数据 集成学习 XGBoost 行为分析

分 类 号: [F724.6;TP311.13]

领  域: [] []

相关作者

作者 陈智永
作者 黄国梅
作者 李典
作者 秦霞
作者 张璇

相关机构对象

机构 广东科技学院
机构 华南理工大学
机构 广东财经大学
机构 广州番禺职业技术学院
机构 广东工业大学管理学院

相关领域作者