导 师: 谢振东; 谢胜利
授予学位: 硕士
作 者: ();
机构地区: 广东工业大学
摘 要: 共享单车作为新兴的“互联网+交通”的出行方式,不仅缓解了城市的噪音污染和交通拥堵,而且凭借其灵活方便、低碳环保、经济节能、可达性好的优势,已经逐渐成为解决城市“最后一公里”出行的首选方式。但其独有的特征给用户和运营商带来了许多问题,例如区域单车投放量不合理、高峰时段各区域车辆供需不平衡、运营管理收支不平衡等等。解决这些问题的关键在于对区域未来单车需求量的分析和预测,这对共享单车的车辆调度和运营商的运营管理有着十分重要的意义。本文首先对共享单车数据进行可视化分析,包括租借量的分布情况、时间特征(如季节、月份、小时等)对租车量的影响、环境特征(如温度、湿度、风速等)对租车量的影响等。然后,在特征工程部分对数据的空缺异常值进行填充,并由可视化分析结果进行特征构造,时间因子对租车量的影响较为明显,于是基于时间属性构造了租车量时间特征、环境时间特征和周期性特征等,另外,针对一天中的早晚高峰期时段的特性也构造了一系列特征,并进行特征选择。最后,分别建立支持向量机回归模型、随机森林回归模型和GBDT回归模型对共享单车的需求量进行预测。并利用stacking方法将三个模型进行融合,提出建立一种SSRG预测模型,比较分析它们各自的预测效果。实验结果表明,融合后的SSRG模型对数据拟合度比传统单一的模型更好,预测精度也更高。更多还原
分 类 号: [TP311.13;U491.225]