摘要:O2O即Online to Offline,是一种线下商户与互联网相互结合的商业模式。近年来,随着移动端网络消费的兴起,O2...O2O即Online to Offline,是一种线下商户与互联网相互结合的商业模式。近年来,随着移动端网络消费的兴起,O2O消费得到了各大商业平台的广泛关注,其中蕴藏着巨大的商业价值。消费券投放是O2O的一种重要营销策略,但随机投放会对大多数用户造成干扰,同时也会增加商家的营销成本。精准投放是提高消费券核销率的重要技术,它可以让商家直接面向具有一定消费偏好的用户,使其得到真正的实惠,在降低商家营销成本的同时促进商家的营业额,实现商家、用户共赢。O2O行业的特性使其天然与数以亿计的消费者相关联,记录着海量的用户历史流水信息。本文通过对这些真实的用户历史流水记录进行挖掘,并构建相应的特征群训练得到用户的消费券核销预测模型,以此预测用户未来是否会使用消费券,从而为消费券的精准投放提供决策依据,主要的研究工作可以分为以下四个方面:(1)首先从消费券、商户以及用户三个方面进行数据探索并在此基础上构建相应的特征群,用以表征用户的消费行为习惯,商户和消费券本身的信息属性,并通过方差选择和极端梯度提升树算法XGBoost对原始特征进行特征筛选,以去除相应的冗余特征,完成数据集的构建;(2)为了增强特征的表达能力,本文基于XGBoost对原始特征群进行特征变换,随后将变换得到的新特征与原始特征进行合并,从而构建得到新的训练数据,并以此训练XGBoost得到基于XGBoost特征变换的消费券核销预测模型,实验表明,相较于原始特征集,通过特征变换能够进一步提升模型的预测效果;(3)传统的梯度提升算法普遍都会在训练过程中产生有偏的梯度估计,使得最终训练得到的模型产生预测偏移,影响其泛化能力。为此,本文引入新型的梯度提升算法CatBoost,它基于Ordered Boosting的方式进行训练,得到训练所需的无偏梯度估计以减缓预测偏移,从而增强模型的泛化能力。实验表明,基于CatBoost的消费券核销预测模型相较于传统梯度提升算法有更好的模型性能;(4)最后将上述(2)、(3)中的单一模型进行加权融合,从而得到最终的基于XGBoost和CatBoost相结合的消费券核销预测模型,对用户未来是否会使用消费券进行预测。实验表明,相较于单一模型,融合模型具有更好的预测效果,从而能为消费券的精准投放提供较为可靠的决策依据。更多还原显示全部