帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

大数据平台下的互联网广告点击率预估模型
Internet CTR prediction model on big data platform

作  者: (魏晓航); (于重重); (田嫦丽); (陈秀新);

机构地区: 北京工商大学计算机与信息工程学院,北京100048

出  处: 《计算机工程与设计》 2017年第9期2504-2508,共5页

摘  要: 现存的广告点击率预估模型提取的特征维数较多,数据量较大,使得传统平台在应用时压力大,反应时间较长。针对这一问题,提出梯度提升决策树与因子分解机相结合的广告点击率预估模型,将基础特征库里的连续特征离散化,利用梯度提升决策树对输入特征进行非线性转化,利用Hadoop大数据平台进行分布式训练,高效快速地提取出高层特征,利用因子分解机融合模型解决不均衡分类问题,利用AUC指标对模型进行评估,与常用广告点击率预估模型进行对比。实验结果表明,大数据平台以及并行化的应用使特征提取更加高效,模型解决了分类不均问题,具有更好的广告点击率预估效果。 Existing advertising click-through-rate prediction models extract more feature dimension and the amount of data is large. So the application of the traditional platform is under pressure and reaction time is longer than others. To solve this prob-lem, a click-through-rate prediction model combining gradient boosted decision tree and factor decomposition machine was pre-sented Continuous feature of basic feature library was discretized, and input feature was transformed nonlinearly,also Hadoop big data platform was used to extract the high level features with high efficiency. Factor decomposition machine fusion model was used to solve the imbalanced classification problem. AUC index was used to evaluate the model, whose results were com-pared with that of common click-through-rate prediction model. Results of experiments show that big data platform and paralle-lization application are more efficient to implement feature extraction, and the model solves the problem of imbalanced classifica-tion. Besides it has better effects of click-through-rate prediction.

关 键 词: 点击率预估 梯度提升决策树 大数据平台 分布式训练 因子分解机

相关作者

作者 李土金
作者 陈滨
作者 宁亚楠
作者 贺敏伟
作者 段淳林

相关机构对象

机构 华南理工大学
机构 暨南大学
机构 中山大学
机构 暨南大学新闻与传播学院
机构 广东财经大学

相关领域作者

作者 庞菊香
作者 康秋实
作者 康超
作者 廖伟导
作者 廖刚