导 师: 彭小刚;潘微科
授予学位: 硕士
作 者: ();
机构地区: 深圳大学
摘 要: 随着智能推荐技术的发展,面向异构数据源的推荐算法的研究意义越来越重要,一是因为只用购买数据来提高推荐的精度变得越来越困难;二是因为购买数据一般比较稀疏,所以需要其他数据来辅助推荐;在这种背景下,考虑到浏览数据可以作为购买数据的一种很好补充,而且浏览数据相对比较充足,所以本文对如何利用购买数据和浏览数据来建立推荐模型进行了深入的研究,以实现更好推荐效果。浏览数据存在着语义不确定,即不同的浏览数据在表达用户偏好的程度上有所不同,一些浏览数据能表达用户的偏好,但一些浏览数据并不能表达用户的偏好。正是这种语义不确定性给推荐模型的建立造成很大困难,所以有些研究把注意力放在如何在浏览数据中挑选具有确定语义的浏览数据的问题上,但是这种思路却使得建立的模型比较复杂,模型训练的时间消耗比较大。所以本文提出了基于用户角色的偏好学习算法(RBPR)和BPR+算法,其中RBPR是对用户购买商品过程中的不同阶段所扮演的角色来建模的,通过利用不同阶段产生的数据分别来训练模型,从而模拟该阶段用户所扮演的角色,并且通过数据的传递来模拟角色间的交互。而BPR+算法是在矩阵分解过程中把商品的特征区分为购买特征和浏览特征,从而使得模型能多学习到用户的浏览偏好以及购买与浏览之间的关系。实验表明以上两个模型的推荐效果都要远比单纯利用购买数据来建模时的效果要好,但是两者各有优势,RBPR的模型简单,所以训练速度要比BPR+快,而BPR+的模型复杂,但是学习的信息相对RBPR要更加全面,所以效果相对较好。最后对RBPR和BPR+算法的互补性进行研究,提出了EPL集成方法,该方法对商品在RBPR和BPR+算法的推荐列表中位置做了统一表达,然后再对EPL统一计算出的商品评分进行排序,然后取Top-K个商品作为最�
领 域: []