导 师: 明仲;潘微科
授予学位: 硕士
作 者: ;
机构地区: 深圳大学
摘 要: 互联网的爆炸式发展,产生了大量易于收集的隐式反馈数据,比如点击、浏览和收藏。如何利用这些隐式反馈数据来推测用户的潜在偏好变得日益重要。近年来,运用隐含狄利克雷分布主题模型求解单类协同过滤问题受到了许多学者的青睐,在推荐的过程中,引入主题概念,指导用户去选择感兴趣的主题,从而达到推荐的目的。目前,基于隐含狄利克雷分布的推荐模型主要通过基于用户的方法来学习用户兴趣的主题结构,但将基于用户的方法与基于物品的方法结合起来或者通过构造不同上下文信息来提升推荐效果的建模方式却很少有人考虑,因此,传统建模角度比较单一;大多数现存的相关研究主要对隐式反馈数据建模,而忽略了一种非常有价值的用户数据——用户对物品的评论信息,它是联系用户与物品的纽带,既反映了用户对物品的看法,又体现了物品的某些属性。因此,传统模型数据源比较单一。本文针对以上两方面问题,以隐含狄利克雷分布为基础模型进行改进。针对建模角度单一性的问题,首先,本文提出了基于隐含狄利克雷分布的混合单类协同过滤算法(Hybrid-LDA),通过融合基于用户的LDA-OCCF模型与基于物品的I-LDA模型来提升推荐效果。其次,本文通过评分值来构造不同段的用户偏好上下文,并提出了融合多段偏好上下文的单类协同过滤算法(Multi-LDA)。针对数据源单一性问题,本文在隐式反馈数据的基础上融入用户评论数据来增强推荐效果,并提出了基于评论的混合单类协同过滤算法(Hybrid-CALDA)。实验结果表明,本文提出的Hybrid-LDA、Multi-LDA以及Hybrid-CALDA在大多数情况下比前人提出的方法取得更好的推荐效果。
关 键 词: 单类协同过滤 隐式反馈 隐含狄利克雷分布 推荐算法
领 域: []