摘要:近年来,随着互联网技术和社会化媒体的迅速发展,信息负载对消费者的选择和决策产生了巨大的挑战。而个性化...近年来,随着互联网技术和社会化媒体的迅速发展,信息负载对消费者的选择和决策产生了巨大的挑战。而个性化推荐系统可以帮助人们在复杂的信息空间中找到其可能感兴趣的项目,目前已被广泛应用。在实际应用中,大多数推荐系统一般采用协同过滤推荐、基于内容(知识)的推荐,或者这些方法的混合推荐,但这些方法在实际应用过程中往往面临着数据稀缺和冷启动问题。目前,主流推荐系统的研究主要分为两种,一是根据新构造的用户和项目特征去改进协同过滤推荐系统,提高系统的推荐准确性,二是采用矩阵分解、降维和上下文感知等技术去解决数据稀缺和冷启动问题。从根源上讲,数据的不完善才是导致数据稀缺和冷启动问题的根本原因,如果能从多个角度采集到用户/项目信息,那么问题将得以解决。但在传统系统中,由于不同数据源在数据结构和数据格式等方面上都存在着较大的差异,很难对它们进行融合和组织利用。而关联数据(Linked Open Data,LOD)概念的出现,特别是关联开放数据项目的发展,为异源数据的融合提供了一种有效的解决方法,同时为解决推荐系统中的数据稀缺和冷启动问题提供了一种新的解决途径。对此,本文将关联数据应用到推荐系统的构架上,把推荐系统中的背景数据和关联数据云上丰富的数据资源进行链接融合,从数据源头解决数据稀缺和冷启动问题,并利用关联数据中的隐式反馈信息去提高系统推荐准确性。本文的主要研究内容为:(1)基于关联数据的个性化推荐系统框架研究:从数据层、融合层、算法层和应用层去构建和介绍该系统框架,并在与传统推荐系统进行比较分析后发现,基于关联数据的个性化推荐系统不仅能克服数据稀缺和冷启动问题,还能实现对用户的跨领域推荐,但该系统的实现存在着两个挑战,一是在融合层里如何对系统背景数据和关联开放数据中的同一实体进行判断和链接,二是在算法层里如何提取和利用关联数据中的隐式反馈信息去提升个性化推荐效果。(2)面向关联数据融合的实体同一性研究:深入分析关联数据中的实体同一性概念和类型,发现关联数据融合中实体同一性判断的核心在于资源实体间的属性匹配。对此,本文提出了一种基于属性类型的实体同一性判断方法:根据实体与属性之间的关系模式将属性划分为四种类型,并依据属性类型特点采用了对应的相似度计算方法,然后凭据属性类型对实体匹配的重要程度设计了关联数据融合中的实体同一性判断流程,最后利用Linked Movie Database和DBpedia上的电影数据集进行方法验证,成功识别了两个数据集上的同一实体,并通过实验对比证明该方法的优异性。(3)基于关联数据的个性化推荐方法研究:深入分析关联发现的本质,发现资源实体间的关联路径越多,它们之间的关联程度则越高,关联发现的效果就越好。对此,本文提出了一种基于三部图路径特征的topN推荐方法:考虑到关联数据中的隐式反馈信息可以增加用户到备选项目的推荐路径数量和种类,将关联数据引入到协同过滤二部图中,形成用户-项目-项目属性的三部图数据模型,在对模型和问题进行定义后,提取三部图中的路径特征和性质特征,并加入评分特征排除流行性偏差影响,然后采用特征排序学习方法对用户进行topN推荐;最后在融合后的movieLens和DBpedia电影数据集上与其它算法进行对比实验,实验结果分析表明该方法在一定程度上提高了系统的推荐准确性。更多还原显示全部