帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于项目综合相似度的协同过滤算法
The Integrated Similarity Based Project Collaborative Filtering Algorithm

导  师: 许智宏

学科专业: 081203

授予学位: 硕士

作  者: ;

机构地区: 河北工业大学

摘  要: 互联网拥有全世界最全最大的信息资源,丰富的资源给人们的生活和学习带来了便利的同时,也引发了信息过载的问题。如何让没有明确目标的用户能准确找到满意的信息资源,成为目前信息生产者所面临的问题之一。推荐系统的出现可以解决这个问题,推荐系统的关键是推荐算法。 本文要构建个性化电影推荐系统,常用的基于内容的推荐算法不适合电影信息的特征提取,电影系统也不存在好友关系,社交网络推荐也不适合电影系统推荐,所以该系统使用协同过滤推荐。随着个性化电影推荐系统的推广用户会越来越多,电影每年增长的数量没有用户多,所以基于项目的协同过滤算法显然更适合基于用户的协同过滤方法。传统的基于项目的协同过滤算法只考虑了用户评分矩阵,没有考虑到项目类别矩阵,所以推荐质量不高。本文在相似度计算方面改进了基于项目的协同过滤算法,主要工作如下: 1)提出了综合相似度是项目与项目间的相似度和项目类别间的相似度以一定权重组合在一起。传统的综合相似度计算,项目与项目之间的相似度的系数和项目类别间的相似度的系数和为1,并不能很好的解释能够组合的理由。本文改进了权重的配比方式,对于组合方式有很好的解释。平均绝对误差MAE是评判推荐算法优劣的一种标准,通过比较传统算法和改进算法的MAE,来验证传统算法和改进算法的优劣。 2)推荐算法计算复杂,自然而然花费的时间也多,利用Hadoop技术可以对基于项目综合相似度计算和Top-N推荐并行化。通过时间上的提高率证明了并行化计算减少了时间复杂度,提高了用户体验效果。 Internet has the world's largest and most complete information resource.Abundant resources bring the convenience to people’s lives and learning.Theresources also lead to an information overload problem. How to make no clear targetfor users who can accurately find the information resources become a problemwhich information producers are facing.The system of Recommendation can solvethis problem.The key is algorithm of the recommendation. This paper should build personalized movie recommendation system.Wecommonly used content-based recommendation algorithm which is not suitable formovie information.There was no relationship between friends movie system.Socialnetworks are not suitable for movie recommendation system recommended so thatthe system uses collaborative filtering recommendation. Therefore the project-basedcollaborative filtering algorithm is clearly more suitable for user-based collaborativefiltering method. The traditional project-based collaborative filtering algorithmsconsider only user rating matrix.It is recommended that the quality is not high. Inthis paper, the similarity calculation improved project-based collaborative filteringalgorithms.The main work is as follows: 1/) Proposing a comprehensive similarity is the similarity of projects and thesimilarity between categories.Traditional integrated similarity calculation.Projectand project similarity between the coefficients and item category similarity betweenthe coefficients and is one can not be combined well explained reasons. MAE is themean absolute error of judging the merits of a standard recommendation algorithm.The experiment verifies the traditional algorithm and improved algorithm merits. 2/) The algorithm of Recommendation is complexity. Naturally spend more timein the use of project-based Hadoop technology can be integrated on the similaritycomputation and parallel Top-N recommendation. By the time that the increase rateof the parallel computing complexity reducing the time and improve the userexperience results.

关 键 词: 协同过滤算法 综合相似度 综合发射率 推荐

分 类 号: [TP391.3]

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

相关机构对象

机构 中山大学

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊