导 师: 宋顺林
学科专业: H1203
授予学位: 硕士
作 者: ;
机构地区: 江苏大学
摘 要:
电子商务系统在为用户提供越来越多选择的同时,商品信息过载现象越来越严峻,其结构也变得日益复杂,用户想要从商品海洋里迅速便捷地找到自己真正需要的商品越来越困难,于是电子商务个性化推荐系统应运而生。
推荐算法是推荐系统中最核心的部分,在很大程度上决定了推荐系统性能的优劣。协同过滤推荐根据与用户兴趣爱好相同或相似的其他用户的评价产生推荐,个性化程度高,是目前应用最广泛、最成功的推荐技术,但它在实际应用中还存在很多缺陷:如预测评分中用户相似性计算不准确,实时性差、推荐精度不高等。
本文针对推荐系统的实时性要求,提出了基于项目簇偏好的用户聚类算法。该算法首先基于项目属性对项目聚类,得到用户对不同项目簇的偏好,然后利用k-means聚类算法对用户进行聚类,将相同或相似兴趣的用户分到同一类中,这样可以找到离当前用户最近的几个聚类,然后在这几个聚类中搜寻最近邻居,避免了在整个用户群上搜寻,提高了实时响应速度。
k-means聚类算法由于随机选取初始聚类中心,这样得到的聚类结果随机性很大。本文将用户在不同项目簇上的评价差异作为用户距离,采用克鲁斯卡尔(kmskal)算法生成初始聚类中心,使得初始中心靠近类中心,这样得到的聚类更符合实际。
针对传统方法没有考虑项目之间的内容关系而影响推荐精度问题,本文提出了基于项目相关性的协同过滤算法。该算法首先将项目相似性引入到预测评分中的用户相似性计算,避免了不相关项目对用户相似性计算的干扰,其次,在预测评分中增加时间权限,使得越新的用户兴趣在推荐过程中的权值越大。
最后利用movielens数据集进行两个实验:最近邻居搜寻效率实验和协同过滤算法实验。前者的度量方法是最小空间内搜索到更多的邻居,实验结果表明基于项目簇偏好的的k-means聚类算法可以在更小的用户空间内搜索到更多的邻居用户,提高了查找用户最近邻的效率和精度;后者以mae作为评价指标,对本文设计算法和传统算法进行性能比较,实验结果表明本文设计算法得到了更好的推荐效果。
关 键 词: 个性化推荐 协同过滤 项目属性 项目簇偏好 初始聚类中心
分 类 号: [TP393.09]
领 域: [自动化与计算机技术] [自动化与计算机技术]