导 师: 张星明
授予学位: 硕士
作 者: ;
机构地区: 华南理工大学
摘 要: 随着网络技术的发展和互联网的普及,网络信息量在急剧增加,这在满足了用户的信息需求的同时,也无形中提升了用户获取有效信息的时间成本,降低了用户的浏览兴趣。为了解决该问题,提升用户满意度,需要引入个性化推荐技术来进行信息过滤,帮助用户高效获取信息。本文主要关注人力资源求职招聘方面的推荐算法,希望在为求职者提供的推荐职位列表中能最大程度的含有他们真实的意向职位。因此,本文对混合推荐算法在人力资源领域的应用进行了研究,重点实现算法在Spark平台的并行化,以及解决人力资源推荐中存在的冷启动、评分稀疏问题。本文的主要工作包括:(1)从作者所在实验室的项目中采集实验数据,包括应聘者个人信息、岗位基本信息和应聘者历史行为信息;针对采集得到的数据所存在的问题,进行了相应的预处理操作,并为预处理后的数据设计了数据库表,构建实验所用的训练集和测试集。(2)针对协同过滤算法运行时间长的问题,提出了项目聚类协同过滤算法,将层次聚类应用于协同过滤中,缩小了邻居项目的查询范围;针对基于内容的推荐算法存在的用户冷启动问题,提出了融合用户基本信息的内容推荐算法,使得当新用户评分数较少时,可以根据用户基本信息来进行项目推荐;针对单一推荐算法存在的不足,提出了基于以上两个算法的混合推荐算法,并将其应用到人力资源推荐领域。(3)为了提高算法的可扩展性,在Spark平台中对本文的混合推荐算法的并行化进行了设计和具体实现。最后,通过实验证明了本文算法能较好地应用到人力资源推荐中,具有较好的推荐召回率和可扩展性。更多还原
领 域: []