导 师: 李振坤
学科专业: H1203
授予学位: 硕士
作 者: ;
机构地区: 广东工业大学
摘 要: 数据挖掘就是从海量的数据中挖掘出可能有潜在价值的信息的技术。这些信息是可能有潜在价值的,支持决策,可以为企业带来利益,或者为科学研究寻找突破口。关联规则挖掘是数据挖掘技术中的非常重要的功能。关联是某种事物发生时其他事物会发生的这样一种联系。图书馆每天产生大量的图书流通数据,这些数据除了用于记录读者的信息外,一般只用来做一些常规的业务数据统计,这些数据潜在的使用价值还远远没能得到充分的挖掘和利用。我们可以通过将关联规则挖掘方法应用到图书数据的分析中,挖掘和发现读者借阅行为中隐含的规律,以指导图书馆的馆藏图书分布决策,以及提供读者服务工作,提出读者的个性化服务模型。 本文主要是对数据挖掘技术中的关联规则挖掘研究。通过总结前人对于关联规则的各项研究,特别是对经典apriori算法以及其变形算法的深入细致的分析比较,改进了一种新的关联规则挖掘算法,该算法是:基于维谓词约束、维数目约束以及频繁链表结构的多维关联规则挖掘算法;同时并对关联挖掘综合评价问题的相关性进行分析探讨、在前人基于概率差值的兴趣度阀值的基础上,进行了理论上的验证,在产生关联规则这一步骤方面,扩宽了负项目挖掘的思路,并综合频繁项集的产生过程,最终写出了改进后的算法。接着在微型计算机上编程实现了本文改进算法,建立了实验模型,通过大量实验数据模拟,验证了该改进算法在时间和空间上的性能提高、以及产生的关联规则项目更加科学合理和客观。本文最后还将改进的算法应用于广东工业大学图书馆管理系统,建立了用于挖掘系统的图书馆数据仓库,设计和实现了图书馆挖掘系统,并对2009年2月至4月的馆藏读者借阅数据进行了关联规则挖掘,通过对数据的认真细致分析比较,挖掘到了隐藏在借阅数据之间的读者借书规律,并结合学校实际情况,因地制宜,提出了相应的馆藏布局和读者个性化服务等方面的建议,从而有效地提高了图书馆管理工作决策的水平。
分 类 号: [G250.74 TP311.13]
领 域: [文化科学] [自动化与计算机技术] [自动化与计算机技术]