导 师: 刘卫国;张衡
学科专业: H1204
授予学位: 硕士
作 者: ;
机构地区: 中南大学
摘 要: 数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。关联规则是数据挖掘的一种重要模式,它揭示事物之间的相关程度。 在网络日益普及和高校扩招背景下,高校开发了一系列网络辅助教学系统。这些教学系统中存在内部网页链接结构不合理,教学系统之间相互独立而无法体现课程之间的关系,学习与教学相脱节等缺点。利用关联规则技术可以有效克服这些缺点。 关联规则的挖掘分为两步:找出所有的频繁项集和频繁项集产生强关联规则。挖掘关联规则算法的总体性能由找出所有的频繁项集这一步决定。本文在对经典关联规则算法—apriori算法分析的基础上,提出了一种基于压缩矩阵的apriori改进算法,将事务数据库转换为布尔矩阵,在该矩阵上查找频繁项集,在查找的过程中,压缩布尔矩阵,减少了算法的时间复杂度并减少占用的内存空间。通过压缩矩阵和减少扫描次数提高挖掘的速度和减少数据库的i/o操作时间的开销,有效提高了关联规则的挖掘效率。 本文以惠州学院网络教学系统为实例,构建事实星座型数据仓库,设计高校教学数据挖掘应用系统,并将基于压缩矩阵的apriori改进算法以插件算法的形式加入到系统中。该系统发现了教学系统内部网页之间的关联规则和不同课程网页之间的关联规则。根据这些关联规则可改进课程网页的链接关系,从而方便学生的学习,也可以为教师的课堂教学提供建议。
分 类 号: [TP311 G434]