导 师: 黄沛杰;彭平
授予学位: 硕士
作 者: ;
机构地区: 华南农业大学
摘 要: 随着社会的发展,我国高等教育普及率越来越高,在校学生规模越来越大,各个高校的教务网络管理系统也因此积累了大量的数据,面对这些海量数据,很多教学管理人员还停留在对数据进行简单的录入、查询、统计和备份等初级阶段等操作,不能对隐含在数据背后有用的知识及信息进行有效的提取与分析。如何通过这些数据评价教师命题的科学性,发现学生各门课程成绩的分布情况,并预测课程的重要性,以及找出学生成绩与课程之间的关联性,以便用来决策支持、指导教学,20世纪90年代初出现的数据挖掘技术便能有效解决这一难题。 本文首先介绍数据挖掘的研究背景、意义,综述其在国内外的研究现状;在第二章详细地介绍数据挖掘的概念、方法、过程与工具;在第三章,基于特征描述的方法,以学生的计算机水平考试(Office高级应用)成绩为样本,借助Microsoft Excel和IBM SPSS Statistics软件,挖掘分析学生成绩的总体特征分布,从中找出有用的规则与模式,用于评价教师命题的科学性;在第四、第五章分别详细地介绍聚类分析与关联规则的概念、分类,并对它们的经典算法—K-Means算法与 Apriori算法作了进一步的研究;最后,利用K-Means算法与Apriori算法,借助IBM SPSS Modeler工具,按照方案设计、数据准备、模型建立与结果分析的思路,对广州GS学院会计学专业的学生成绩进行分析,挖掘出学生各门课程成绩的分布情况,并预测课程的重要性以及挖掘出课程之间的关联性,挖掘结果将为学生制定学习计划、优化学习方法、提高学习效率提供指导和帮助,为教师开展教学活动、提高教学质量、进行教学反思和总结提供参考依据,为教学管理人员设置课程、制定教学计划以及修订人才培养方案提供决策支持,为学校深化教学改革、提高