导 师: 姚正安
学科专业: G0104
授予学位: 硕士
作 者: ;
机构地区: 中山大学
摘 要: 随着信息技术的发展,数据挖掘(data mining)技术受到了广泛的关注,在数据挖掘技术中有很多研究领域,聚类分析就是其中一个重要的研究方向,对它进行深入研究不仅有着十分重要的理论意义,而且有着非常重要的应用价值, 本文研究了高校专业排名问题,针对教育部重大项目“高校本科专业设置预测系统”中的子问题进行研究,对高校专业评估和学生填报高考志愿具有十分重要的指导意义.网上一些排名的方法,大都是选取多个指标,然后加权求总分得到排名,但对权重的分配有很大的主观性.本文采用的降维和模糊聚类相结合的方法对专业进行排名就克服了这个问题.首先是从目的性、可比性和可行性等多方面考虑选取评价指标体系,但由于影响本科专业设置的指标较多,如何对指标进行筛选(降维)成了问题的关键,主成分分析的方法得到的主成分是原有属性的线性组合,不能直观的体现原有属性的作用,本文采用的是对主成分分析方法进行改进得到的一种新的降维方法,使用该方法可以保留原有属性,最后结合模糊聚类分析对专业进行排名.由于基于等价矩阵的模糊聚类的分类数不定,可以根据不同要求对事物进行动态聚类,所以本文采用的是基于等价矩阵的模糊聚类分析实现对专业的排名,得到了合理的结果. 高校本科专业设置预测系统所涉数据量过于庞大,且采集比较困难,另外,此项目开展时间尚短,所以导致做本论文时数据严重不全,可用数据样本较少,因此,本论文所做实验仅具备演示功能,不具备真正排名效果.
关 键 词: 高等院校 专业排名 数据挖掘 模糊聚类分析 主成分分析
分 类 号: [G64 TP311.13]