导 师: 张敏强
学科专业: H0402
授予学位: 硕士
作 者: ;
机构地区: 华南师范大学
摘 要: 在心理学调查、实验当中,稀疏数据随处可见,如何用适当的方法对稀疏数据集进行参数估计,一直为研究者关注的其中一个热点。在国内,暂没有研究者对稀疏数据进行研究。稀疏数据作为缺失数据的一种特殊形式,为研究带来了一系列新的问题。<br> 本研究首先根据Brennan(2000)所著的《概化理论》一书当中,含缺失数据单侧面交叉设计方差分量估计公式进行推导,推导出含缺失数据双侧面交叉设计方差分量估计公式,作为传统方法的估计公式。之后将Chiu(2002)提出的拆分法中对于混合组的估计方法从MINQUE转换成MIVQUE,对稀疏数据进行估计。最后加入限制性极大似然估计(REML)这种运用迭代形式进行计算的方法与前两种方法进行对比。本研究运用三种方法得出的估计值与模拟中的设定值之间的偏差作为指标,对三种方法的估计准确度进行比较。<br> 本研究运用Matlab7.0,对数据进行模拟,根据高考评分模式,将数据总体设计为p×i×r设计的稀疏数据,缺失率为50%,之后运用Matlab7.0、SAS8.0、urGENOVA软件分别对数据进行方差分量的估计,得出如下结论:<br> (1)传统方法可以方便、快捷地估计出测量目标、各测量侧面及其交互作用的方差,并且对大部分方差能作准确的估计。在以后的研究当中,可着重于研究传统方法的改良,令传统方法对被试与评分者交互作用的方差估计及残差估计更为精确。<br> (2)REML方法为三种方法当中估计最为准确的方法,但因为运用迭代方法,估计时间相对较长,而且在某些设计中会出现矩阵不收敛情况。<br> (3)拆分法能准确地估计出方差分量,但拆分法仅能估计出部分方差分量,其中某些方差分量会相互混合不能分离。<br> (4)三种方法对被试数量的改变都不敏感,被试数量对三种方法估计方差分量值的准确度基本上没什么影响。<br> (5)评分者总量的提高在被试数量、题目数量较少的情况下能有效影响三种方法估计的准确度,但是当被试数量、题目数量提高后,评分者的影响效果减小。<br> (6)题目数量对三种方法的影响最大,题目数量仅作较少量的提升,就能使估计的准确度较大提高。<br> 在实际的考试评分测量当中,如果需要知道尽可能具体、尽可能多的方差分量估计的话,可以考虑选用传统方法或REML方法对稀疏数据进行方差估计;如果只需知道方差分量大概结果,可以选用拆分法对稀疏数据进行方差估计。而在试卷设计当中,题目的影响效果最大,如果在人力物力有限的情况下,可先考虑增加题目数量,以获取更准确的方差分量估计,其次考虑增加评分者总量,而学生数量对三种方法的方差估计影响不大。
分 类 号: [B841.2]