现代教育测量与评价的发展趋势
现代教育测量与评价的发展趋势
1.经典测验理论(简称CTT)是最早的测验理论,也是最实用的测验理论。
2.题目反应理论
现代测验理论有许多模式,其中题目反应理论最具优越性。
题目反应理论认为:一个人的行为举止就好像处于自身某些心理品质的定量控制之中,要定量地估计个体在每一种特质上的位置是心理测量的任务。反之,也可用所估计到的特质的量去预测和解释个体在相应情境中将会产生的行为反应。
题目反应理论是建立在如下的假设中的:
假设1:一维性(即考生的某一测验结果只取决于一种潜在特质或称能力,其他能力的影响均可忽略);
假设2:局部独立(即考生答题时不受其他试题影响);
假设3:适合的数学模型(须经拟合度检验)。
3.经典测验理论与现代测验理论的比较
(1)参数稳定性
经典测验理论使用的题目分析法所得的题目统计量数受样本的抽样影响较大。现代测验理论IRT的方法具有局部独立和参数独立等特点。题目参数估计是独立于被试样本和题目样本。
(2)能力的比较
经典测验理论对被试能力间的比较只能在相同的测验或平行复本的情况下进行。而现代测验IRT是自适性测验或电脑自适应测验,它的处理较方便且灵活。
(3)平行复本难实现
经典测验理论最基本的概念是测验的信度。而信度的设定来自平行复本的假设。但事实上平行测验是很难达到的,被试不可能在两次测验中得到完全相同的结果。影响测验结果的因素很多,如遗忘、学习新知识技能、动机及焦虑程度等。经典测验理论常依赖平行复本的假设,所以研究者在现实实施中只能接受下限的信度估计或具偏差的信度估计。
(4)缺乏预测力
经典测验理论无法预测被试在一个新的测验中可能的表现。现代测验IRT就是使用概率的观念来表示被试能力与项目的关系表示具有某种能力的被试答对某题的概率P。
(5)测量标准误
经典测验理论是假定所有被试的测量标准误都是相等的。事实上,不难发现,不同能力组表现在测验上的稳定性是不同的。如施测几个复本,可能高能力组比中能力组稳定性高。良好的测验模式应能针对某一测验得分或被试能力进行精确的估计,不同的得分或能力有其不同的概率误差,而非统一的测量标准误。
除此之外,经典测验理论在测验的设计、偏误题的认定、测验的等值问题上还没有得到满意的解决。