于是有:
因此,该测验的分半信度为0。92。
②库德—理查逊公式法。由于测验分半的方法多种多样,不同的分法将得到不同的分半信度,而要把一个测验分拆成真正等值的两半是不容易的。能否不作拆分而直接通过一次施测所获得的数据来估计测验信度呢?库德(G。F。Kuder)和理查逊(M。W。Ri)提出了一系列的公式来估计测验的信度,较常用的是K-R20公式:
式中k为构成测验的项目数,p为各项目的通过率,即难度,q=1-p,S2t为被试各项目得分之和的方差。
例14:有一个包含6个项目的测验,10名被试得分如下(通过得1分,未通过得0分),求该测验的信度。
解:根据表中的数据求得
于是有:
因此,该测验的分半信度为0。47。
③α系数法
分半信度适用于(01)和(0K)记分的项目,库德—理查逊公式只适用于(01)记分的项目,α系数法适用于(0K)记分的项目。α系数法由克伦巴赫(L。J。bach)提出。公式为:
式中k为构成测验的项目数,S2i为各项目得分的方差,S2t为被试各项目得分之和的方差。
例15:有一个包含6个论文式题目的测验,5名被试得分如下,试求该测验的信度。
解:首先,求各项目得分的方差S2i和方差之和。
其次,求被试各项目得分之和的方差,即求41、63、43、57、54的方差:S2t=68。96。
最后,求α系数。
因此,该测验的分半信度为0。85。
计算内部一致性系数,需注意下列问题。
一是若用分半法时,以按奇数题和偶数题分为两半为宜。若把整个测验分为前后两半,一方面,前半部分试题与后半部分试题未必等值;另一方面,被试者在完成后半部分试题时,可能因疲劳、厌倦等原因而影响回答质量,以致前后反应不一致,影响信度。
二是速度测验不宜用分半法。因为速度测验的项目难度低,被试得分多少在很大程度上取决于答题数量的多少,分半法易使得分相同,从而会夸大分半法的信度。
(4)评分者信度。评分者信度是估计不同评分者对同一测验评分一致性程度的指标。
一般论文式考试,只能提供列出答案要点的参考答案而无固定的标准答案,因而不同的评分者对同一份试卷往往给分不同,甚至有很大的悬殊。在作文测验、投射测验、品德测验、创造力测验等的评分中,都存在这个问题。评分者之间的评分不一致,说明评分的信度不高,评分者所评的分数越一致,评分的信度越高。
要计算评分者评分的一致性系数,需区分评分者的人次数。若只有两人评N份试卷,或一人先后两次评N份试卷,可用斯皮尔曼(Spearman)等级相关的公式计算;若三个以上的评分者评N份试卷时,则需计算肯德尔和谐系数(Keofce)。
①斯皮尔曼等级相关。评分者为两人时,将两人的评分转化为等级,求等级相关系数。
式中rR为等级相关系数,D为两人评分的等级之差,N为试卷数。
例16:甲、乙两位教师评阅10份作文试卷,结果如下,问两位教师的评分是否一致?
将表中数据代入等级相关公式,求得
可见,两位教师评分的一致性系数比较大,评分基本可靠。
②肯德尔和谐系数。有多名评分者,将评分转化为等级,求肯德尔和谐系数。
式中W为和谐系数,K为评分者人数,N为被评对象数,Ri为被评等级总和。
例17:有5位教师对8篇作文进行等级评定,结果如下,问5位教师的评定结果是否一致?
解:由表中数据可求得
于是有:
可见,5位教师评分的和谐系数很大,评分可靠。
一般来说,W大于0。90时,可认为评分者信度较好。
3。测验的适宜信度
信度系数究竟以多大为好,没有明确的标准,要看测验的目的和类型。对于学科测验,信度系数要求达到0。90以上,智力测验要求达到0。80以上,人格测验能达到0。60以上就很不错了。