第二节两个独立样本的非参数检验方法
一、秩和检验法
“秩和”(thesumofranks)即秩次的和或者等级之和。这一方法首先由维尔克松(Wil)提出,叫维尔克松两样本检验法,后来曼—特尼(Mann-Whitney)将其应用到两样本容量不等(n1≠n2)的情况,因而又称作曼—特尼维尔克松秩和检验(Mann-Whitney-Wilksumtest),曼—特尼U检验。
(一)秩统计量
秩统计量(rankstatistics)的统计定义是:如果将样本数据记为X1,…,Xn,相应的顺序统计量记为Xn1≤…≤Xnj,若Xi=Xnj,则称Ri=j为Xi在样本中的“秩”(rank),i=1,…,n。(R1,…,Rn)就是秩统计量,又称为“秩次统计量”(raics)。例如,一组观测值为X1=5,X2=3,X3=8,X4=6,X5=2,X6=4。由小到大排列它的顺序统计量就是X5=2,X2=3,X6=4,X1=5,X4=6,X3=8,秩统计量就为r1=4,r2=2,r3=6,r4=5,r5=1,r6=3。
在秩统计量的定义中,如果样本数据中存在“结”(tie),即两个数据值相同时,通常把原来的样本序号小的数据的秩排在前面。如果有多个数据值相同,可以进一步推广这一思想。
基于秩统计量的检验方法就称为秩检验。针对各种不同的假设,由秩统计量所产生的检验统计量(通常称为秩检验统计量)也有很多种。
(二)适用资料
秩和检验法与参数检验中独立样本的t检验相对应。由于t检验中要求“总体正态”,当这一前提不成立时就不能使用t检验,此时可以用秩和检验代替t检验。当两个独立样本都为顺序变量时,也需使用秩和法来进行差异检验。
(三)计算过程
在秩和检验中,当两个样本容量不等时,用“维尔克松)来表示曼-惠特尼维尔克松秩和检验(Mann-WhitneyWilksumtest)中两组中较大的一组的秩和。如果两个组的样本容量相等,W值用两个组中第二个组的等级来计算。
1。两个样本容量均小于10时(n1≤10,n2≤10)
具体步骤:
(1)将两个样本数据混合由小到大作等级排列(最小的为1等)。
(2)设n1<n2,将容量较小的样本(n1)中各数据的等级相加,以T表示。
(3)把T值与秩和检验表中的临界值比较,若T≤T1或T≥T2,则表明两样本差异有统计学意义;若T1<T<T2,则意味着两样本差异无统计学意义。
【例11-1】在一项关于模拟训练的实验中,以技工学校的学生为对象,对5名学生用针对某一工种的模拟器进行训练,另外让6名学生下车间直接在实习中训练,经过同样时间后对两组人进行该工种的技术操作考核,结果如下:
模拟器组:56,62,42,72,76
实习组:68,50,84,78,46,92
假设两组学生初始水平相同,问两种训练方式效果是否不同?
解:由于操作考核是否符合正态分布并不确定,且模拟器组与实习组彼此独立,因此应当用秩和法进行差异检验。