(1)求每一个变量的总和,即∑X和∑Y的值;
(2)求每一个变量的平方和,即∑X2和∑Y2;
(3)求成对变量乘积之和、每个变量和的乘积,即∑XY和∑X∑Y的值;
(4)代入公式5-3a计算r。
这个例题中的数据,如果要用公式5-1a和公式5-1b来计算积差相关系数,具体步骤为:
(1)计算每一个变量的平均数,即和的值;
(2)计算每一个变量的标准差,即sX和sY的值;
(3)求每一个变量的离均差,即x和y的值;
(4)求每个变量离均差的平方和与两个变量离均差的乘积之和,即∑x2、∑y2和∑xy的值;
(5)代入公式5-1a或公式5-1b计算r。
如果用公式5-2计算相关系数,就要计算每一个变量的标准分数与两个变量标准分数的乘积之和,即ZX、ZY和∑ZXZY。
具体计算过程如下:
表5-3用离均差、标准差和标准分数计算相关系数的步骤
将∑xy、N、sX、sY代入公式5-1a得:
将∑xy、∑x2、∑y2代入公式5-1b得:
将∑ZXZY、N代入公式5-2得:
可以发现用公式5-1a或公式5-1b计算的相关系数与用公式5-2计算的相关系数值是相同的。
如果表5-3中身高与体重的单位用市制单位尺和斤来表示,无论平均数、标准差,还是离均差乘积之和,都与测量单位用公制单位厘米及千克表示的时候明显不同,如表5-4所示。同一组被试的身高与体重,由于测量单位不同,可得到不同的协方差值。因而两个变量的一致性程度无法直接用协方差表示,若把离均差换成标准分数表示,则可得到相同的结果。表5-4中是把表5-3中身高与体重的数据单位转换成了相应的尺和斤之后的数据,该例说明了必须将每个离均差转换成标准分数的道理。
表5-4不同测量单位的数据计算相关系数比较
将∑xy、N、sX、sY代入公式5-1a得:
将∑xy、∑x2、∑y2代入公式5-1b得:
将∑ZXZY、N代入公式5-2得:
与表5-3中的数据比较,发现两种不同观测单位计算的标准分数ZX及ZY略有差异,这是由于在单位转换及计算中引进了计算误差所致。另外,也会看到,当两个变量的单位为厘米和千克时,协方差为22。85,当两个变量的单位转换为尺和斤时,协方差则为1。371。进一步验证了协方差因同一数据单位的不同而发生的差异,说明它是不稳定的。