奇书网

奇书网>教育研究方法有哪些分类 > 四连续数据的分析(第1页)

四连续数据的分析(第1页)

四、连续数据的分析

连续数据包含等距数据和等比数据。教育科学研究中收集到的连续数据多为能力分数、心理素质及其他诸如年龄、收入、时间等数据。连续数据的统计分析方法比离散数据丰富很多,但对数据的分布形态的要求也比较高。在教育科学研究常用的统计分析方法中,大多要求数据的分布为正态分布,当然也会涉及其他的条件,这些都是在选择统计分析方法时需要考虑的。

(一)描述分析

连续型数据的描述分析主要是对数据分布的基本情况进行统计分析,展示数据的基本特征,常用的统计指标有集中量、离散量、百分位分数、分布形态等。下面以关于学生情绪智力调查结果的数据为例进行说明。

1。分布形态的判断

分布形态是决定进一步统计分析的基础,在对一个数据进行分析之前,需要基本了解数据的分布形态。数据的正态分布判断方法有两类。一类是通过绘制数据实际分布与理论正态分布的拟合图,根据拟合图的形状进行直观的判断。另一类则是统计数据分布的偏态系数,根据偏态系数值进行判断。由于偏态系数的统计包含在集中量、离散量分析过程中,将放在该过程介绍中进行说明。

正态分布P-P图的SPSS操作过程如下:

选择AiveStatistics→P-PPlots,打开P-P图绘制的对话框,将情绪智力变量放入右侧“Variables”框,如图12-9所示。研究者的目的是检验被调查者的情绪智力分布是否为正态分布,无须再做任何其他的操作;如果研究的目的是想检验变量是否为其他分布,如二项分布、卡方分布等,则可以在右上方“TestDistribution”的下拉菜单中进行选择。SPSS程序默认的是正态分布(Normal)检验,选择了要检验的变量后,直接点击“OK”键,可以得到图12-10所示的P-P图。图12-10中的圆圈代表的是样本数据中每一个观测值,黑色的对角线由满足正态分布的理论数据构成,如果观测数据基本分布在该条对角线附近,则认为数据满足正态分布。图12-10显示情绪智力的分布基本接近正态分布。

图12-9P-P图绘制对话框

图12-10P-P图示例

2。基于Frequencies过程的分析

前面介绍过,Frequencies过程是离散数据频次分析的主要实现渠道,除了基本的频次分析外,Frequencies过程还可以分析一个数据次数分布的基本情况,包括平均数、标准差、百分位分数等基本统计量,以及次数分布形态的统计量指标的分析。

Frequencies过程对连续变量进行描述统计分析的SPSS操作如下:

选择AiveStatistics→Frequencies,打开Frequencies的对话框,将情绪智力变量放入右侧“Variable(s)”框,点击右侧“Statistics”选项(可参考图12-4),打开如图12-11所示对话框。

图12-11Frequeistics功能对话框

图12-11所示的Statistics对话框包含4个统计模块。PertileValues模块主要用于计算百分位数,各复选框功能如下。Quartiles:输出第一、第二、第三四分位数;tsfroups:在□中填入任意整数,可以输出相应的各等分组的百分位数;Pertile(s):在右侧方框中输入任意0~100的数字,并添加,可以输出相对应的百分位数,如输入33。3,则会输出P33。3对应的分数。tralTendency模块为集中量的分析模块。该模块的复选框由上到下可依次输出变量的平均数(Mean)、中位数(Median)、众数(Mode)及总和(Sum)。Dispersion模块为离散量的分析模块。该模块的复选框左侧由上到下可依次输出变量的标准差(Std。deviation)、方差(Variange);右侧由上到下可依次输出变量的最小值(Minimum)、最大值(Maximum)和标准误(S。E。Mean)。Distribution模块为分布形态分析模块。该模块的两个复选框分别提供变量的偏态分析和峰态分析。

一般情况下,研究者会根据研究的需要在上述Frequeistics模块中选择相应的统计模块,通常用得比较多的是百分位数模块,因为其余模块的统计功能可由接下来要介绍的Descriptives模块实现,所以这里仅选择百分倍数模块第一个复选框进行结果输出的解释和说明。

勾选图12-11中PertileValues下的Quartiles复选框,点击左下方的“ue”键返回Frequencies的主对话框,点击“OK”键可得到表12-7的输出结果:行1和行2报告样本量的情况,有效样本量为120个,缺失数据为0个;行3至行5分别报告了三个四分位数Q1、Q2和Q3。由表12-7中数据可知,Q1即P25=104。2500,说明在该调查样本中有25%的被调查者的情绪智力低于104。2500;同理,有50%的被调查者的情绪智力低于114。5000,75%的被调查者的情绪智力低于122。7560。

表12-7四分位数输出结果

3。基于Descriptives过程的分析

&ives过程是对连续数据进行描述分析的最常用过程,其操作过程如下:

选择AiveStatistics→Descriptives,打开描述分析的对话框,将情绪智力变量放入右侧“Variable(s)”框,如图12-12所示。Descriptives过程的默认输出的统计量只有样本量、最小值、最大值、平均数和标准差,如果希望得到其他描述统计量,点击右上方的“Options”框,打开如图12-13所示的对话框,该对话框所包含的模块与前述Frequeistics复选框的功能模块基本一致。勾选“Options”对话框中的“Distribution”选项中“Skewness”复选框,点击“ue”键返回主对话框,点击“OK”键可得到表12-8的输出结果。

图12-12Descriptives过程对话框

表12-8中,行2的第2列到第8列分别是样本量、最小值、最大值、平均数、标准差、偏态系数值、偏态系数标准误这些常用的描述统计量。根据偏态系数值判断数据分布形态的标准是:偏态系数值等于0为正态分布;大于0为正偏态分布;小于0为负偏态分布。本例中情绪智力分布的偏态系数值为-0。175,小于0,属于负偏态分布,但由于该值偏离0的距离较小,可以认为它是近似正态分布。另外需要注意的是,SPSS输出的平均数与标准差的小数点后位数比较多,且不一样多。我们根据输出结果整理论文中的统计表时需要将其进行简化和统一,一般情况下取小数点后两位有效数字。

图12-13Descriptives过程Options操作对话框

表12-8Descriptives过程结果输出表

(二)推断分析

推断分析在教育科学研究中主要是以差异检验为主,例如,在教育调查或测验中想要了解学生的成绩是否存在性别差异、学校差异,学生的心理素质是否存在年级差异、家庭背景差异等;或者在教育实验中想要考察实验组与对照组的差异、训练前后的差异等。这种差异研究实际上是考察两个变量之间的关系,如成绩与性别之间的关系,其中成绩是连续变量,性别是类别变量,或者叫分组变量,也可以理解为考察连续变量在类别变量的不同类别上是否存在差异。常用的统计分析方法有t检验和方差分析。

1。t检验

t检验适用于分组变量的类别只有两类情况,如属于个体变量的性别、是否独生子女、结婚与否、升学的成功与失败等,以及在实验研究中对自变量的分类,即实验处理组与对照组、实验处理前与处理后等。根据分类变量两个类别之间的关系,又可以将t检验分为独立样本t检验与相关样本t检验。独立样本指类别变量的两个类别之间是相互独立的,即分别是由相互独立的被试样本构成的,如男性被试与女性被试、实验组被试与对照组被试;相关样本指类别变量的两个类别之间是相互关联的,即同一批被试参与了两个类别下的处理,或者是完全匹配的两组被试参与两个类别下的处理,如前后测研究中只有一组被试分别接受前测和后测、同一批学生的两次测验、同卵双生子匹配组分别接受不同的实验处理等。

这里以情绪智力的性别差异检验为例介绍独立样本t检验的SPSS操作:

热门小说推荐

最新标签