奇书网

奇书网>托幼机构教育质量的评价基本上采用的是差距评价模式 > 二基于多元概化理论的分析16(第1页)

二基于多元概化理论的分析16(第1页)

二、基于多元概化理论的分析[16]

(一)研究目的

《量表》是在借鉴国际权威的托幼机构教育质量评价工具(如ECERS-R、CLASS等)的质量概念和框架结构的基础上,基于中国情境为测量中国托幼机构教育质量而研发的班级观察评价工具。在其被我国的学前教育研究者和实践者大规模应用之前,对该工具的测量学特性进行系统性评估是当务之急。作为整个研究项目的一部分,本研究致力于《量表》测量学特性的拓展性研究。具体说来,本研究试图在多元概化理论(MGT)框架下检验《量表》的测量信度。

(二)概念框架

多元概化理论包括了评分者间信度、内部一致性信度、组内相关等信度方法,并提供了全面统一的框架,[17]特别是针对复杂的测量情境。

1。相对决断与绝对决断

经典测验理论关注常模参照性分数的解释,也就是说,信度是关于分数相对排名的一致性,而不是实际分数的一致性。在多元概化理论的框架下,这种解释被称为“相对决断”。标准参照的分数解释是关于个体相对排名和实际得分的一致性,因此多元概化理论称其为“绝对决断”。这两种类型的概化(信度)系数相当于这两种类型的决断:相对决断概化系数ρ2和绝对决断概化系数φ[18]。我们通常对评分者间信度系数熟悉,它是一个“相对决断”的信度估计。但是在使用量表时,不仅要关注评分的相对一致性,也应该关注实际评分的一致性,因为这些分数代表托幼机构的质量差异。因此,最恰当的信度系数应该是“绝对决断”的概化系数φ。

2。制订最优化测评方案

传统的信度方法通常是进行事后检验,也就是测量信度依据事实基础进行计算。但是在制订最优化的测评方案上,多元概化理论可以充分发挥作用。多元概化理论包括两个阶段:G研究和D研究。G研究充当先行的研究用来提供信息(如不同来源的方差成分)并规划未来测量研究。在D研究中,来自G研究的信息被用于规划最佳测评方案的信息,这样可以实现最好的信度并平衡其他因素(如成本和效果)。这种便利性和预测能力在传统信度估计方法中一般无法实现。[19]

多元概化理论从单变量发展到拥有先进的多变量的方法。多元概化理论的应用适合于多维和复杂的测量情境。多元概化理论的应用提供了方法论上的优越性:在分析和评估过程中不仅考虑了方差(方差分量),而且也考虑了维度的协方差结构。所有维度的信度同时估计,而不是孤立地估计每个维度(单变量多元概化理论)。

显然,使用《量表》对托幼机构的班级教育质量进行观察评价是一个多维度的复杂测量过程。传统的信度计算方法不能同时处理多个维度。另外,传统的方法也不能处理不同测量情境的一致性信度,即不同数量的评分员嵌套在班级中——在学前教育质量评估中,这是一种常见情况。正如前面的讨论所指出的,G研究和D研究的过程为探索最佳测评方案提供了便利。基于这些考虑,多元概化理论更适合进行多维度的、涉及多个评分员的测量信度分析。[20]

(三)研究方法

1。样本

本研究在浙江省的6个地市(省内经济发展水平高、中、低各两个地市)选取了91所幼儿园。这91所幼儿园是根据目前浙江省的办园等级划分(高、中和低)、所在地(城市、县、乡镇、村)和办园性质(公办、民办)进行分层取样。最后,从91所幼儿园中随机抽取176个幼儿班级(每所幼儿园大致选取两个不同的年龄班),其中小班45个(3~4岁),中班51个(4~5岁),大班74个(5~6岁),混龄班6个(3~6岁)。

2。工具

《量表》被用来观察和测量幼儿园班级的教育质量。《量表》包含8个子量表:(1)空间与设施;(2)保育;(3)课程计划与实施;(4)集体教学;(5)游戏活动;(6)语言推理;(7)人际互动;(8)家长与教师。该量表共包含51个评价项目,177个子项目,685个等级评分指标。该量表采用利克特7点评分:1分=不适宜,3分=合格,5分=良好,7分=优秀。子量表得分和量表总分为所评分项目得分的均值。

3。数据采集过程

两位评分员(r)使用《量表》对每个样本班级(c)进行了观察评价。评分员是学前教育专业的研究生,他们在使用《量表》评估幼儿园班级教育质量上接受了严格的培训,包括4天的讲座培训和5天的实践练习。在培训结束时,这些评分员的评分者间一致性信度系数达到0。85。在班级观察测量情境中,评分员是一个“侧面”,也就是说,一个潜在的测量误差来源:评分员可能在评估一个班级到另一个班级时出现不一致现象(评分员与班级的交互效应);同一个班级因不同评分员宽松或严格程度不同也可能出现不同的评分结果(评分员效应)。一般情况下,同一班级的评价在同一时间由2名评分员独立进行。我们把托幼机构班级作为评价目标,把评分员和《量表》作为测量侧面。其中,评价《量表》为固定侧面,评分员为随机侧面。考虑到该《量表》包含了8个子量表,即从8个方面进行评价,我们把测量设计看作单侧面的多元嵌套设计,即评分员嵌套于幼儿园班级(r∶c)。

(四)研究结果

1。G研究结果

热门小说推荐

最新标签