奇书网

奇书网>教育科学研究法 张其志内容原文 > 第二节 教育测量研究法的质量指标(第6页)

第二节 教育测量研究法的质量指标(第6页)

4。提高测验信度的措施[10]

(1)适当增加测验项目的数量。一般而言,测验越长,信度值越高。原因在于:第一,测验加长,就可能改进项目取样的代表性,从而更好地反映被试的真实水平;第二,测验的项目越多,在每个项目上的随机误差就可以互相抵消。

(2)测验的难度要适中。过难或过易都会使个体间得分差异减小,降低信度。只有当测验难度水平使测验分布范围最大时,测验的信度才会最高,通常这个难度水平为0。50。

(3)测验要有良好的区分度[11]。测验的信度与项目的区分度有密切的关系,整个测验中各项目的区分度的平均值越大,测验的信度就越高。表6-5说明了区分度与信度的关系。

表6-5区分度与信度的关系

(4)测验的时间要充分。测验的时间限制也会影响信度的高低,如果安排的时间不够,考生不能从容回答所有问题,也就不能真实地反映被试的实际水平。因此,测验的时间要充分。当然,这里不是说,要保证所有被试都能做完试题,而是以大多数被试为标准来设定考试的时间。

(5)测验的程序应统一。测验程序直接关系到信度的高低。测验的程序统一包括试卷统一、测验开始时的指导语、回答问题的方式、分发及收回试卷的办法、测验时间的掌握等。

(6)评分要尽量做到客观化、减少评分误差。评分是测验的一个重要环节,如果这一关把握不好,测验就等于前功尽弃了。信度系数是根据实得分数算出的,如果评分不准确,信度也就不准了。因此,要求评分要尽量做到客观,减少评分误差。

(二)效度

一个好的测验,信度高是必要条件,但并非充要条件。不可信的测验肯定没有效,但可信的测验未必有效,而有效的测验必定可信,因此,对教育测量而言,效度显得更为重要。

1。效度的概念

效度是指测量结果的准确性和有效性的程度,即一个测验对所要测量的目标准确测量的程度。通俗地说,测验能否测量到我们所要测量的东西的程度就是效度。

我们可以从以下几方面来理解效度[12]。

一是测量的效度始终是对一定的测量目的而言的。任何测量都有某种特定的目的和功能,判断效度的高低,就是判断测验达到目的的程度。如果能正确、真实地测量出所想测量的东西,那么效度就是高的;反之,则是低的。例如,一个智力测验,如果实际测量的不是智力的高低而是知识的多少,那么此测验的效度就低。即使某些公认效度较高的测量,也不能要求它在不同目的的测验中保持相同的效度。

二是测量的效度也是对测量的结果而言的。一种测量工具只有经过实际测量,才能根据测量的结果判断它的效度。所以,也可以把效度理解为测量的结果正确反映所欲测量的特性或功能的程度。

三是一种测量的效度只是高或低的问题。例如,要测量学生的数学能力,我们不会用语文题目来作为测题,总是会用一些数学题。因此,学生的数学能力或多或少会反映出来一些,不会毫无反映。换言之,测验结果总有一定的效度,只是效度高低不同罢了。

四是在教育测量中,效度问题比在其他领域的测量更为重要。首先,教育测量的对象大多是精神现象,只能通过对其具有可测性的外部表现(如言语和动作等)的测量,以间接认识其心理活动、心理特征或知识水平等;其次,学生的心理活动、心理特征与其外部表现之间,一般仅具有相关关系而无函数关系,外部行为并不能准确无误地反映某种心理状态。此外,教育测量的对象不是物而是具有主观能动性的人。人能有意识地调节自己的外部行为,掩盖自己的内心活动,这就增加了认识其精神现象的难度。所以,教育测量必须考虑是否测量到了所要测量的东西,在多大程度上测量到了这些东西。也就是说,必须考虑测量的效度问题。

2。效度的类型和估计方法

效度的类型目前被广泛采用的是弗兰士(J。W。French)和米希尔(B。Michbel)提出的分类,他们将效度分为内容效度、构想效度和效标效度三种。

(1)内容效度。内容效度是指测验内容取样的适当性,也就是测验内容对想要测量的全部内容的代表性。以考查学习成绩为目的的测验来说,课程标准所规定的全部教材内容是学生必须掌握的。但一份测验不可能测量全部教材内容,这就有测验内容是否有代表性的问题。事实上,要用有限的几个或几十个测题代表全部教材内容是比较困难的,所以测验题目的代表性有大有小,测验的内容效度也就有高有低。

在编制测验时,内容效度是一个相当复杂和不易解决的问题。以成就测验为例,固然要求测验题目能代表学习过的全部内容,但仅仅在形式上做到这一点还不能保证足够的内容效度,因为学习成绩的高低要从学习内容的巩固程度、理解程度和应用能力等行为反应去考查,如果测验题目大多是只需死记教材内容就可以回答的问题,那么,对全面测量学生的成绩这一目的来说,内容效度仍然不够高,也就是说,还没有完全测量到所想测量的特性。[13]

因此,一个测验要具备较好的内容效度必须满足两个条件:①要确定好内容范围,并使测验的全部项目均在此范围内。②测验项目是已界定的内容范围的代表性样本。

估计内容效度可采用下面两种方法。

一是逻辑分析的方法。根据课程标准的要求,勾画出学生应掌握的知识内容的范围和深度,提出应形成的技能名称等,然后以逻辑分析的方法估计测验在多大程度上代表了所要测量的全部内容,在多大程度上能够测量出所要测量的特性和功能。逻辑分析的方法实质上是对测验内容进行逻辑推理的评判方法,是一种定性分析方法。

如果是借用现成的(别人编制好的)测验,那么,在分析内容效度时,首先要考虑测验编制者是根据什么教材来编制的,是用来测量什么内容的。如果二者一致,那么,此测验可期望获得较高的内容效度。反之,如果测验内容与被试学习的教材不一致,例如,测验是根据高中教材乙种本编制的,我们却用来测验学习高中甲种本教材的被试。显然这个测验就不能很好地代表甲种本的教材内容,所以测验的内容效度就低。然后再考虑测验在多大程度上能代表教材内容,在多大程度上能够测量出所要测量的特性和功能。[14]

用逻辑分析的方法估计内容效度时,需要制订两个表:一个是测验的双向细目表,分别列出各单元教材内容在测验中应占的百分比和所要求的各种行为反应(目标)在全部行为反应中应占的百分比。如表6-6所示。

表6-6××课程测验双向细目表

(续表)

第二个表是测验试题分类表,根据各单元教材内容列出试题,并注明各单元教材内容在测验中占的百分比和各类题目所占的百分比。如表6-7所示。

表6-7××课程测验试题分类表

最后,对照比较这两个表,根据各部分相符合的程度,判断内容效度。

知识链接:布卢姆的教育目标分类法

布卢姆于1948年开始致力于教育目标的分类研究,1956年公布了认知领域的目标分类体系,他把教育目标分为认知领域、情感领域和动作技能领域,再把认知领域分为识记、理解、应用、分析、综合和评价等六类。布卢姆的认知目标分类法一直被认为是测验目标分类的依据,我国目前许多测验的命题,均以布卢姆的目标分类法为基础来确定测验的目标。

1。识记:主要指记忆知识,对学过的知识和有关材料的识别和再现。这一目标要求学生做到:确认、定义、配对、指出名称、选择、默写、背诵、描述、标明、列举、说明等。

2。理解:主要是对知识的掌握,能抓住事物的实质,把握材料的意义和中心思想。这一目标要求学生能做到:了解事实与原理,解释文字资料,解释图表,转译文字资料为另一种资料形式,验证方法与过程,对所学的内容进行概述,举例说明所学过的问题等。

3。应用:指把所学过的知识应用于新情境。这一目标要求学生做到:表现、列举、计算、设计、示范、运用、操作、解答实际问题等。如应用几何知识测量土地面积;应用意识对物质有能动的反作用原理去论述精神文明建设的重大意义;运用所学过的知识去解答实际问题;制作图表;设计模型;正确使用表现手法与过程等。

热门小说推荐

最新标签