奇书网

奇书网>教育科学研究法 张其志内容原文 > 第二节 教育测量研究法的质量指标(第7页)

第二节 教育测量研究法的质量指标(第7页)

4。分析:指能将知识进行分解,找出组成的要素,并分析其相互关系及组成原理。这一目标要求学生达到:能对事物进行具体分析、图示、叙述理由、举例说明、区别、指明、分开、再分,认出在推理上的逻辑错误;区别真正事实与推理,判断事实材料的相关性。例如,划分文章段落,写出段意及找出中心思想;指出一个实验中哪些是自变量、哪些是因变量等。

5。综合:与分析相反。指把各个元素或部分组成新的整体。理解、应用和分析虽然也有将部分组合与重建的意思,但没有综合这样完整,综合更具独创性。这一目标要求学生能做到:联合、组成、创造、计划、归纳、重建、重新安排、总结等。如写出一份结构完整的论文提纲;提出一份系统的实验计划或方案等。

6。评价:指根据一定的标准对事物给予价值的判断。这一目标要求学生能做到:比较分析、评价效果、分辨好坏、指出价值。如判断文艺作品成败之处;判断事件的真伪;判断一个调查的科学价值;判断某一实验结果的价值;判断解决问题的过程与方法的成败等。

布卢姆上述六类目标是有层次、有顺序的,识记是最低层次,是最基本的要求。其余依次是理解、应用、分析、综合、评价。评价为认知领域的最高层次,是前面五种目标的综合并增加了价值标准。这六类目标,由简单到复杂,由低级到高级依次排列,组成层次结构。

资料来源:胡中锋。教育测量与评价[M]。广州:广东高等教育出版社,2006:54~55。

二是统计分析方法。也有人认为内容效度可以采用定量分析方法来描述。比如,克伦巴赫提出可以从同一教学内容范围的总体中抽取两套独立的试题,用这两套试题分别对相同的被试进行测验,两次测验的相关系数,可以用来估计内容效度。若相关较高,可以认为内容效度亦高;若相关较低,则两个测验至少有一个内容效度低。

显然,这些方法是存在争议的。前一种方法实际上是计算信度的复本法,即使两套测验的相关系数高,也只能说明测验的信度高,而不能说明测验内容的取样是适当的,能代表想要测量的全部内容,因为信度高未必效度就高。后一种方法也存在很大的问题,即使后期测验成绩好,也不能说明这个测验的效度高,因为同样不能说明测验内容的取样是适当的,能代表想要测量的全部内容。

(2)构想效度。构想效度是指测验能测量到心理学理论中的某种结构或特征的程度。这里的“心理学理论中的某种结构或特征”,是指心理学理论所涉及的抽象而属假设性的概念、特性或变量,如智力、性格、气质、兴趣、态度、动机、焦虑、创造力等。

确定构想效度,首先要从某一理论出发,提出关于某一心理特质的假设,然后设计和编制测验并进行施测,最后对测验的结果采用相关或因素分析等方法进行分析,验证与理论假设的相符程度。[16]例如,比奈应用逻辑分析方法研究智力行为的心理结构,认为智力不单纯是智力行为的很多不同方面的总和,而是一种连锁性的过程,其中包括判断、解决问题和推理能力。如果根据这种理论编制的智力测验,确实能测量出被试的判断、理解和推理能力,就可以认为所编制的测验具有结构效度。又比如,我们假想人的创造力可以分解为人的思维流畅性、灵活性和创造性三大特性,并根据这三大特性编制测验,若有足够的证据来证明该测验确实可以测到这些特性,则认为该测验是个结构效度较高的创造力测验。

确定构想效度的方法主要有以下几种[17]。

一是测验内法:通过研究测验的内部结构来分析测验的构想效度。主要包括确定测验的内容效度和考察测验的同质信度等。如果内容效度高,说明测验的内容能测量到我们想要测量的心理学理论中的某种结构或特征;同质信度高,说明测验内部所有项目间是一致的。

二是测验间法:通过分析几个测验之间的关系来分析测验的构想效度。测验间法有多种,如相容效度、区分效度、因素分析等。相容效度是把自己所编制的测验的施测结果,与另一个性质相同且被公认具有较高结构效度的测验结果比较。例如,把新编的智力测验的结果与斯坦福—比奈智力量表的测验结果相比较,如果两个测验结果的相关系数高,说明新编制测验具有较高的结构效度;区分效度是指新编制一个测验,使之与另一个已知测验无关或相反。然后求两测验的相关系数,相关系数低则说明新编制测验与已知测验所测量的特质不同,效度高;相关系数高,则说明新编制测验与已知测验相容,效度低;因素效度是通过对一组测验进行因素分析,找到影响测验分数的共同因素,每个测验在共同因素上的负荷量即每个测验与共同因素的相关系数高,效度就高。

四是实验操作法:通过控制某些实验条件,观察其对测验分数的影响,也可以获得构想效度的信息。例如,在进行一个关系重大的考试前,对被试施测焦虑测验,如果靠前的焦虑分数比平时显著提高,说明该焦虑测验有较高的构想效度。

(3)效标效度。效标指的是衡量测验有效性的外在标准,通常是指我们所要预测的行为。如果一个测验能够预测将来实际发生的事情,就是一个好的测验。例如,用高考成绩来预测被试在大学的学习成绩,如果预测准确性高,就说明高考是一个好的测验。这里,被预测的行为是衡量测验是否有效的标准,简称效标。所谓效标效度,是指测验分数与效标之间的一致性程度,即测验对我们感兴趣的行为能够预测到的程度。因为效标效度需要有实际证据,所以又叫实证效度。

以什么作为效标,要视测验的目的而转移。如果测验(如高三的模拟考试)的目的是预测学生的高考成绩,那么高考成绩即为效标;而高考的目的是预测学生入大学后的学习情况,这时,学生在大学的学习成绩又成了高考成绩的效标。所以,在估计效标效度时选择什么作为效标,是一个十分重要的问题。

效标效度分为两种:一种是效标资料与本测验分数可以同时获得,称为同时效度或并存效度。同时效度的高低用效标与测验分数的相关系数来估计。例如,对初中二年级学生施行教师自编测验,考查其学习成绩,接着再用公认的对测量初二学生成绩具有较高效度的标准化测验施测于相同的学生,然后计算两次测验成绩的相关系数。如果相关系数高,说明自编测验的结果与效标一致,即自编测验有较高的同时效度,相反,同时效度低。

另一种是效标在本测验之后相当时间获得的,称为预测效度。预测效度是指测验结果对未来的行为或测验成绩(即效标)能够准确预测的程度。预测效度的高低也是用效标与测验分数的相关系数来估计。例如,模拟考试成绩可用高考分数做效标,如果两者相关系数高,说明模拟考试的预测效度高。

效标效度的估计方法很多,如相关法、分组法、预期表法、命中率法等。这里我们只介绍应用较广泛的相关法。

①积差相关法。当测验分数与效标都是连续变量时,可采用积差相关法。

例18:10名被试语文模拟考试与升学考试的成绩如下,求模拟考试的预测效度。

解:根据积差相关系数的计算方法,可求得

积差相关系数很大,因此模拟考试有很高的预测效度。

②等级相关法。当测验分数为连续变量,效标为等级变量时,把连续变量转化为等级变量,求斯皮尔曼等级相关系数。公式为:

(续表)

解:根据等级相关系数的计算方法,可求得:

等级相关系数很大,因此学科测验有很高的同时效度。

3。提高效度的措施[18]

(1)精心编制测验。首先,测验内容要符合测验目的的要求;其次,项目表述必须清楚、简明,所用字、词、句能被学生理解,内容应能引起被试的兴趣,排列由易到难,但前面的题目不应暗示后面的答案;再次,项目难度要适宜,有足够的区分度;最后,试卷印制清楚,无错误和遗漏,并力求精美。

(2)妥善组织测验。严格按照测验程序进行,不做超出规定的解释,掌握好时间。评分时务必遵循评分标准,仔细登记,避免错误。另外,两次测验间隔的时间也影响效度,所以,间隔长短,一定要按测验目的合理安排。

(3)适当增加测验的长度。增加测验的长度可以增大测验内容对全部内容的代表性,也就越能够测量到所要测量的东西。

(4)正确处理效度和信度的关系。信度是效度的必要条件,但不是充要条件。信度高的测验效度不一定高,但效度高的测验信度一定也高。

热门小说推荐

神级反派
野山黑猪神级反派
...
青闺令
江上渔青闺令
...

最新标签