奇书网

奇书网>计算机化自适应测验理论与方法 > 第二节 CDCAT中常用认知诊断模型(第2页)

第二节 CDCAT中常用认知诊断模型(第2页)

这里的难度参数π*i是掌握了第i题所考查的全部属性的被试答对这个题目的概率。π*i较大的题目,说明它所考查的属性能有效解释被试对该题的反应。区分度参数r*ik指,被试未掌握αk却答对了第i题的概率与掌握了αk并答对该题的概率之比。在一道题中,某个属性的区分度参数越小,就说明该属性在该题目中越重要。

下面用一个例子说明RRUM模型中被试正确作答概率的计算。设第i个题目考了两个属性,π*i=0。8,r*i1=0。2,r*i2=0。3,那么根据公式(6。2。3)可以计算出:

若被试j对这2个属性都没有掌握,则答对该题的概率是

Pji=π*i·r*i1·r*i2=0。8×0。2×0。3=0。048。

若被试j只掌握了属性1,则答对该题的概率是

Pji=π*i·r*i2=0。8×0。3=0。24。

若被试j只掌握了属性2,则答对该题的概率是

Pji=π*i·r*i1=0。8×0。2=0。16。

若被试j对这2个属性都掌握了,则答对该题的概率是:Pji=π*i=0。8。

为了研究方便,令αl(l=1,2,…,L且L=2K)为被试j可能拥有的KS。于是,在RRUM模型下,KS为αl的被试,答对第i题的概率是

这样,全体j个被试在第i题上的正确作答概率就被归为L种情况,在实际计算中可以大大减少运算量。

&emplin(2007)用MCMC算法实现了对RRUM模型的参数估计。Feng,Habing和Huebner(2014)则提出了相对简便一些的EM算法,并对ECPE测验的数据进行了分析。

六、DINA模型

根据心理计量学手册(DiBello,Roussos,&Stout,2007),决定性输入噪音“与”门模型(Deterministioisy‘And’Gate,DINA)的历史可以追溯到Macready和Dayton(1977)的思想。Haertel(1984,1989)正式提出了这个模型,将其命名为限制性潜在类别模型(Restrit),而此后的Jusma(2001)将它的名字改为DINA模型。该模型因为仅涉及“失误”和“猜测”两参数,真正实现了对认知诊断模型的简化。

其中,ηji是一个二分变量,表示被试j是否掌握了第i题所考查的全部属性。gi表示第i题的猜测参数(GuessParameter),指的是“未掌握该题所测全部属性”的被试答对这道题的概率。Maris(1999)对gi作了另一种解释:被试使用其他心理资源(MentalResources)而答对题目的概率。si表示第i题的失误参数(SlipParameter),指的是“掌握了该题所测全部属性”的被试答错这道题的概率。

在DINA模型中,所有被试答对第i题的概率只有两种情况:一种是“掌握了该题所测全部属性”的被试,他们答对该题的概率是1-si;另一种是“未掌握该题所测全部属性”的被试,他们答对该题的概率是gi。因此,DINA模型不允许属性间有补偿作用,故属于非补偿模型。而前文所提到的规则空间模型、统一模型、融合模型和下文即将提到的RRUM模型都是允许属性间有补偿作用的模型。

DINA模型是一个比较简单、直观的模型,较容易估计和解释,故当前在国内外使用最多。但DINA模型存在的局限性也正和它的优点一样鲜明:它的每个题目只把被试笼统地分为“掌握了该题所测全部属性”和“未掌握该题所测全部属性”两大类,并假设所有“未掌握该题所测全部属性”的被试答对该题的概率相等,但事实上这个假设有些牵强。

七、高阶DINA模型

&las(2004)认为在认知诊断中,作为知识状态的属性间可能存在相关,这跟心理学里一般智力(Geelligence)或一般能力(GeneralAbility)的概念相对应。在传统DINA模型基础之上,他们又假设:认知属性之间相互独立,并从属于一个更高阶的能力θ;在给定认知属性的前提下,作答反应之间相互独立。由此,他们提出了高阶DINA模型(HO-DINA),并提出了具体的MCMC算法。

在HO-DINA模型中,α与θ之间存在如下关系:

其中,λ0k是属性k的截距,而λk是属性k在能力上的负荷。在属性较多时,HO-DINA模型较为简洁。

值得注意的是,HO-DINA模型里的θ,与IRT模型里的θ在概念上不是一回事。IRT模型里的θ是指整体能力,而HO-DINA模型里的θ是指整体能力中去掉了特殊能力之后而留下来的“一般能力”。不过也有研究表明,二者之间有较高的相关。

涂冬波、蔡艳、戴海琦和丁树良(2011)探讨了HO-DINA模型参数估计的实现及模型性能,他们发现:①对项目参数、属性参数和被试参数估计返真性较好、稳健性较强,HO-DINA模型具有较高的判断率,MCMC算法可行;②诊断的属性个数越多,诊断的模式正确率越低,建议实际使用该模型时,诊断的属性个数不宜达到7个;③用于诊断的项目数越多,诊断的模式正确率越高,在实际工作中,若要保证有80%以上的模式判准率,则4个属性的至少需要20题,5个、6个和7个属性的至少需要40题,8个属性的至少需60题。实际运用者应根据实际情况考虑适当的项目数及属性数。随后,赵顶位(2012)比较了不同属性结构和项目参数条件下HO-DINA模型的性能。结果发现,当猜测率g和失误率s都低的情况下,HO-DINA的属性判准率和模式判准率都较高;HO-DINA模型对无结构型和分支型的属性结构的判准率较高,对线型和收敛型的判准率较低。

HO-DINA模型已经应用于实际应用研究。如涂冬波(2009)基于HO-DINA模型开发了小学儿童数学问题解决认知诊断CAT系统,并实现了对小学儿童数学问题解决的认知诊断。

至此,一些重要的认知诊断模型已经介绍完毕。在这些模型中,没有哪个模型是全面优于其他模型的;在实际工作中,应该根据具体测验情境来选择在这种情境下最合适的模型。

热门小说推荐

最新标签