测验长度:
测验期望时间:
互斥项目:
变量范围:
其中,θ1,θ2,…,θk是能力量尺上k个有代表性的值,xi表示项目i是否包含在测验里,i是题库中题目的总数,Vcr是属于内容R的题目集合,Ve是属于互斥项目集合(Luecht,1998;Luegester,1998;Luecht,Brumfield&Breithaupt,2006)。
(二)启发式算法
启发式算法(HeuristicMethods)将测验组卷分解为一系列局部最优化问题,每次选择一个题目添加到测验当中,直到满足测验要求的题目数量为止。这种启发式也属于贪婪启发式(GreedyHeuristiderLinden,1998)。判别函数通常是基于“中心”准则(如TIF),且受到各种“次要”条件约束(如内容范围)。因为启发式算法是顺序的选择题目,测验组卷早期有更多满足测验要求的题目,随着组卷过程的进行,题库大小逐渐缩减,测验组卷后期满足要求的题目数量也随之减少。因此,启发式算法必须包含其他策略来平衡组卷的质量。
策略一,为每一个测验迭代选择题目来代替立即组装整个测验。测验接收题目的顺序可能是螺旋式的、随机的,或者根据当前TIF(或其他指标)目标的误差范围决定的。策略二,这种策略允许初始组卷的时候可以“贪婪”,但是随后进行一个“交换”步骤在模块之间进行题目交换来获得更小的模块间差异。
基于启发式算法的ATA可以包含多方面的非统计约束。例如,加权离差模型(WeightedDeviationModel,WDM)和标准化加权绝对离差启发式(edAbsoluteDeviatioiWADH),可将所有的约束作为目标,并且将目标(标准化)离差的加权总和作为标准(Swanson&Stog1993;Luecht,1998;Zheng,Wason&g,2014)。
WDM方法,通过以下公式来实现最小化离差的加权总和:
其中,dUj是测验组卷和约束j上限之间的差异,dLj是测验组卷和约束j下限之间的差异,wj是对约束j的加权。
NWADH方法,也使用约束目标的加权离差,但是它将每一个约束的离差标准化,因此它们都在一个共同的量尺上。用ui表示与题目i相关属性的值(如项目信息量),用T表示相应的目标。当为测验选择第k个题目时,剩余题库中每一个待选题目T的局部标准化绝对离差计算如下:
其中Rk-1是测验已选择(k-1)个题目后题库中剩余题目的集合。离差dt计算了待选题目对目标T的贡献和每个剩余题目对达到目标平均贡献之间的绝对差异。et表示标准化绝对离差,其值最小的题目将被选中加入测验。
在对线性测验进行组卷的时候,满足多重约束以及算法的复杂性和灵活性之间存在一个权衡。0-1规划算法不能确保产生一个结果,但是能够获得的结果都严格满足所有约束。启发式算法通常可以用较少的计算强度产生一个结果,但是不确保所有的约束都可以满足。在实践中,通常有一些非统计特性(如内容分类)与题目难度有关,这使得每一个路径都满足所有规定的约束变得更加困难(Zheng,Wason&g,2014)。在这种情况下,有必要放宽部分路径的某些约束条件。启发式算法提供了这种灵活性,在约束条件不可全部满足的情况下产生较为合适的结果。
思考题:
1。CAT有哪些不足?
2。与CAT比,MST有哪些优势与不足?
3。MST设计包括哪些环节?
4。MST的路由规则有哪些?其特点如何?
5。MST自动化组卷有哪些算法?各有什么特点?