学科分类
/ 1
11 个结果
  • 简介:分类一致性是标准参照测验信度研究的重要内容,而在国内的各种资格认证测验和水平考试中却鲜见应用和报告。本文尝试利用分半方法估计分类一致性信度指标。结果表明,在分类一致性信度指标的关键特征上,分半法估计结果与两次施测或同质复本方法的结果是一致的。此种方法对于大规模资格认证测验来说是可行的,即容易解释和理解,更便于实际操作。

  • 标签: 标准参照测验 一致性信度 资格认证 分类 估计 水平考试
  • 简介:本研究运用多元概化理论对HSK高等考试客观卷的信度、试卷结构、测验总分的合成、试题预测方式的改进等问题进行探讨,结果表明:(1)HSK高等考试客观卷的总体及各部分信度都较好,且测验总分的合成是合理的;(2)测验各部分内容对全域总分方差分量的贡献比例与预设的赋分比例基本一致,试卷结构较为合理;(3)在适当减少各部分题量的情况下测验的信度仍较高,今后可以考虑在正式考试中进行试题预测。

  • 标签: HSK高等考试 多元概化理论 信度
  • 简介:在心理测量理论中,主观题的评分质量是一个值得研究的课题。本文分别介绍了三大测量理论(经典测量理论、概化理论、项目反应理论)对于主观题评分质量的估计方法,并对其优劣进行了比较。概化理论和项目反应理论在评价主观题评分质量上具有较明显的优势,如何结合使用三大理论,为主观题评分质量获取更多有价值的信息是值得深入探讨的问题。

  • 标签: 主观题评分质量 经典测量理论 概化理论 项目反应理论
  • 简介:本文在文献[1]提出Logistic模型参数近似估计的基础上,根据被试能力参数的不同情况得到两参数和三参数模型的参数估计新方法,新方法的特点是计算简单而不失精度,蒙特卡洛模拟表明新方法是一种快速而有效的算法。

  • 标签: 项目反应理论 LOGISTIC模型 参数估计 蒙特卡洛模拟
  • 简介:目的:与经典测量理论相比,项目反应理论具有更多的优势,但由于项目反应理论模型的复杂性,进行参数估计时往往需要较大的被试样本;人工神经网络的出现为小样本被试估计项目反应理论的能力参数和项目参数提供了可能,文章的目的是通过神经网络的蒙特卡罗模拟研究寻找更精确的参数估计方法。方法:以项目反应理论的两参数模型为例,以MAB和RMSE为比较指标,通过模拟数据比较经典测量理论的通过率、点二列相关系数、平均得分作为神经网络的输入值与以经过转换的数值(IRT参数估计的初值)作为神经网络的输入值训练网络结果的差异,比较不同条件下MAB指标和RMSE指标的差异。结果:以通过率估计项目参数b与以bj=zj/rbj估计项目参数b存在差异;以点二列相关系数估计项目参数a与以aj=rbj/√1-r^2bj估计项目参数a存在差异;以平均得分估计能力参数θ与以ln[x/(m-x)]估计能力参数θ存在差异。结论:对于两参数项目反应模型,以通过率估计项目参数b比以bj=zj/rbj估计项目参数b误差更小,而以点二列相关系数估计项目参数a比以aj=rbj/√1-r^2bj估计项目参数a误差更大,以平均得分估计能力参数θ比以ln[x/(m-x)]估计能力参数θ误差更大。

  • 标签: 神经网络 项目反应理论 参数估计 蒙特卡罗
  • 简介:摘要在小学数学的计算教学中,我们要根据不同计算自身的特点、小学生不同学习阶段的思维发展水平以及不同个体知识积累和数学活动经验的差异去引导学生掌握计算方法,并且要努力帮助学生达到更高的一个数学层次,适时地、灵活地引导学生去发现计算中内在的规律,使学生在经历和体验这些规律的发现过程中,逐步建立起数学思想和数学方法,感受独特的数学思维方式,感受数学的内在美。

  • 标签: 数学课堂 计算与估计
  • 简介:主观性考试的评分信度问题一直是语言测试研究体系中的重要组成部分.据以往研究.评分员如何把握评分标准对评分信度具有至关重要的作用,鉴于此,本研究从2009年4月HSK(高等)写作测试评分的48组评分员中随机抽取了两组(每组中一老一新两名评分员),运用概化理论对两组的评分信度进行了检验,结果表明两组的测验信度较高;通过比较评分员问评分数据的描述性统计结果以及调查问卷,大致了解到新老评分员在对评分标准把握中的不同,这些因素也导致他们在评分过程中产生评分差异。

  • 标签: 写作测试 信度 概化理论
  • 简介:在大规模教育评估中,矩阵取样设计已为人们普遍接受并实践应用.而如何向公众报告评估结果逐渐成为矩阵取样设计研究中的重要问题。群体领域分数是管理者和公众最容易理解和接受的分数报告工具之一。本文尝试引入传统的OBS方法,以及基于IRT的EM方法和EAP方法,比较其在矩阵取样设计下对群体领域分数估计的精确性和稳健性。结果表明,EM方法和OBS方法对群体领域分数的估计精确性和稳健性最好。

  • 标签: 群体领域分数 矩阵取样 精确性 稳健性
  • 简介:该文介绍并比较了计算机化自适应测验(computerizedadaptivetesting,CAT)环境中的MLE、WLE、MAP、EAP等几种常用能力估计方法的发展演变以及各自的原理与特性,并对这些能力估计方法的发展脉络及其特性做了简要总结与评价,最后展望了未来CAT中能力估计的发展趋势。

  • 标签: 计算机化自适应测验 项目反应理论 能力估计 参数估计