学科分类
/ 1
13 个结果
  • 简介:本文介绍了几种主要的计算机化测验,分析了它们的性质,并在测量准确性,测验长度,曝光率,内容平衡,有效的管理等方面进行了比较。CAT测验试题长度要短,曝光率大大降低,更能有效测量不同能力水平的应试者;LCBT和LOFT测验可以由专家事先核查,使测验达到内容平衡,允许应试者跳答和修改试题答案;MST是较好的,具有它们所长的一种测验形式,但还需要进一步的研究。

  • 标签: 计算机化 测验 试题答案 能力水平 应试者 CAT
  • 简介:本文据美国教育研究协会等机构编写的《教育与心理测试标准》,探讨了“常模参照”和“标准参照”两术语的内涵、使用及其关系。该《测试标准》认为,从同一个测验得到的分数,可做出常模参照和标准参照两种解释。两者是从分数解释的意义上划分的,并非两种不同的测验。因此,以前将测验割裂为“常模参照测验”和“标准参照测验”的二元划分是不恰当的。

  • 标签: 常模参照测验 标准参照测验 二元划分 《教育与心理测试标准》 美国教育研究协会 告别
  • 简介:爱尔兰早在20世纪60年代初就开始使用标准化测验,经过50年的发展,标准化测验已经深深植根于小学评价体系当中,形成了两套内容紧贴小学课程的测验,并伴随着教育政策的发展奠定了标准化测验的法律地位。从测验的实施、测验结果的搜集、测验结果的解释,再到测验结果的使用形成了一套标准。在测验试题和测验使用上都别具特色。

  • 标签: 标准化测验 学业评价 小学
  • 简介:测验等值是测验研究中相对薄弱的一个环节,许多重要的考试都尚未实现统计等值。造成这种窘境的原因,皆因等值操作困难化,在介绍测验等值概念及IRT测验等值优势。的基础上,参考国内外关于测验等值的相关文献,构建出IRT测验等值的流程化操作思路,包括等值设计、数据收集、参数估计、量表化及测验等值5个步骤。以广东省佛山市中考考试为例,说明如何进行具体的测验等值流程化操作。

  • 标签: 项目反应理论(IRT) 测验等值 流程化操作思路 中考考试
  • 简介:语言类篇章测验中经常出现题组题,由于可能违背局部独立性假设,使用传统项目反应理论会导致一系列误差。本文在讨论三个改进模型Polytomous模型、题组模型和双因子模型的基础上,分别使用题组模型和独立模型对汉语能力测试的题目进行检验和分析。结果发现:汉语能力测试中的题组题总体依存度不高;题组模型适合于汉语能力测试的篇章听力和篇章阅读类的题目;独立模型和题组模型对题目难度参数的估计较为接近,对于区分度则有明显差异;两种模型对个人能力估计的一致性很高,但在能力估计的标准误上差别很大。

  • 标签: 汉语能力 测验 题组效应
  • 简介:分类一致性是标准参照测验信度研究的重要内容,而在国内的各种资格认证测验和水平考试中却鲜见应用和报告。本文尝试利用分半方法估计分类一致性信度指标。结果表明,在分类一致性信度指标的关键特征上,分半法估计结果与两次施测或同质复本方法的结果是一致的。此种方法对于大规模资格认证测验来说是可行的,即容易解释和理解,更便于实际操作。

  • 标签: 标准参照测验 一致性信度 资格认证 分类 估计 水平考试
  • 简介:标准化测验(standardizedtest),也称标准化考试,在上世纪80年代由美国引入我国并逐渐发展壮大,成为今天的主流考试模式。目前对标准化测验的研究主要集中在如何使具体的测验更加标准化、科学化这个问题上,比如试卷的设计,命题的技巧,效度、信度的把握,施测的程序以及运用统计工具进行测验质量的定量分析等。但是对一些最

  • 标签: 标准化考试 试卷设计 效度 信度 常模 标准差
  • 简介:计算机化自适应测验(CAT)在理论与实践中得到广泛应用。目前许多CAT研究可以归纳为两种研究范式:实测作答的CAT研究范式和测验作答数据模拟的CAT研究范式。CAT模拟研究方法的步骤有模型选择、题库模拟、测试起点、选题策略、测验终止策略等。CAT模拟研究的主要趋势有:选题策略、终止策略仍然是CAT研究的重点;CAT模拟研究的设计内容更适合实际测验情况;CAT研究设计采取多因素设计;模拟结果多方面综合评价等。

  • 标签: 项目反应理论 计算机化自适应测验 CAT模拟
  • 简介:测验无障碍性是指施测过程中考生与题目的恰当交互,是保障测验不受无关变量干扰、有效测量到目标构念的必要条件。测验无障碍性是残疾人接受测验时需要考虑的重要因素,美国教育考试服务中心(ETS)作为国际专业考试机构的代表,提出了测验无障碍性的概念及测验无障碍性提升策略,通过制定测验无障碍性准则对测验开发全过程进行无障碍性控制。ETS的无障碍测验开发经验值得我国教育考试机构借鉴与参考。

  • 标签: 测验无障碍性 测验便利条件 残疾考生
  • 简介:无锡为著名的江南水乡,六十年前的无锡是建在水上的城市,“百步一桥”,房屋傍水而筑。如今的无锡已把几乎所有河流填平筑路,让人难以摸清为何无锡自称水乡。从延用至今的众多地名,笔者带领大家窥得无锡深深的水的烙印。主要从三个无锡方言特色的地名词汇出发解读无锡的水文化内涵,并浅谈有关水的常见词汇所构成的地名词。

  • 标签: 特色词汇 常见词汇
  • 简介:面试作为一种常用的人事选拔技术正受到研究者的日益关注。本研究考察了面试前有关被试的测验信息对考官面试评价的影响,结果表明,这种影响是存在的,特别是消极的测验信息对面试评价的影响更大,同时测验信息对面试新手评价的影响比对有经验的人事工作者来说更大。不同种类的测验信息对面试评价的影响不同,能力测验的信息对面试评价的影响比个性测验大,同时能力测验信息并不是只对与其相关的能力维度的面试评价有影响,而是对各个维度的面试评价产生广泛的影响。

  • 标签: 面试 测验信息 考官评价
  • 简介:该文介绍并比较了计算机化自适应测验(computerizedadaptivetesting,CAT)环境中的MLE、WLE、MAP、EAP等几种常用能力估计方法的发展演变以及各自的原理与特性,并对这些能力估计方法的发展脉络及其特性做了简要总结与评价,最后展望了未来CAT中能力估计的发展趋势。

  • 标签: 计算机化自适应测验 项目反应理论 能力估计 参数估计
  • 简介:语文部份1.注重真实运用,避免机械考查,关注学生在实践中运用语文知识解决问题的能力在2013年的考试说明中,语文学科作了重要调整:在“基础知识积累与运用”中取消了词语运用、句子运用、标点运用、语病修改等考点,将其迁移至写作板块中评判,字形2分、标点2分、词语3分、句子3分,共10分,由专人批改。它有助于克服用固定模式的静态材料考查而导致的标准化应试训练倾向,强调在最真实的运用状态中考查学生的语言能力。这一调整,大部分市试卷中都得到了不同程度的体现。

  • 标签: 学科教学改革 初中毕业生 教学测验 教学导向 学业考试 试卷