导读:本文包含了计算机化自适应测验论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:测验,自适应,计算机,方法,项目,理论,因子。
计算机化自适应测验论文文献综述
孙小坚,王钰彤,张世夷,辛涛[1](2019)在《认知诊断计算机自适应测验中平衡属性收敛的新方法》一文中研究指出提出两种认知诊断计算机自适应测验下平衡属性收敛的新方法(MABI、RTA),模拟研究系统探讨和比较了此二者与已有方法(ABI、IABI和RABI)的表现。结果发现:(1)新方法较不考虑属性收敛的方法有更高的准确率以及更均衡的题目使用率;(2)新方法较ABI和RABI有稍低的准确性,但有更平衡的题目使用率;(3)新方法与IABI的准确性和题目使用率在不同选题策略下各有优势。总之,两种新方法较好地兼顾测量准确性、题目使用率以及题库曝光情况。(本文来源于《心理科学》期刊2019年05期)
田赟[2](2019)在《计算机自适应测验环境下考生能力水平和大五人格对试题作答行为的影响》一文中研究指出科学测评学生学业成就和能力水平对于改进学校教育质量、公平评价学生、促进学生发展具有重要意义。《国家中长期教育改革和发展规划纲要(2010-2020年)》指出:“尊重教育规律和学生身心发展规律,为每个学生提供适合的教育。”要求教育领域变革发展,倡导实施以学生为中心、尊重学生个性差异的教育和测评。教育测评作为教学过程的重要组成部分,其公平性和有效性始终备受关注。而传统考试存在很多不足,难免使考试结果有失公平和有效。而且考试过程中学生的心理和行为差异,传统考试也无法监测到。随着测量理论和计算机技术的发展,计算机自适应测验能够克服传统考试的一些不足,对学生的考试行为也有一定的监测作用。本研究从传统考试的不足及考试公平有效引起人们的思考、考生的作答行为及个体心理差异引起人们的关注、计算机自适应测验能更有效测量考生的能力水平叁方面背景,综合了文献研究法、问卷调查法、测验法和数学模型法等研究方法,在项目反应理论和网页开发技术指导下,构建计算机自适应测验环境,对测验样本进行了研究,以探测考生的能力水平和人格特质对考试作答行为的影响。鉴于此,本研究工作主要有以下几点:(1)理论基础方面的研究。主要是在阅读和分析相关文献,即对项目反应理论及以此为理论基础的计算机自适应测验的相关技术、大五人格理论及其发展脉络、以及两大理论的相关文献进行分析和梳理的基础上,厘清计算机自适应测验的原理和大五人格特质理论的维度框架。(2)根据项目反应理论构建计算机自适应测验环境并组织实施测验,收集考生的作答信息,包括能力估值、作答结果和作答时间;采用信、效度较好的现有大五人格量表,对测验对象施测,获取考生的大五人格特质信息。(3)对测验收集的考生作答信息和人格特质信息进行数据处理,尝试分析它们之间的影响关系,并就考生的能力水平和大五人格对试题作答行为的影响关系建立Logistic回归模型,并提出对策和建议,为后续的相关研究和教师的教学实践提供参考和帮助。本研究测验结果显示:考生的能力水平对作答行为有显着影响;考生的大五人格对作答行为有显着影响;考生的能力水平和大五人格对试题作答行为有交互影响。本研究结论对教育测量与评价具有一定的理论意义和实践价值。理论意义:(1)本研究拓展了大五人格在教育领域尤其是教育测量与评价领域的应用,在一定程度上丰富了大五人格理论。(2)本研究在计算机自适应测验环境下实施的测验,能更有效测量考生的能力水平,能更真实展现考生的大五人格特质,并利用作答时间判别考生的作答行为,进而探讨了能力水平和大五人格对作答行为的影响,为研究考试作答行为提供了一种新的切入和思路。实践价值:(1)本研究开发的计算机自适应测验系统,能够提供给考生一种既有挑战又能最佳激励的测验环境,使考生能够最大限度地表现出真实能力水平;同时,在这种“轻松而充实”的评估环境中实施测验,考生的大五人格能得到充分而真实展现,这对测量结果的客观真实性至关重要。因此,结合计算机自适应测验形式,对考试作答行为及其影响因素进行探讨,为后继相关研究提供了方法和技术参考。(2)本研究所探讨的能力水平和大五人格对试题作答行为的影响机制,将这种影响机制应用到教育教学中,对于教师在教学实践中通过作答行为反推考生的人格,进而针对不同人格特质和能力水平的考生,采取不同措施、进行不同干预,具有一定的实践价值。(本文来源于《山东师范大学》期刊2019-06-09)
李佳,丁树良[3](2019)在《计算机化自适应测验中能力估计新方法》一文中研究指出能力估计的极大似然估计方法(MLE)不能处理全0或全1的被试反应模式,若事先设置好能力估计的上下界,则会导致能力估计的有效范围缩小的后果;而贝叶斯估计方法需要选择先验分布,先验分布的选择必须很慎重.在原有似然函数的基础上,构建2个新的项目,提出了改进的MLE方法(NMLE).NMLE既不需要能力先验分布,也不会缩小能力估计范围,而且可以处理各种反应模式.蒙特卡洛实验结果表明新方法表现良好.(本文来源于《江西师范大学学报(自然科学版)》期刊2019年02期)
毛秀珍,王娅婷,杨睿[4](2019)在《多维计算机化自适应测验中项目曝光控制选题策略的比较》一文中研究指出在MCAT中考查四种项目选择指标在有无曝光控制条件下的选题表现。项目选择指标分别是:(1)贝叶斯的D优化方法(D-optimality)、后验期望Kullback-Leibler方法(KLP)、基于等权重复合分数的最小误差方差方法(the minimized error variance of the linear combination scorewith equal weight,V1)和基于最优权重复合分数的最小误差方差方法(the minimized error variance ofthe composite score with optimized weight,V2)。将针对认知诊断CAT项目曝光控制的的限制阈值方法(Restrictive Threshold,RT)和限制进度(Restrictive Progressive,RPG)方法、单维CAT中的最大优先指标方法(Maximum Priority Index,MPI)推广到MCAT。模拟研究表明:(1) KLP,D-优化和V1对领域分数估计准确,能力返真性比V2更好。(2)尽管V1和V2方法相比KLP和D-优化方法提高了题库利用率,但这四种选题指标都产生不均匀的项目曝光率分布。(2)叁种曝光控制策略都极大地提高项目曝光均匀性,且不明显降低测量精度。(3) MPI与RPG方法在曝光控制方面表现类似,且比RT的方法表现更好。(本文来源于《心理学探新》期刊2019年01期)
谢宇欣,戴步云[5](2018)在《CAT-SRS的开发——大学生社会责任感的计算机自适应测验》一文中研究指出在文献回顾的基础之上,根据项目反应理论和社会责任感的相关理论结合五个国内外社会责任感量表,根据IRT分析选择高质量的题目构建大学生社会责任感的计算机自适应测验(Computerized adaptive testing-Social Responsible Scale, CAT-SRS),并分析其可行性和有效性。首先使用单维性IRT模型进行数据分析构建题库。IRT分析包括:对测验进行探索性因素分析,直至满足单维性的假设前提;删除Q3统计量大于0.36的题目,使测验满足局部独立性检验;根据AIC、BIC、-2LL估计结果,选择等级反应模型进行进一步的测验项目分析;删除IRT区分度小于0.8和项目拟合S-χ~2小于0.01的题目;同时证实各题在性别水平上均不存在项目功能差异。至此,最终符合IRT测量要求的80题的社会责任感题库构建完成。接下来基于纸笔测验的数据进行CAT模拟,最开始先将每个被试的特质水平初始值设定为0,然后采用随机选题方式,随机抽取一题作为初始题。并采用最大Fisher信息法,选择对当前被试特质水平下能够提供最大信息量的题目作为下一题;采用叁种不同的终止策略方法进行比较:定长度、定精度和"精度为主,定长为辅"。当被试作答的标准误达到一定精度或作答题达到一定长度时,即终止作答;最后根据被试在各题上的得分,估计出被试的特质水平(θ)。最后对CAT-SRS的有效性进行验证,考虑到极端人格人群需要作答所有题目方能终止测验的情况,本研究最终采用"精度为主,定长为辅"的终止规则:在CAT过程中,当满足SE<0.3或测验长度达到20题时即终止测验。结果表明:可以在80个项目中提取大部分信息,CAT-SRS的平均作答项目数减少到了12.21题,题量节省比例达到了84.73%,这说明CAT-SRS可以大大减少被试的作答负担,提高被试的作答效率;模拟结果还表明,在纸笔测验总分与CAT-SRS估计的结果之间存在高相关(r=0.961),边际信度也达到了0.90,这说明CAT-SRS具有较高的测量效度。由此凸显了将CAT应用于社会责任感测量中的优势:在相近的测验准确度下,CAT-SRS能够大大缩短测验所需的长度,节省施测时间,对实现高效准确的大学生社会责任感测量具有现实意义。(本文来源于《第二十一届全国心理学学术会议摘要集》期刊2018-11-02)
廉洁,蔡艳[6](2018)在《计算机化自适应测验在酒精使用障碍评估中的应用》一文中研究指出背景:长时间过度使用酒精可能会导致个体形成酒精使用障碍,对酒精过度依赖,即使意识到使用酒精对躯体有害还会反复使用酒精,这会对个体的身心健康构成巨大威胁。对此,学者们开发出诸多测量个体酒精使用障碍的纸笔测验,这些测验可用于筛查出酒精使用障碍程度较严重的个体。本研究旨在开发并应用酒精使用障碍的计算机化自适应测验来评估个体的酒精使用障碍严重程度。方法:本研究要求被试年龄不小于18岁,对性别和地域不做限制,故被试的来源比较广泛。最终的样本包括915名被试,735名男性,平均年龄为36.35岁(SD=11.42); 180名女性,平均年龄为34.11岁(SD=11.51)。最终版题库由国内外一些经典的酒精使用障碍测验经过DSM-5筛选组合而成,共计119题。结果:计算机化自适应测验版本估计出的被试潜在特质水平同使用完整题库估计的被试潜在特质水平的频率分布呈现一致的趋势,且两者之间的相关达到0.96 (p<.001)。与119题的完整题库相比,本研究选用标准误设定值≤0.3时的计算机化自适应测验,在精度较高的情况下,平均仅用17.09题即可完成对被试酒精使用障碍水平的评估。结论:酒精使用障碍的计算机化自适应测验为个人提供了充足的心理测量学信息和有效的评估。计算机化自适应测验缩短了被试的测验题长,提高了测验效率,对酒精使用障碍程度较重的被试来说快捷可信,接受度更高,在实际生活中操作性较强。最后,本研究为酒精使用障碍的干预工作提供了丰富的信息,近而为减少患者数量提供了一些帮助。(本文来源于《第二十一届全国心理学学术会议摘要集》期刊2018-11-02)
王超,陆宏[7](2017)在《计算机自适应测验的研究策略与应用实践》一文中研究指出计算机自适应测验(Computerized Adaptive Testing,CAT)有着传统纸笔测验无法比拟的优势,其研究和应用吸引了教育领域专家的关注。但国内多数研究致力于纯粹的学术探讨,缺少对教育实践者的普适性指导。基于此,文章从实时性和科普性的角度出发,阐述了常用的CAT研究策略和应用软件,并进一步介绍了CAT在美国基础教育和特殊教育领域的实践应用。文章旨在拉近CAT研究与教育实践工作者间的距离,使其能清晰把握当前CAT的研究脉络和应用前景,促进CAT在教育领域的推广和应用。(本文来源于《现代教育技术》期刊2017年12期)
刘馨婷,王潇蒙,韩雨婷,史双双,苗莹[8](2017)在《基于Bifactor-model的抑郁症计算机自适应测验开发》一文中研究指出高质量的抑郁测评工具不仅能够作为测评抑郁程度的工具,更能为抑郁筛查、临床评估提供参考信息。当前的抑郁测评工具大多都是以经典测量理论(CTT)为指导编制的,在经典测量理论下,问卷只能给出一个总分,并不能提供更多的信息;除此之外,如果需要测量多个维度,为了保证测量结果的稳定性,有可能会使问卷题量增加,加重被试的负担。随着测量技术的革新,多维项目反应理论(MIRT)逐渐发展,为抑郁症测评工具的开发提供了一个新的思路。本研究的目的是基于双因子模型开发适用于抑郁评估的计算机自适应测验(CAT)。本文开展了两项研究:研究一基于单维视角的双因子CAT(BICAT)和多维视角的双因子CAT(MBICAT)分别开发出新的方法,通过蒙特卡洛模拟验证新方法的合理性与科学性,并与传统方法进行比较,从而为开发基于Bifactor-model的抑郁症CAT(BICAT-D)提供新的技术依据;研究二在研究一的基础上建构一个可以用于进行抑郁症评估的CAT测评系统,并通过实测数据验证BICAT-D在实际应用中的效果。结果表明:(1)MBICAT下方法整体的精度高于BICAT,但在BICAT方法中加入多维估计,能提高BICAT的估计精度;(2)MBICAT方法下,整体的精度较高,但是施测题量多于BICAT,为了控制题目的数量可以对已满足精度标准的维度进行约束,在对满足精度的维度进行约束后,题长有所减少,但精度并没有过多的损失;(3)在BICAT中,所有维度施测结束后,采用多维估计方法重新估计所有维度的θ,结果的精度与MBICAT方法非常接近。考虑到运算时间,可以采用重新多维估计的BICAT作为基于Bifactor-model CAT开发的方法。(4)抑郁症题库为157题时,采用BICAT-D,能减少被试的做题负担,被试平均长为29.4题,相当于节省了80.89%的题量。(5)以SDS、CES-D以及PHQ-9作为效标,结果表明BICAT-D具有良好的效标关联性效度。(6)根据ROC曲线的分析,以,θ?_(BICAT-D,G)-=0作为抑郁与非抑郁的临界值,能够保证敏感性和特异性都达到理想的标准。(7)BICAT-D不仅能够报告被试的抑郁水平,还能给出被试在各个特殊维度的严重程度,有助于把同样抑郁水平的被试区分开。(本文来源于《第二十届全国心理学学术会议--心理学与国民心理健康摘要集》期刊2017-11-03)
林鑫鑫,刘旭峰,武圣君[9](2017)在《青年军人精神分裂症前驱期症状筛查问卷计算机自适应测验化的可行性研究》一文中研究指出中国卫生部的统计结果显示,精神分裂症有可能成为未来负担最重的疾病。精神分裂症是一种慢性的严重精神病,并且发病较早,致残率高。研究发现70%的精神分裂症患者在发病前一段时间已出现一些征兆,这段时间被称作精神分裂症前驱期,研究发现在前驱期进行干预,可以有效延长发病时间并提高预后效果,因此对精神分裂症前驱期的筛查鉴别就变得极为重要。目前筛查方法存在效率低或假阳性率高的不足,本研究旨在实现问卷的计算机自适应测验(CAT)化。争取为每个被试提供个体化的测验,以在不失准确度的前提下缩短测验时间,提高筛查效率。研究目的参考国内外精神分裂症及其前驱期相关研究,结合我国目前需求,编制青年军人精神分裂症前驱期症状筛查问卷的计算机自适应测验,用于快速在人群中筛查出具有精神分裂症前驱期风险的人群。研究方法在项目反应理论(IRT)对条目进行参数估计的基础上。编制CAT测验并验证其可行性。结果用项目反应理论对所有题目进行参数估计,对7道超过参考值的题目进行分析后,删除4道不合适题目。最终以82题作为CAT题库。对CAT纸笔测验总得分与CAT结果做Spearman相关分析,且与全量表得分相关度Spearman系数为0.749,结果显着相关(p<0.01),CAT测试与传统纸笔测验结果作对比,可以节约70%时间并少做80%题目。结论:评估青年军人精神分裂症前驱期症状筛查问卷的CAT测验是具有可行性的。(本文来源于《第二十届全国心理学学术会议--心理学与国民心理健康摘要集》期刊2017-11-03)
李贵玉,涂冬波,戴步云,宗一涛,高旭亮[10](2017)在《计算机多阶段自适应测验的组卷方法》一文中研究指出计算机多阶段自适应测验(MST)实施的关键是成功组建多个满足测验规范(即统计和非统计约束)的平行测验(或称测验面板),自动组卷(ATA)为实现测验平行提供了可能.现有的MST组卷方法研究主要包括以下几种:1)基于线性规范算法的组卷方法;2)基于启发式算法的组卷方法;3)基于蒙特卡洛算法的组卷方法;4)基于在线组卷的方法.该文讨论这几种方法的优缺点并进行比较,同时指出未来可进一步改进这种方法并开发基于认知诊断测验的自动组卷方法.(本文来源于《江西师范大学学报(自然科学版)》期刊2017年05期)
计算机化自适应测验论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
科学测评学生学业成就和能力水平对于改进学校教育质量、公平评价学生、促进学生发展具有重要意义。《国家中长期教育改革和发展规划纲要(2010-2020年)》指出:“尊重教育规律和学生身心发展规律,为每个学生提供适合的教育。”要求教育领域变革发展,倡导实施以学生为中心、尊重学生个性差异的教育和测评。教育测评作为教学过程的重要组成部分,其公平性和有效性始终备受关注。而传统考试存在很多不足,难免使考试结果有失公平和有效。而且考试过程中学生的心理和行为差异,传统考试也无法监测到。随着测量理论和计算机技术的发展,计算机自适应测验能够克服传统考试的一些不足,对学生的考试行为也有一定的监测作用。本研究从传统考试的不足及考试公平有效引起人们的思考、考生的作答行为及个体心理差异引起人们的关注、计算机自适应测验能更有效测量考生的能力水平叁方面背景,综合了文献研究法、问卷调查法、测验法和数学模型法等研究方法,在项目反应理论和网页开发技术指导下,构建计算机自适应测验环境,对测验样本进行了研究,以探测考生的能力水平和人格特质对考试作答行为的影响。鉴于此,本研究工作主要有以下几点:(1)理论基础方面的研究。主要是在阅读和分析相关文献,即对项目反应理论及以此为理论基础的计算机自适应测验的相关技术、大五人格理论及其发展脉络、以及两大理论的相关文献进行分析和梳理的基础上,厘清计算机自适应测验的原理和大五人格特质理论的维度框架。(2)根据项目反应理论构建计算机自适应测验环境并组织实施测验,收集考生的作答信息,包括能力估值、作答结果和作答时间;采用信、效度较好的现有大五人格量表,对测验对象施测,获取考生的大五人格特质信息。(3)对测验收集的考生作答信息和人格特质信息进行数据处理,尝试分析它们之间的影响关系,并就考生的能力水平和大五人格对试题作答行为的影响关系建立Logistic回归模型,并提出对策和建议,为后续的相关研究和教师的教学实践提供参考和帮助。本研究测验结果显示:考生的能力水平对作答行为有显着影响;考生的大五人格对作答行为有显着影响;考生的能力水平和大五人格对试题作答行为有交互影响。本研究结论对教育测量与评价具有一定的理论意义和实践价值。理论意义:(1)本研究拓展了大五人格在教育领域尤其是教育测量与评价领域的应用,在一定程度上丰富了大五人格理论。(2)本研究在计算机自适应测验环境下实施的测验,能更有效测量考生的能力水平,能更真实展现考生的大五人格特质,并利用作答时间判别考生的作答行为,进而探讨了能力水平和大五人格对作答行为的影响,为研究考试作答行为提供了一种新的切入和思路。实践价值:(1)本研究开发的计算机自适应测验系统,能够提供给考生一种既有挑战又能最佳激励的测验环境,使考生能够最大限度地表现出真实能力水平;同时,在这种“轻松而充实”的评估环境中实施测验,考生的大五人格能得到充分而真实展现,这对测量结果的客观真实性至关重要。因此,结合计算机自适应测验形式,对考试作答行为及其影响因素进行探讨,为后继相关研究提供了方法和技术参考。(2)本研究所探讨的能力水平和大五人格对试题作答行为的影响机制,将这种影响机制应用到教育教学中,对于教师在教学实践中通过作答行为反推考生的人格,进而针对不同人格特质和能力水平的考生,采取不同措施、进行不同干预,具有一定的实践价值。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
计算机化自适应测验论文参考文献
[1].孙小坚,王钰彤,张世夷,辛涛.认知诊断计算机自适应测验中平衡属性收敛的新方法[J].心理科学.2019
[2].田赟.计算机自适应测验环境下考生能力水平和大五人格对试题作答行为的影响[D].山东师范大学.2019
[3].李佳,丁树良.计算机化自适应测验中能力估计新方法[J].江西师范大学学报(自然科学版).2019
[4].毛秀珍,王娅婷,杨睿.多维计算机化自适应测验中项目曝光控制选题策略的比较[J].心理学探新.2019
[5].谢宇欣,戴步云.CAT-SRS的开发——大学生社会责任感的计算机自适应测验[C].第二十一届全国心理学学术会议摘要集.2018
[6].廉洁,蔡艳.计算机化自适应测验在酒精使用障碍评估中的应用[C].第二十一届全国心理学学术会议摘要集.2018
[7].王超,陆宏.计算机自适应测验的研究策略与应用实践[J].现代教育技术.2017
[8].刘馨婷,王潇蒙,韩雨婷,史双双,苗莹.基于Bifactor-model的抑郁症计算机自适应测验开发[C].第二十届全国心理学学术会议--心理学与国民心理健康摘要集.2017
[9].林鑫鑫,刘旭峰,武圣君.青年军人精神分裂症前驱期症状筛查问卷计算机自适应测验化的可行性研究[C].第二十届全国心理学学术会议--心理学与国民心理健康摘要集.2017
[10].李贵玉,涂冬波,戴步云,宗一涛,高旭亮.计算机多阶段自适应测验的组卷方法[J].江西师范大学学报(自然科学版).2017