多项能力倾向测验的初步编制

多项能力倾向测验的初步编制

王进礼[1]2003年在《多项能力倾向测验的初步编制》文中研究表明目的:把长-鞍团体智力测验发展成为多项能力倾向测验(简称MAT),包括量表的建构,条目分析,信、效度研究。研究目的是为武警部队等职业团体在人员筛选、工作安置和能力评估与咨询方面提供一个初步的能力倾向测量工具。 方法:主要采用工作分析方法建构MAT。广泛查阅国内外有关文献和借鉴国内外成功的能力测验编制方法、进行专家访谈、问卷调查并结合作者参加部队训练和执行任务的实践经验,提出了武警部队一类团体工作任务所需要的四因素能力倾向结构模型并确定MAT包括抽象思维、空间能力、注意和速度、动作稳定四个分量表共15个分测验的结构和内容。其中8个分测验采用龚耀先教授等的长-鞍团体智力测验的条目,另7个分测验自行编制。其中的描画线条测验用电脑扫描记分代替人工记分,以象素单位代替毫米单位,使测验精度可上升10倍,同时完全消除了人工记分的误差,使该测验不仅能测查出病理人群的细微差异,而且能够拓展成职业能力测验,成为纸笔测验代替器械测验的一个方法。通过预测粗筛和按难度重新编排条目,之后随机整群在武警湖南总队取991人实测。对其中45人相隔23天重测,对其中33人施测韦氏成人智力测验简式本,对其中叁个支队303人由直接领导进行能力评定,收集了某支队136人的训练成绩,以做信、效度检验之用。信度检验包括重测及内部一致性等研究。效度检验包括结构效度(探索性因素分析和验证性因素分析等)和实证效度(以不同的职业群体区分,训练成绩、领导评定和韦氏成人智力测验作效标)等研究。 结果:1、条目分析结果:各分测验难度在0.38~0.60之间,总体难度是0.50,具有有效区分效度(0.20以上)的条目占85%以上。2、信度检验结果:间隔23天重测的相关系数总分为0.79,各分量表为0.73~0.88,α系数总分为0.80,各分量表为0.53~0.75。3、效度检验结果:(1)结构效度:抽象思维、空间能力和注意和速度分量表与总分相关较高(0.69~0.80),动作稳定分量表与总分相关较低(0.29),各分量表之间抽象思维、空间能力和注意和速度分量表之间中度相关(0.40~0.47),动作稳定 . . 分量表与前叁个分量表相关很低功。0M。10)。y索性因素分析抽取了特征值大于1 的四个因子,它们解释了总方差的54.28%;验证性因素分析的拟合指数CFI、NNFI 均在 0.95以上,RMSEA均小于 0.05,CMIN/DF小于 2。(2)实证效度:oATA : 测验总分在不同职业群体之间、在不同学历群体之间差异显着…0.of或P<0。00; GATA总分及抽象思维、注意和速度和动作稳定分量表与叁项训练成绩总分显着相 关 ;GATA总分及抽象思维、动作稳定分量表与领导评定总分显着相关S MAT总分 及各分量表分测验与韦氏成人智力测验简式总分及相应分测验显着相关。 结论:MAT在建构上符合武警部队等团体所要求的能力倾向结构,测验设计合 理且具有创新性;条目总体质量合乎心理测量学要求;在信度方面具有较高的稳定 性和各分测验内部的一致性;在效度方面有完好的结构效度,能够测量这类团体所 需要的一致的和不同的多种能力倾向;以不同的职业群体区分,训练成绩、领导评 定和经典的智力测验作效标的检验均证实了MAT有较好的实证效度。

石梦良[2]2006年在《3~4年级言语学习能力倾向测验的初步编制》文中指出随着教育由应试教育向素质教育的转变,我国迫切需要一种具有前瞻性的客观的辅助量表,来全面客观地了解学生的能力状况,从而做到因材施教,充分发挥每个学生独特的能力倾向。我国教育领域虽然在成就测验即学绩测验上有不错的研究成果,但在预测性的测验上研究甚少。 本研究编制的小学生言语学习能力倾向测验,着重从理解和运用汉语语言文字,阅读难度适当偏难的语句和段落,理解其主要内容和深层含义能力上来确定分测验和各项目。从测量结果来看,各分测验与总分的相关明显高于各分测验之间的相关,说明各分测验都能对总分作出贡献,且各分测验与测验总体的测量方向间有较好的一致性。 为了使测验能够有效区分被试在欲待测特质上的差异,本研究主要从项目难度和区分度进行了测验的项目分析。结果表明,就整体而言,绝大多数分测验的项目难度分布较为理想,难度在0.30~0.69的项目占项目总数的63.4%,各难度等级的项目比例也较为适宜,各分测验的平均难度都在0.5左右。就不同年级而言,测验难度叁年级的偏高,通过率都低于0.5,四年级测验的通过率都在0.5左右,对五年级的通过率则高于0.6。 从鉴别指数看,各分测验在各年级具有有效区分度的项目比例约占91%以上。就整体而言,约94%的项目的鉴别指数大于0.2。各分测验的平均鉴别指数在0.42~0.66。从项目与总分的相关来看,相关系数在0.2以上的项目比例均在90%以上,各分测验项目与总分的相

王进礼, 龚耀先[3]2004年在《多项能力倾向测验的初步编制》文中进行了进一步梳理目的 :把长 -鞍团体智力测验发展成为多项能力倾向测验以供职业选拔之用。方法 :根据工作分析与借鉴范例来建构MAT。随机整群在武警湖南总队取 991人实测。对其中 4 5人相隔 2 3天重测 ,进行条目及信效度分析。结果 :各分测验难度在 0 .38~ 0 .6 0之间 ,总体难度是 0 .5 0 ,具有有效区分效度 (0 .2 0以上 )的条目占 85 %以上。重测相关系数为 0 .79,总分α系数为 0 .80。效度检验结果符合心理测量学结果。结论 :多项能力倾向测验的建构合理 ,达到了编制目的。

康麒[4]2015年在《《军人一般能力测验》量表的编订及应用》文中指出目的:编制《军人一般能力测验》问卷,并对其进行信度、效度、效标关联效度研究,在基层部队的雷达操纵员岗位初步应用,总结该岗位的一般能力特点并尝试进行雷达操纵员岗位新训人员一般能力发展的预测性研究。方法:运用重测信度法和pearson相关法计算相关,研究重测信度以及效标关联效度;运用Kaiser标准化的正交旋转法研究结构效度;运用pearson相关法研究本量表与韦氏智力测验、在校学习成绩的相关性。运用t检验、pearson相关法观察雷达操纵员与普通军人各项能力问卷的统计学差异;连续跟踪记录雷达操纵员岗前培训班人员的一般能力变化。结果:探索性因素分析结果表明,军人一般能力测验量表存在的5个独立维度(KMO=0.78,P<0.01);在内部一致性方面,各维度的系数维持在0.82到0.91的范围内,而量表的系数则为0.89;在相关性方面,各维度与总分之间的r值在0.47到0.78的范围内,且P小于0.01,具有很强的相关性,而各维度之间的r值在0.19到0.67的范围内,且P小于0.05,具有较强的相关性,表明量表信度和效度良好。问卷总分与被试年龄无显着相关;根据r值与P值的大小,问卷各维度与各门学科考试成绩以及韦氏智力测验部分都显着相关,表明量表的效标关联效度较好。在基层部队针对雷达操纵员岗位进行了初步运用,与普通岗位军人一般能力进行比较,雷达操纵员在空间感觉(t=6.687,P=0.002)、相似性(t=5.260,P=0.01)、数学计算(t=5.005,P=0.018)叁个维度上有统计学差异。在对雷达操纵员岗前培训班人员进行持续跟踪测量,空间感觉、数学计算两个维度有统计学差异,相似性维度变化不明显。结论:《军人一般能力测验》具有较高的信度和效度,在基层部队的实际使用中,能够体现出特殊技能岗位的一般能力需要,具有一定的实用性。

张恺郎[5]2010年在《学习能力倾向测验与多重成就测验在学业低成就筛查中的联合应用研究》文中进行了进一步梳理目的:探讨学习能力倾向测验与多重成就测验联合筛查学业低成就学生的可行性和有效性。方法:对被试同时施测学习能力倾向测验和多重成就测验,同时获取教师提名的学业低成就者名单以及所有被试的期中测验成绩;对数据进行分析,检验两测验联合筛查结果与教师提名结果的一致性,检验学业低成就组与匹配的学业成就达成组在期中测验成绩上的差异。结论:应用学习能力倾向测验和多重成就测验的联合筛查法与教师提名法的相关显着,低成就组与学业达成组之间的期中测验成绩存在显着差异,初步证明了这两套测验用于学生低成就筛查的有效性。

刘丽娟[6]2004年在《小学低年级数学成就测验的初步编制》文中研究指明评价改革是课程改革的重要内容。现在,对于学科学习的评价主要依据各学科的课程标准。本研究以义务教育数学课程标准为依据,以测量学的理论为指导,进行了小学低年级数学成就测验的初步编制,力图为课程改革提供一种科学的评价方法与工具。本测验为数学单科成就测验,适用于小学一、二年级,采用团体施测的形式,施测时以朗读方式呈现,测试项目均采用四选一的选择题型。每一年级各有A、B两套题册。在四所城市小学和两所农村小学进行了实测,得到了1157份有效试卷。经分析测试结果,得到了各测验的原始分;从结果得知,各测验的平均难度在0.47~0.54,平均区分度用鉴别指数法和点二列相关法计算均大于0.2;63.9%~88.8%的项目的诱答选项具有良好的诱答力;各测验的同质性信度系数在0.80~0.88之间,测量标准误在2.61~2.92之间;经专家判断法和经验法检验,测验具有良好的内容效度;探索性因素分析结果显示各测验均得到两个特征值大于1的因素,分别能解释方差的76.40%、72.99%、64.79%和62.28%。同时效度检验表明测验分数在不同年级、城乡之间有显着差异,男女生之间无明显差异,测验分数与学生期末数学成绩的相关为0.703~0.732;A、B套平行性检验表明测验基本平行。经上述分析可知,测验项目总体质量较好,内部一致性高,稳定性较好,测量标准误较小,内容效度和结构效度良好,同时效度较高,说明测验达到了测量学的要求。

王轶君[7]2008年在《基于项目反应理论的应征公民词汇理解能力测验的初步编制》文中提出当今世界,随着战争形式的转变,高科技武器装备在军队的配备和使用,对于决定战争胜负最关键的因素——军事人员,提出了更高的要求。对于士兵,不仅仅需要他们具有强健的体魄,具有一定程度的智力水平也非常关键,一定的智力水平是学习和操作好各种高科技武器装备的基础。词汇理解能力是语言能力的基础和核心,也是人类理解一切事务的根本,它与人类的思维高度相关,是人最基本的智能,在很多的智力测验中都有关于词汇理解的测量,也一直受到各国军队人力资源管理部门的重视。在我国征兵入伍心理检测过程中,增加对词汇理解能力的检测,对于进一步提高我国的兵员素质,增强军队的战斗力具有十分重要的意义。项目反应理论(Item Response Theory ,IRT)是一种现代的测量理论,它优点表现在具有参数不变性、测验信息函数概念的提出等方面,尤其,项目反应理论是计算机自适应性测验(Computerized Adaptive Test,CAT)的应用基础,CAT可以通过应用计算机程序为每一名被试提供最佳的测验,不仅能提高测验效率,有利于保密,它还便于及时判分。项目反应理论以其诸多的优点,被广泛应用于军事、心理和教育领域。本课题主要目的是建立一套基于项目反应理论的应征公民词汇理解能力测验,为我国应征公民词汇理解能力测验的CAT题库建设奠定基础,为我国应征公民心理选拔服务,提高兵员质量。本研究在文献回顾的基础上,根据项目反应理论和词汇理解能力测验的有关理论,编制项目和测验,总共编制项目340道,组成5套试卷,首先采用纸笔测验的形式进行预实验,探讨采用IRT理论编制词汇理解能力测验的可行性。然后,在预实验的基础上,根据征兵心检测工作的实际情况,对测验题目进行调整,组成10套试卷,编制成计算机辅助测验。选择叁参数Logistic模型,采用铆题等值设计,将这10份不同的试卷在征兵心理检测过程中进行施测。根据测试结果,对条目进行分析,最终选取244个高质量的条目构成测验,并以WAIS智力测词汇分测验为效标进行效度验证。研究的主要结果如下:1.编制的词汇理解能力测验符合叁参数Logistic模型,满足单维性假设,在给定的时间内也满足测验未被加速假设。2.采用铆题等值方法,对项目参数采用边际极大似然估计(MMLE),对被试能力参数进行贝叶斯后验期望估计(EAPE),可以顺利得到各项参数。3.所编制测验条目有较好的区分度,猜测度参数较为理想,但难度参数偏大。项目信息函数和测验信息函数都比较理想。4.词汇理解测验与WAIS智力测验词汇分测验,具有显着正相关关系。5.在本研究中发现,项目的难度与项目选项的编制方法显着相关,与题型和词汇的年级来源相关较弱。

孙菡[8]2007年在《基于项目反应理论的应征公民数学推理测验项目的初步编制》文中指出随着计算机技术的普及和项目反应理论(Item Response Theory,IRT)的发展,计算机自适应性测验(Computerized Adaptive Testing,CAT)正日益成为国际上大型测验的主流。由于CAT具有节省时间,安全性好以及可以及时提供被试成绩等优点,被迅速应用到军事人员的选拔和分类中。所有的CAT测验都是在项目反应理论的基础上建构的。目前应用于征兵工作中的“应征公民心理检测系统”是一种淘劣性质的测评,目的是防止一般能力较弱和有性格偏差的人进入部队。然而,随着军队现代化建设的需要,军事人员的分类和人岗匹配已经成为质量建军的必要步骤,这就对选拔测验提出了更高的要求。基于项目反应理论的计算机自适应性测验是最理想的大规模测验形式。本研究即是在这一背景下提出设想,研讨测量应征公民数学推理能力的工具,应用项目反应理论初步编制测验项目,为应征公民数学推理能力试题库的建立打下基础,特别是对发展该能力CAT提供可能。本研究的主要内容、步骤如下:1.通过文献回顾、专家咨询等手段确定研究思路,提出理论假设;2.应用项目反应理论编制数学推理测验项目;3.形成预测试卷,对兰州军区某部1047名新兵进行预测及项目分析;4.修订试卷,对沈阳、济南军区3655名新兵进行实测,收集实测数据;5.统计处理实测数据,进行项目分析及选取,方法包括:用因素分析主成分方法检验数据单维性,采用叁参数Logistic模型拟合数据,利用BILOGMG软件贝叶斯后验期望估计方法估计项目参数,采用调整卡方检验方法进行模型-资料拟合度检验,采用铆题非等组设计和项目特征曲线等值法进行参数等值以挑选最有效项目,利用测验信息函数确定各水平处能力估计的误差;6.验证理论假设。本研究的主要成果如下:1.理论假设——成人(应征公民)的数学认知水平经历了从加法结构到整数乘法结构,到分数乘法结构,到正比例概念初步建构,到正反比例概念初步整合,到正反比例概念高水平整合这样一个由低级到高级、由简单到复杂、由单维到多维的层次阶段,被证明具有可行性;2.依据成人(应征公民)的数学认知水平的理论假设编写项目说明书,编制形成了134个数学推理能力测验项目,项目性能优良:实测的4套测验均符合单维性要求,数据拟合叁参数Logistic模型,项目的调整卡方检验值均等于或小于3,项目参数满足0.5<a<3且c<0.25,对θ∈[-0.7,1.4]能力区间内的被试所能提供的信息量大于25,其能力估计值的精确性较高。

王进礼, 张月娟[9]2006年在《武警用智力工作特征测验的初步编制》文中指出目的:为人员选拔和安置编制一种操作简便、适用于团体施测的智力工作特征测验.方法:依据智力成分和层次理论,参照内田-别莱佩林测验的定时分行形式,编制测验项目结构相同、由0到9数字随机排列的加、减、乘运算测验,用于检测计算、注意、记忆广度、计算转换的能力特征的《智力工作特征测验》(IWCT);IWCT以智力工作水平和工作曲线形态为评价指标;对998名武警战士和学员进行施测.结果:该测验重测信度0.89;与内田-克莱佩林测验的相容效度.70,与智力测验的相容效度为0.59,对训练成绩的预测效度为0.42;曲线类型对MMPI多个分量表得分的区分效度达到显着水平.结论:IWCT初步测试结果各指标符合心理测量学要求,达到了测量智力工作特征测验的编制构想.

郑书娴[10]2010年在《一般能力倾向成套测验(GATB)在大学生中的应用研究》文中进行了进一步梳理一般能力倾向成套测验(General Aptitude Test Battery,简称GATB)是美国劳工部编制,分析归纳确定了9种与职业关系密切并有代表性的能力因素,主要用于人才选拔与安置。本研究以386名在校大学生为被试,团体施测GATB,旨在了解GATB的信度、效度及其在国内大学生群体中的适用性,考察我国大学生能力倾向现状,及其与大学生就业状况的关系。研究表明:(1)GATB各分测验重测信度系数为0.634-0.889(p<0.01),信度良好。探索性因素分析共提取叁个因子,累计解释变异量为54.983%,这叁个因子分别为:认知能力、知觉能力、运动能力。验证性因素分析证明模型拟合较好,表明测验的结构效度较好;(2)大学生组与全国高中生常模组相比,园内打点、记号记入两项分测验的得分并无显着差异;形状相配测验、计算测验、词义测验和句子完成测验这四项分测验上,大学生组的得分显着低于高中生常模组;名称比较测验、图案相配测验、平面图判断测验、立体图判断测验、算术应用测验上这五项分测验测上,大学生组的得分显着高于高中生常模组;(3)不同性别、年级、专业、职业兴趣的大学生,在GATB测验得分上有显着差异;(4)GATB与大学生就业状况密切相关。

参考文献:

[1]. 多项能力倾向测验的初步编制[D]. 王进礼. 中南大学. 2003

[2]. 3~4年级言语学习能力倾向测验的初步编制[D]. 石梦良. 湖南师范大学. 2006

[3]. 多项能力倾向测验的初步编制[J]. 王进礼, 龚耀先. 中国临床心理学杂志. 2004

[4]. 《军人一般能力测验》量表的编订及应用[D]. 康麒. 第四军医大学. 2015

[5]. 学习能力倾向测验与多重成就测验在学业低成就筛查中的联合应用研究[J]. 张恺郎. 教育测量与评价(理论版). 2010

[6]. 小学低年级数学成就测验的初步编制[D]. 刘丽娟. 湖南师范大学. 2004

[7]. 基于项目反应理论的应征公民词汇理解能力测验的初步编制[D]. 王轶君. 第四军医大学. 2008

[8]. 基于项目反应理论的应征公民数学推理测验项目的初步编制[D]. 孙菡. 第四军医大学. 2007

[9]. 武警用智力工作特征测验的初步编制[J]. 王进礼, 张月娟. 第四军医大学学报. 2006

[10]. 一般能力倾向成套测验(GATB)在大学生中的应用研究[D]. 郑书娴. 苏州大学. 2010

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

多项能力倾向测验的初步编制
下载Doc文档

猜你喜欢