导图社区 测量信度
心理测量学课本笔记总结,从信度的估计方法、分半信度、同质性信度、评分者信度等方面进行了概述和分析,可收藏。
一张思维导图带你了解社会政策的知识内容,包含社会政策与人的需要、社会问题与社会政策、社会政策的特点、目标及功能。
本图汇总了社会医学中社会文化的知识点,包含文化的概念、文化的构成、文化的特征、文化对健康的影响等,希望梳理的内容对你有所帮助!
这是一篇关于测验项目分析的思维导图,讲述了测验项目的难度、测验项目区分度、猜测问题与猜测率、多重选择题的项目分析等。
社区模板帮助中心,点此进入>>
妈妈必读:一张0-1岁孩子认知发展的精确时间表
英语词性
法理
刑法总则
【华政插班生】文学常识-先秦
【华政插班生】文学常识-秦汉
文学常识:魏晋南北朝
【华政插班生】文学常识-隋唐五代
民法分论
日语高考動詞の活用
测量信度
信度概述
信度概念
测量结果的稳定性程度。也是一致性,可靠性。
信度系数
描述测量信度的数量指标,以相关系数来表示
信度指数
信度系数的平方根
信度定义
1、信度(信度系数)是一个被测团体的真分数的变异数与实得分数的变异数之比, 即 rXY = S2T /S2X
2、信度是一个被试团体的真分数与实得分数的相关系数的平方, 即 rXY =ρ2xT
理论意义
3、信度是一个测验x(A卷)与它的任意一个“平行测验”x’(B卷)的相关系数, 即 rXY =ρxx’
实际意义
信度作用
1、信度是测量过程中所存在的随机误差大小的反映
标准误:每个人两次测量的分数之差可以构成一个新的分布,这个分布的标准差就是测量的标准误
公式: SE=SX√1-rxx’ (SE是标准误,SX是实得分标准差,rxx’ 是信度)
2、信度可以用来解释个人测验分数的意义
3、信度有助于不同测验分数的比较
信度的估计方法
重测信度
含义:用同一个量表对同一组被试施测两次所得结果的一致性程度。其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数
公式:x:第一次测量的实得分数;x-实得分数的平均值;y:第二次测量的实得分数;y-实得分数的平均值,rXY是重测信度。
前提条件
1、所测量的心理特质必须是稳定的,成年人和小孩
2、遗忘和练习的效果基本上相互抵消,第一次和第二次测验需要有间隔时间
3、在两次实测的间隔期内,被试在所要测查的心理特质方面没有获得更多的学习和训练
优缺点
能提供测验结果是否随时间而变化的资料,可作为预测被试特定行为的依据。
易受练习和记忆的影响
意义
反应的是在测验时间上的等值性
适用于速度测验与人格测验,不适用于难度测验
复本信度
含义:指两个平行的测验测量同一批被试所得结果的一致性程度。其大小等于同一批被试在两个副本测验上所得分数的皮尔逊积差相关系数。(同上面)
等值性系数:两个复本测验是同时连续施测的。
稳定性与等值性系数:两个复本测验相距一段时间分两次施测。
平衡设计:为低效施测的顺序效应,随机地选出一半被试先做A卷后再做B卷,另一半被试先做B卷再做A卷。
首先要构造出两份或两份以上真正平行的测验(即A、B卷)
被试要有条件接受两个测验
代表性强,信度准,避免练习、记忆效应
编制复本难,影响积极性,被试容易触类旁通
反应的是在测验内容上的等值性
内部一致性信度
含义:指的是测验内容的一致性或测验内部所有题目的一致性程度,又称同质性信度
方法:估计同质性信度的方法——分半法、库德-理查逊方法、α系数
分半信度
含义:将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。
拓展:由于描述的是两半题目间的一致性,所以有时也称内部一致性系数。
公式
方法与复本信度的类似,但是被试在两半测验上的得分的相关系数只是半个测验的信度,所以还要用斯皮尔曼-布朗公式矫正:
是两个分数间的相关系数
是整个测验的信度值
上式只有在两半测验分数的变异数(即总体方差)相等时才能使用,否则,就用弗朗那根公式或卢伦公式
表示所有被试在两半测验上的得分的变异数
表示全体被试在整个测验上总得分的变异数
表示同一组被试在两半测验上得分之差的变异数,其他与上式相同
在只能施测一次或没有复本的情况下使用
当一个测验无法分成对等的两半时,不宜使用
常用的分半方法有奇偶分半、按题目难度分半等——因此,同一个测验会有多个分半信度
速度测验不适合分半信度
同质性信度
定义:也叫做内部一致性系数,是指测验内部所有题目间的一致性程度。
一致性
所有题目测的都是同一种心理特质
所有题目得分之间都具有较高的正相关
当一个测验具有较高的同质性信度时,说明测验主要测的是某一单个心理特质,实验结果就是该特质水平的反映。如果不高,则说明是几种心理特质的综合反映;所以结果不好解释。一种好办的方法就是把一个异质的测验分解成多个具有同质性的测验,再根据被试在分测验上的得分分别做出解释。
注意
同质性高才是测验测的单一特质的充分条件。即一些表面上看起来是测量同一种心理特质的题目,如果其题目间不具有较高的正相关,则不能认为它们具有同质性。
目的:判断一个测验能否测到单一特质,以及估计所测到特质的一致性程度
是所有被试在第i题上的方差
是测验总分的方差,K代表题目数
评分者信度
定义:多个评分者给同一批人的答卷进行评分的一致性程度
当评分者人数多于两个时,评分者信度可用肯德尔和谐系数进行估计
K是评分者人数,N是被评的对象数
是第i个被评对象的水平等级之和
若评分中有相同等级出现
n为相同等级的个数
提高测量信度的方法
影响因素
1、被试方面
①单个被试--身心健康状况、应试动机、注意力、耐心、求胜心、态度
②被试团体--整个团体内部水平的离散程度以及团体的平均水平
2、主试方面;3、施测情境方面;4、测量工具方面;5、两次施测的间隔时间
方法
1、适当增加测验的长度:①新增项目必须与试卷中原有的项目同质 ②新增项目的数量必须适度
2、使测验中所有的试题的难度接近正态分布,并控制在中等水平;3、努力提高测验试题的区分度;4、选取恰当的被试团体;5、主试者要严格执行实测规程,评分者要严格按标准给分。