导图社区 心理测量学2-2.信度
心理测量学2-2.信度,测量结果的稳定性程度、一致性程度,也叫测量的可靠性,分为重测信度、复本信度、分半信度、同质性信度、评分者信度。
编辑于2023-06-21 09:06:00 山东省信度
一、定义
1、测量结果的稳定性程度、一致性程度,也叫测量的可靠性
2、真分数变异与观察分数变异之比
3、真分数与观察分数的相关系数的平方
4、两个平行测验间的相关系数
二、估计方法
1、重测信度
① 含义
同一个测验,同一组被式,前后两次施测所得结果的一致性程度,又称稳定性系数
其大小等于两次测验分数之间的相关系数,估计测验跨时间的一致性
② 计算
皮尔逊积差相关
③ 条件
1° 所测特质需稳定
2° 遗忘和练习的效果相互抵消
3° 两次施测之间被试没有获得更多的学习和训练
④ 误差来源
时间间隔
⑤ 评价
优点
能提供测验结果是否随时间而变化的资料
可作为预测受测者将来行为表现的依据
缺点
易受练习和记忆的影响
只适用于测量不会随时间变化而改变的特质
2、复本信度
① 含义
1° 两个平行的测验对同一组被试进行施测所得结果的一致性程度
2° 若两个副本是同时连续施测的,称其为等值性系数
3° 相距一段时间分别施测的称其为稳定性与等值性系数
4° 大小等于两个副本测验分数之间的相关系数,跨时间和形式的一致性
② 计算
皮尔逊积差相关
③ 条件
1° 能够构造出两份及以上的真正的平行测验
2° 被试要有条件接受两个测验
④ 误差来源
题目内容
时间间隔
⑤ 评价
优点
应用范围广
缺点
严格的平行测验很难构造
容易受练习、记忆和迁移的影响
3、分半信度
① 含义
将一个测验分成对等的两半后,所有被试在这两半测验上所得分数的一致性程度
估计跨两个分半测验间的一致性
② 计算
1° 斯皮尔曼-布朗公式
2° 弗朗那根公式
3° 卢仑公式
③ 条件
1° 在只能施测一次或没有复本的情况下使用
2° 测验无法分半时不能用
④ 误差来源
题目本身
⑤ 评价
优点
可以在没有副本的条件下使用
缺点
有些题目难以分半,不适合用于速度测验
4、同质性信度
① 含义
测验内容所有题目间的一致性,也称内部一致性系数,包括:
1° 所有题目测的都是同一种心理特质
2° 所有题目得分之间都具有较强的正相关
估计测验跨项目的一致性
② 计算
计算两半分数之间的积差相关系数,但需要矫正:
1° 克隆巴赫α系数
2° 库德里查逊公式20(K-R20)
只适合(0,1)计分
3° 库德里查逊公式21(K-R21)
③ 条件
在提出或验证某种心理学理论的概念和假设时
④ 误差来源
题目内容
所研究行为的异质性
⑤ 评价
优点
只施测一次,可以排除练习和记忆的效果
只适合单一概念的测验
5、评分者信度
① 含义
多个评分者给同一批人的答卷进行评分的一致性程度
估计测验跨评分者的一致性
② 计算
1° 评分者人数为2个时
积差相关或等级相关
2° 评分者人数为3~20个时
肯德尔W系数
3° 被评对象人数多于7个时
卡方检验
③ 条件
适用于无法完全客观积分的测验
④ 误差来源
评分者之间的差异
⑤ 评价
优点
适合无法客观积分的测验
缺点
容易受到评分者主观判断的影响
三、影响因素及改进方法
1、主试方面
影响因素
① 施测者不按规定施测
② 评分者评分标准掌握不一
改进方法
主试严格执行施测过程,评分者严格按标准给分
2、被试方面
影响因素
① 被试心理特质水平的稳定性
② 团体同质性越大,全体得分分布越窄,信度越小,可能低估信度
③ 团体均分过高或过低都会使得分分布变窄,而低估真正信度
改进方法
选取恰当的被试团体
3、测量工具方面
影响因素
① 测量工具是否稳定
② 试题的取样、难度、同质性
③ 测验长度
改进方法
适当增加测验长度,使所有题目难度接近正态分布
4、施测过程方面
影响因素
① 安静、光线、通风
② 两次测验间隔的时间越短信度越高
改进方法
减少无关因素的干扰
四、作用
1、随机误差大小的反映
2、解释个人测验分数的意义
3、不同测验分数的比较
信度
一、定义
1、测量结果的稳定性程度、一致性程度,也叫测量的可靠性
2、真分数变异与观察分数变异之比
3、真分数与观察分数的相关系数的平方
4、两个平行测验间的相关系数
二、估计方法
1、重测信度
① 含义
同一个测验,同一组被式,前后两次施测所得结果的一致性程度,又称稳定性系数
其大小等于两次测验分数之间的相关系数,估计测验跨时间的一致性
② 计算
皮尔逊积差相关
③ 条件
1° 所测特质需稳定
2° 遗忘和练习的效果相互抵消
3° 两次施测之间被试没有获得更多的学习和训练
④ 误差来源
时间间隔
⑤ 评价
优点
能提供测验结果是否随时间而变化的资料
可作为预测受测者将来行为表现的依据
缺点
易受练习和记忆的影响
只适用于测量不会随时间变化而改变的特质
2、复本信度
① 含义
1° 两个平行的测验对同一组被试进行施测所得结果的一致性程度
2° 若两个副本是同时连续施测的,称其为等值性系数
3° 相距一段时间分别施测的称其为稳定性与等值性系数
4° 大小等于两个副本测验分数之间的相关系数,跨时间和形式的一致性
② 计算
皮尔逊积差相关
③ 条件
1° 能够构造出两份及以上的真正的平行测验
2° 被试要有条件接受两个测验
④ 误差来源
题目内容
时间间隔
⑤ 评价
优点
应用范围广
缺点
严格的平行测验很难构造
容易受练习、记忆和迁移的影响
3、分半信度
① 含义
将一个测验分成对等的两半后,所有被试在这两半测验上所得分数的一致性程度
估计跨两个分半测验间的一致性
② 计算
1° 斯皮尔曼-布朗公式
2° 弗朗那根公式
3° 卢仑公式
③ 条件
1° 在只能施测一次或没有复本的情况下使用
2° 测验无法分半时不能用
④ 误差来源
题目本身
⑤ 评价
优点
可以在没有副本的条件下使用
缺点
有些题目难以分半,不适合用于速度测验
4、同质性信度
① 含义
测验内容所有题目间的一致性,也称内部一致性系数,包括:
1° 所有题目测的都是同一种心理特质
2° 所有题目得分之间都具有较强的正相关
估计测验跨项目的一致性
② 计算
计算两半分数之间的积差相关系数,但需要矫正:
1° 克隆巴赫α系数
2° 库德里查逊公式20(K-R20)
只适合(0,1)计分
3° 库德里查逊公式21(K-R21)
③ 条件
在提出或验证某种心理学理论的概念和假设时
④ 误差来源
题目内容
所研究行为的异质性
⑤ 评价
优点
只施测一次,可以排除练习和记忆的效果
只适合单一概念的测验
5、评分者信度
① 含义
多个评分者给同一批人的答卷进行评分的一致性程度
估计测验跨评分者的一致性
② 计算
1° 评分者人数为2个时
积差相关或等级相关
2° 评分者人数为3~20个时
肯德尔W系数
3° 被评对象人数多于7个时
卡方检验
③ 条件
适用于无法完全客观积分的测验
④ 误差来源
评分者之间的差异
⑤ 评价
优点
适合无法客观积分的测验
缺点
容易受到评分者主观判断的影响
三、影响因素及改进方法
1、主试方面
影响因素
① 施测者不按规定施测
② 评分者评分标准掌握不一
改进方法
主试严格执行施测过程,评分者严格按标准给分
2、被试方面
影响因素
① 被试心理特质水平的稳定性
② 团体同质性越大,全体得分分布越窄,信度越小,可能低估信度
③ 团体均分过高或过低都会使得分分布变窄,而低估真正信度
改进方法
选取恰当的被试团体
3、测量工具方面
影响因素
① 测量工具是否稳定
② 试题的取样、难度、同质性
③ 测验长度
改进方法
适当增加测验长度,使所有题目难度接近正态分布
4、施测过程方面
影响因素
① 安静、光线、通风
② 两次测验间隔的时间越短信度越高
改进方法
减少无关因素的干扰
四、作用
1、随机误差大小的反映
2、解释个人测验分数的意义
3、不同测验分数的比较