导图社区 CTT、信度
心理测量学中的经典测验理论(CTT)与测量信度是两个核心概念,它们共同构成了心理测量学的基础框架。以下是对这两个概念的详细阐述。
编辑于2024-11-13 11:42:33经典测验理论(CTT)、测量信度
经典测验理论(CTT)
心理特质及其可测性假设
心理特质
含义:指表现在一个人身上的特有的相对稳定的行为方式,如智力、兴趣、态度、人格等
性质:相对稳定性、抽象性、内隐性、预测性
心理特质的可测性:
心理特质是一种客观存在
桑代克:凡客观存在的事物都有其数量
麦柯尔:凡有其数量的事物都可以测量
测量误差及其来源
心理测量误差的含义
指在测量过程中由那些与测量目的无关的变化因素所引起的一种不准确或不一致的测量效应
测量误差的种类
随机误差:由与测量目的无关的偶然因素引起的而又不易控制的误差,其方向和大小的变化完全是随机的
系统误差:由与测量目的无关的变化因素引起的一种恒定而有规律的效应,其大小何方向都不变
心理测量误差的来源
1.测量工具
心理测量量表不稳定(信度低)
没有真正测到我们想要测的东西(效度低)
2.测量对象
受测者的真正水平未得到正常发挥
3.施测过程
物理环境:施测现场的温度、光线、声音等
施测时间
意外干扰
主试因素
4.评分者
主试效应、被试效应
主试效应:也称为实验者效应,是指主试在实验中可能以某种方式(如表情、手势、语气等)有意无意地影响被试,使他们的反应符合主试的期望,因此,这种效应通常被称为罗森塔尔效应或期望效应
被试效应:也称为霍桑效应,是指由于被试对其被试身份的认知及其态度而产生的实验偏差,简单来说,被试因为受到额外的关注而改变其行为,导致绩效或努力上升的情况
减小测量误差的方法
测量工具:提高测量工具的信度和效度
测量对象:保证施测对象的正常发挥
施测过程:标准化
评分者:统一评分标准
真分数及其有关假设
真分数的含义
把反应被试某种心理特质真正水平的那个值称作该特质的真分数;把实测的分数称作该特质的观察分数
经典测验理论的数学模型及其假设
X=T+E(观察分数=真分数+随机误差分数)
①ε(X)=T或ε(E)=0 观察分数的期望值为真分数,随机误差分数的期望值为0。 真分数的操作定义:无数次测量所得结果的平均值。
②ρ(T,E)=0 真分数与随机误差相互独立
③ρ(E1,E2)=0 各平行测验上的随机误差相互独立
平行测验
如果两个题目不同的测验测得的是同一特质,并且题目形式、数量、难度、区分度以及测验得分的分布都是一致的,则这两个测验被称作彼此平行的测验。 平行测验:用不同的题目测量同样的内容,而且其测验结果的平均值和标准差都相同的两个测验。 严格的平行测验是很难构造出来的。
测量信度
信度概述
信度的定义:信度(reliability)是测量结果的稳定性/可靠性/一致性程度。 对同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。
信度的作用
评价测验质量的重要指标之一
测量过程中所存在的随机误差大小的反映
解释个人测验分数的意义——测量标准误
比较不同测验分数的差异
信度的估计方法
重测信度
含义
重测信度(test-retest reliability)也叫再测信度,是指用同一个测量工具在同样条件下对同一组被试施测两次所得结果的一致性程度,反映了测量工具的结果受到时间间隔因素影响的大小。 最适宜的时距随测验的目的、性质和受测者的特点而异,一般是两周到四周较宜,最好不超过六个月。
评估方法
重测信度的大小可以通过计算测量工具的重测系数或叫稳定性系数来标志。 具体来说,就是求取同一组被试在两次测验上所得分数的皮尔逊积差相关系数。
应用条件
测量工具所测量的个体心理特质在时间上应该是相对稳定的。如:人格测验 测量工具所测量的个体心理特质应该不存在明显的练习效应和遗忘效应,练习和遗忘的效果基本上相互抵消。如:智力测验(6个月) 在两次施测间隔期间不应该进行专门的训练和培训,以保证重测信度反映的是随机因素的影响效应。
复本信度
含义
复本信度是指两个复本测验(平行测验)测量同一批被试所得结果的一致性程度。复本信度的大小通过计算同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。 复本信度反映了由于题目的不同以及时间间隔所导致的测量误差。
评估方法
等值性系数:两个复本测验是同时连续施测;
稳定性与等值性系数/重测复本信度:两个复本测验相距一段时间分两次施测。
顺序效应
自变量的呈现顺序对因变量产生的影响。即当相同的被试接受不同的实验处理时,第一次实验处理对第二次实验处理可能产生的影响。这种影响可能是巨大的,也可能是轻微的,可能是短暂的,也可能是长久的。
平衡设计
通过对实验处理的顺序进行控制,以抵消因实验处理先后顺序而产生的顺序误差的实验设计技术。
应用条件
1)要构造出两份或两份以上真正平行的测验(即A、B卷); 复本测验或平行测验:用不同的题目测量同样的内容而且其测验结果的平均值和标准差都相同的两个测验。 2)被试要有条件接受两个测验。(时间、经费等) 3)应该尽量在测试结果报告中,详尽地说明两次测试的时间间隔、测试顺序安排、测试过程中被试的有关测验经历等。
内部一致性信度
含义
内部一致性信度也叫同质性信度,主要评价了测验各随机组成部分之间是否测量了相同的心理特质,反映了题目内容的抽样一致性程度。
估计方法
分半信度
含义
分半信度是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。 分半信度反映了测验两个随机组成部分的题目是否测量了相同的心理特质。
分半的方法
奇偶分半法
评估方法
斯皮尔曼-布朗公式 弗朗那根公式 卢仑公式
库-理信度
克隆巴赫系数
荷伊特信度
评分者信度
含义
评分者信度是指多个评分者给同一批人的答卷进行评分的一致性程度。 一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。
评估方法
两个评分者:计算这两个评分者给同一批被试的答卷所给分数的相关系数(皮尔逊积差相关或斯皮尔曼等级相关)。
两个以上评分者:采用肯德尔和谐系数进行估计。
提高信度的方法
影响测量信度的因素
被试特征
单个被试
应试动机
测验焦虑
测验经验
练习效应
反应倾向
生理变因
被试团体异质、被试团体平均能力水平
主试特征
施测者
阅卷评分者
施测情境
测量工具
测验长度
测验难度
时间间隔
提高信度的方法
适当增加测验的长度
控制试题的难度分布
努力提高每道题的区分度
选取恰当的被试团体
规范施测过程、统一施测环境
保证被试充裕的作答时间
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题
浮动主题