导图社区 测量假设
经典测量理论 “经典测量理论亦称“真分数理论”。2O 世纪初提出,至 50 年代臻于完善。该理论假设观测分数 X 是由真分数 T 及随机测量误差 E 所组成,即 X= T+ E;误差 E 的平均数等于 0;误差 E 与真分数 T 间的相关为 0。
常模是一种供比较的标准量数,由标准化样本测试结果计算而来,即某一标准化样本的平均数和标准差。它是人才测评用于比较和解释测验结果时的参照分数标准。测验分数必须与某种标准比较,才能显示出它所代表的意义。
确定测验目的:明确测量对象(明确测验哪些个体或团体);确定测量目标(测何种心理特质);明确测量用途(用于心理诊断还是选拔人才);
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
经典测量理论
CTT
心理特质及其可测性假设
桑代克凡客观存在的事物都有其数量
麦克考凡有数量的东西都可以测量
心理特质是一种客观存在
测量误差
含义
在测量过程中由那些与测量目的无关的变化因素所产生的不准确或不一致的测量效应
类型
系统误差
恒定有规律
准确性
随机误差
偶然因素引起
稳定性
来源及控制
测量工具
测量对象
实施内容
避免误差的方式
CTT数学模型
基本概念
观察分数(X):实测分数
真分数(T):真实水平
误差分数(E):随机误差
模型
X=T+E
假设公式
Σ(X)=T或 Σ(E)=0
测量足够多次,观察分数平均值会接近于真分数
ρ(T,E)=0
真分数和误差分数的相关为零
ρ(E1,E2)=0
各平行测量上的误差分数之间相关为零
结论
真分数不变
观察分数与真分数之间是线性关系
随机误差服从均值为0的正态分布
导出公式
Sv与测量目的有关的变异
Si 与测量目的无关来源的变异数
信度
测验结果的稳定性、一致性程度,测量的可靠性
等价
真分数变异与观察分数变异之比
随机误差的变异
真分数与观察分数的相关系数的平方
两个平行测验间的相关系数
估计方法
重测信度
同一测验,对同一组被试,前后施测两次的结果的一致性程度
计算
皮尔逊积差相关
条件
特质稳定
遗忘和练习相抵消
中间无学习
误差来源
时间
评价
能提供结果是否随时间而改变的资料用于预测
受练习和记忆的影响
复本信度
两个平行测验,对同一组被试施测所得结果的一致性程度
有平行测验
被试接受
测验的等值性系数
间隔施测的稳定性与等值性系数
应用广
难平行
练习和记忆影响
难度变
分半信度
一个测验分为两半,所有被试在两半测验上所得结果的一致性程度
测一次,无复本
无法分半不能用
内容
测一次无复本
难分半
分半方法差异
不适合速度测验
同质性信度
测验内部所有题目间的一致性程度
题目测量统一特质
K:题目的数目
Si² 每一道题的方差
S²x 测验总方差
取决于测验目的
非所有测验要求同质性信度高,
取样内容
所研究行为的异质性
测一次
只适用测单一特质的测验
评分者信度
多个评分者对同一批人进行评分的一致性程度
无法客观计分的测验
评分者
无法客观计分
受评分者主影响
影响因素
主试
被试
团体同质高,容易低估
测验长度
施测过程
作用
反映随机误差的大小
解释个人分数的意义
比较不同测验分数
区分度
测验项目对被试心理品质的区分或鉴别能力,用D表示
项目鉴别指数
相关法
点二列相关
二列相关
φ相关
积差相关
方差法
被试在某一项目上的得分越分散,即方差越大,则该项目鉴别力越大
相对性
不同计算方法,所得区分度不同
样本容量越小,D值越不可靠
分组越极端,D值越大
团体越同质,D值越小
关系 1、难度越接近0.5,项目潜在的区分度越大 2、难度越接近0或1,项目潜在区分度越小 3、项目的难度分布广一些,梯度大一些 平均难度在0.5左右,整个测验难度呈正态 区分度较好
难度
测验项目的难易程度,用通过率(P)表示
二分法
通过率
P=R/N
极端分组法
较多人时使用
P=(PH+PL)/2
成绩最高的27% 高分组 成绩最低的27%低分组 PH:高分组通过率 PL:低分组通过率
非二分法
选择题的猜测校正
全体被试在某个项目上的通过率的矫正
K 选项数量 P原通过率
某个被试在多个项目组成的测验的测验分数的矫正
R:答对的项目数 W:答错的项目数 K:选项数
难度水平的确定
项目难度水平的确定取决于测验的目的和性质
常模参照测验,难度接近0.5区分个体差异
标准参照测验和掌握测验,不考虑难度
选拔和录用,难度控制在录取率左右
选择题,难度应大于猜测概率
速度测验难度接近且不宜过高,0.5左右
人格、态度、心理健康等测验不需要难度
难度对测验的影响
影响测验分数的分布形态
一般能力测验和成就测验的平均难度0.5
难度较大呈正偏态
难度小呈负偏态
中等,正态
影响测验分数的离散程度和信度
过难或过易会使测验分数相对集中在低分端或高分端,从而分数的全距缩小,信度降低 0.5最佳,集中在两端最差
效度
定义
测验能测出目标心理特质的程度。等于一组测验分数中与测验目的有关的变异与实得变异之比
r²是效度 r是效度系数
内容效度
用途
成就测验
确定方法
逻辑分析
专家评定法
明确范围
双向信度表
评定量表
统计
克隆巴赫
再测
内容效度比
经验
结构效度
人格测验
智力测验
测验内法
分析被试答题过程
克隆巴赫α系数
测验间法
相容效度法
区分效度法
实证效度法
多质多法矩阵(MTMM)
因素分析法
实证效度(校标关联效度)
一个测验对处于特定情境中的个体行为进行估计的有效性
诊断现状
预测未来行为
区分法
预期表法
命中率及基础率、灵敏率、确认率
功利率法
校标
衡量一个测验是否有效的外在标准
学业成就
等级评定
临床诊断
工作表现
r(nx)y为长度相当于原测验n倍的效度
测验信度与校标选取
通过测验分数对效标分数进行预测
关系 1、信度高是效度高的必要而非充分条件 2、测验效度受它的信度制约,信度系数的平方根是效度系数的最高限度
题目的综合分析和筛选
看区分度 0.3以上
看难度 0.35-0.65
选项分析
分析原因,酌情修改