导图社区 心理测量学 2-1.误差及项目分析
心理测量学 2-1.误差及项目分析,经典测量理论的评价:① 直观易懂,计算简便,容易推广② 理论假设较弱,对实施条件要求不严格,适用性广... ...
编辑于2023-06-21 09:05:36 山东省经典测量理论
一、误差及理论模型
1、可测性假设
桑代克:凡客观存在的事物都有其数量
麦克考:凡有数量的东西都可以测量
2、心理测量的误差
含义
测量中与测量目的无关的变化因素
不准确(效度低)或不一致(信度低)
分类
随机误差
由与测量目的无关的偶然因素引起,影响信效度
系统误差
由与测量目的无关的变形引起的一种恒定而有规律的效应,影响效度
来源及控制
① 测量工具方面
来源:心理测量量表是否稳定、是否真正测到我们所要测的东西
控制:提高编制测验的科学性
② 被测对象方面
来源:受测者的真正水平是否得到正常发挥
控制:主试和被试相互配合及规范操作
③ 施测过程方面
来源:偶然因素
控制:条件相同、客观评分、标准化解释
3、CTT数学模型
基本概念
观察分数(X)
实测分数
真分数(T)
无数次测量的平均值
误差分数(E)
随机误差
模型
假设公理
① 多次测量观察分数的平均值接近真分数:
② 真分数和误差分数之间的相关为零:
③ 各平行测量上的误差分数之间相关为零:
④ 测量误差是完全随机的,并服从均值为零的正态分布
4、导出公式
二、项目分析
难度
1、含义
测验项目的难易程度,用通过率(P)表示,P值越大,题目越容易
2、计算
① 二分法计分的项目
1° 通过率
2° 极端分组法
② 非二分法计分的项目
③ 选择题的猜测校正
1° 全体被试在某个项目上的通过率的校正
2° 某个被试参加多个项目组成的测验的测验分数的校正
3、难度水平的确定
① 常模参照测验
控制在0.50左右
② 标准参照测验和掌握测验
可不考虑难度
③ 选拔和录用测验
控制在录取率左右
④ 选择题
大于猜测概率
⑤ 速度测验
控制在0.50左右
⑥ 人格、态度、心理健康等测验
不需要难度
4、难度对测验的影响
影响测验分数的分布形态
① 难度较大
通过率低
正偏态
适合于筛选性测验
② 难度较小
通过率高
负偏态
适合于达标性检测
③ 难度中等
正态分布
影响测验分数的离散程度和信度
① 过难或过易的测验使信度降低
② 难度在0.50左右为最佳,以集中在两端为最差
5、难度的等距转换
可以将难度转换为Z分数
区分度
1、含义
测验项目对被试心理品质水平差异的区分能力或鉴别能力
2、计算
① 项目鉴别指数法
鉴别指数D值越高,区分度越高,即项目越有效
② 相关法
以项目分数与效标分数或测验总分的相关作为项目区分度的指标
相关越高,项目的区分度越高
③ 方差法
被试在某一项目上的得分方差越高,项目区分度越高
3、区分度的相对性
① 不同计算方法所得区分度不同
② 样本容量大小影响相关法计算区分度
样本容量越小,其统计值越不可靠
③ 分组标准影响鉴别指数
分组越极端,其D值越大
④ 被试样本的同质性程度影响区分度
被试团体越同质,区分度值越小
4、与难度的关系
① 难度越接近0.5,区分度越大
② 难度越接近1.0或0,区分度越小
③ 最理想的情况:P=0.5,D=0.4
题目的综合分析和筛选
1、看区分度
2、看难度(0.35~0.65)
3、选项分析
4、分析原因,酌情修改
三、经典测量理论的评价
优点
① 直观易懂,计算简便,容易推广
② 理论假设较弱,对实施条件要求不严格,适用性广
③ 测验结果可信
缺点
① 对信度的估计精度不高,平行测验难以实现
② 难以精确计算个体被试的独立误差
③ 各种参数的估计对样本抽样的依赖性太大
④ 参数指标之间的配套性较差,与被试水平参数之间关系模糊
⑤ 真分数与观察分数之间存在线性关系的假定不合理
⑥ 不太适合标准参照测验
经典测量理论
一、误差及理论模型
1、可测性假设
桑代克:凡客观存在的事物都有其数量
麦克考:凡有数量的东西都可以测量
2、心理测量的误差
含义
测量中与测量目的无关的变化因素
不准确(效度低)或不一致(信度低)
分类
随机误差
由与测量目的无关的偶然因素引起,影响信效度
系统误差
由与测量目的无关的变形引起的一种恒定而有规律的效应,影响效度
来源及控制
① 测量工具方面
来源:心理测量量表是否稳定、是否真正测到我们所要测的东西
控制:提高编制测验的科学性
② 被测对象方面
来源:受测者的真正水平是否得到正常发挥
控制:主试和被试相互配合及规范操作
③ 施测过程方面
来源:偶然因素
控制:条件相同、客观评分、标准化解释
3、CTT数学模型
基本概念
观察分数(X)
实测分数
真分数(T)
无数次测量的平均值
误差分数(E)
随机误差
模型
假设公理
① 多次测量观察分数的平均值接近真分数:
② 真分数和误差分数之间的相关为零:
③ 各平行测量上的误差分数之间相关为零:
④ 测量误差是完全随机的,并服从均值为零的正态分布
4、导出公式
二、项目分析
难度
1、含义
测验项目的难易程度,用通过率(P)表示,P值越大,题目越容易
2、计算
① 二分法计分的项目
1° 通过率
2° 极端分组法
② 非二分法计分的项目
③ 选择题的猜测校正
1° 全体被试在某个项目上的通过率的校正
2° 某个被试参加多个项目组成的测验的测验分数的校正
3、难度水平的确定
① 常模参照测验
控制在0.50左右
② 标准参照测验和掌握测验
可不考虑难度
③ 选拔和录用测验
控制在录取率左右
④ 选择题
大于猜测概率
⑤ 速度测验
控制在0.50左右
⑥ 人格、态度、心理健康等测验
不需要难度
4、难度对测验的影响
影响测验分数的分布形态
① 难度较大
通过率低
正偏态
适合于筛选性测验
② 难度较小
通过率高
负偏态
适合于达标性检测
③ 难度中等
正态分布
影响测验分数的离散程度和信度
① 过难或过易的测验使信度降低
② 难度在0.50左右为最佳,以集中在两端为最差
5、难度的等距转换
可以将难度转换为Z分数
区分度
1、含义
测验项目对被试心理品质水平差异的区分能力或鉴别能力
2、计算
① 项目鉴别指数法
鉴别指数D值越高,区分度越高,即项目越有效
② 相关法
以项目分数与效标分数或测验总分的相关作为项目区分度的指标
相关越高,项目的区分度越高
③ 方差法
被试在某一项目上的得分方差越高,项目区分度越高
3、区分度的相对性
① 不同计算方法所得区分度不同
② 样本容量大小影响相关法计算区分度
样本容量越小,其统计值越不可靠
③ 分组标准影响鉴别指数
分组越极端,其D值越大
④ 被试样本的同质性程度影响区分度
被试团体越同质,区分度值越小
4、与难度的关系
① 难度越接近0.5,区分度越大
② 难度越接近1.0或0,区分度越小
③ 最理想的情况:P=0.5,D=0.4
题目的综合分析和筛选
1、看区分度
2、看难度(0.35~0.65)
3、选项分析
4、分析原因,酌情修改
三、经典测量理论的评价
优点
① 直观易懂,计算简便,容易推广
② 理论假设较弱,对实施条件要求不严格,适用性广
③ 测验结果可信
缺点
① 对信度的估计精度不高,平行测验难以实现
② 难以精确计算个体被试的独立误差
③ 各种参数的估计对样本抽样的依赖性太大
④ 参数指标之间的配套性较差,与被试水平参数之间关系模糊
⑤ 真分数与观察分数之间存在线性关系的假定不合理
⑥ 不太适合标准参照测验