导图社区 心理测量学框架图
心理测量学的知识内容有心理测量的基础、经典测量理论、项目反应理论、概化理论、心理测验的编制技术、心理测验的实施、测验常模、标准参照测验等。
编辑于2021-08-21 10:04:30心理测量
心理测量的基本理论
一、心理测量的基础
心理测量的基本概念
测量
依据一定的法则,使用量尺对事物的特征进行定量描述的过程。
测量的基本要素
参照点
绝对参照点
反应时
相对参照点
海拔、温度
单位
确定的意义
相等的价值
测量的量表
称名量表
分类
顺序量表
排序
等距量表
+/-
相对零点
比率量表
×/÷
绝对零点
心理测量
根据一定的法则用数字对人的心理特质的行为表现加以确定,即根据一定的心理学理论,使用一定的操作程序,给人的心理特质的行为表现确定出一种数量化的价值
心理测量的特征与分类
特征
间接性
相对性
客观性
理论
心理测验
测量的过程
安娜斯塔西
心理测验实质上是对行为样本的客观和标准化的测量
测量工具
编制心理测验的基本条件
行为样本
总体样本→样本→代表性+一组行为+一定的偏差
代表性行为≠可观测行为
标准化
内容
条件
评分
常模
难度或应答率
信度和效度
信度--可靠性=一致性程度
效度--有效性=代表性程度
心理测验的分类
功能
能力测验
普通能力测验G
特殊能力测验S
韦氏智力测验
成就测验
特定学习结果的测量
高考、四六级
人格测验
卡特尔PF、罗夏克墨迹实验
对象
个别测验
团体测验
第一个团体测验:美国陆军测验
形式
文字测验--纸笔测验
非文字测验
目的
描述性测验
诊断性测验
MMPI
预测性测验
人才选拔(高考)
速度和难度
速度测验
难度测验
要求
最高行为测验
作出最好的回答(正确的答案)
能力测验/学业测验
典型行为测验
习惯方式作出反应
人格测验
性质
构造性测验
被试的任务是明确的
16PF
投射性测验
刺激没有明确的意义,问题模糊
标准化程度
标准化测验
严格遵循测量理论
非标准化测验
教师所使用的自编课堂测验
分数的解释方法
常模参照测验
个体在团队中的相对位置
标准参照测验
对个体作出是否达标或达到什么程度的判断
资格类考试
驾照
医师
律师
心理测量与心理测验的产生与发展
高尔顿
最先倡导测验运动-1883年-《人类才能及其发展的研究》
直接推动心理测验产生的第一人
卡特尔
1890年《心理》杂志上发表--《心理测验与测量》
首次提出“心理测验”
比奈西蒙
第一个智力测验→美国斯坦福推孟教授修订→斯坦福--比内量表
桑代克
1904年--《心理与社会测量导论》,测验理论的第一部著作
第一个标准化的教育成就测验
克雷佩林
人格测验的先驱
1892年最早使用自由联想测验来诊断精神病人
伍德沃斯
1917年,第一现代意义上的人格问卷,即伍德沃斯个人资料调查表
罗夏克
第一个投射测验--罗夏克墨迹测验
二、经典测量理论
心理测量的误差
测量误差
指在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应
包括
1.测量误差是由那些与测量目的无关的变因所致
2.测量误差表现为不准确或不一致两种方式
测量误差的种类
随机误差
测量目的无关的,偶然因素引起的,又不易控制
不一致不准确
系统误差
测量目的无关的,恒定而有规律的效应
一直但不准确
测量 误差的来源
测量工具
测量对象
施测过程
测量误差的控制
目的→计划→编制项目→评分解释
经典测量理论模型(classical testing theory)
心理特质
可测性假设
经典测量理论的数学模型
T-真分数
反映被试某种心理特质真实水平的那个数值
操作定义:无数次测量结果的平均值
X-观察分数
实测的分数作为该特质的观察分数
X=T+E
E为测量误差(随机误差)
3条假设公理
1.观察分数的平均值会接近于真分数,ε(X)=T或ε(E)=0
2.真分数和误差分数之间的相关为0,即ρ(T,E)=0
3.各平行测量上的误差分数之间相关为0,即ρ(E1,E2)=0
说明E是一个随机误差

Se²小,稳定一致

Si²小,准确
测量的信度
测量信度的概述
定义
测量结果的一致性和稳定性程度

两个理论定义(关于T),一个操作定义
作用
1.随机误差大小的反映
2.个人测验分数的意义
测量标准误

真分数T的置信区间

3.不同测验分数的比较
转成标准分数,服从(0,1)的分布,即S=1

信度的作用
信度的估计方法
重测信度
定义
同一个测验,对同一组被试前后两侧施测所得结果的一致性程度
再测信度
稳定性系数
计算方法

误差来源
时间影响
使用条件
3个
注意事项
小幅度的随机变化
不止一个重测信度
人格测验+速度测验
复本信度
定义
两个平行测验测量同一批被试所得结果的一致性程度
同时连续施测
等值性系数
相隔一段时间
稳定性与等值性系数
与其他信度相比,此信度min,对信度最严格的考验
计算方法
皮尔逊积差相关
误差来源
使用条件
AB卷;缩短间隔时间;排除记忆和联系的干扰
局限性
严格的平行测验很难编制出来
分半信度
定义
将一个测验分成对等的两半后,所有被试在这两半上所得的分数的一致性程度
内部一致性系数
计算方法
计算的只是半个测验的信度,需校正
方差齐性
斯皮尔曼-布朗

方差不齐
弗朗那根

卢仑

使用条件
只能施测一次或没有复本的情况下使用;当一个测验无法对等分半时,不能使用
注意事项
同质性信度
定义
内部一致性系数
测验内部所有题目间的一致性程度
所有题目测的都是同一种心理特质
所有题目得分之间具有较高的正相关
计算方法
0-1计分(客观题)
库德-理查逊公式20(KR-20)

库德-理查逊公式21(KR-21)

主观题-客观题
克隆巴赫α系数

注意事项
α值是所有的可能分半信度的平均值,只是测量信度下界的一个估计值。α大,测量信度必高,α值小,不能断定测量信度不高
荷伊特信度
方差分量比来表述内部一致性的方法
计算方法

局限性
测量单一特质的测验
评分者信度
定义
多个评分者给同一批人的答卷进行评分的一致性程度
计算方法
积差相关或斯皮尔曼等级相关
评价者为2人

肯德尔W系数

信度的影响因素
被试因素
主试因素
施测情境
测量工具
试题的数量
试题之间的同质性程度
试题的难度
两次施测的时间间隔
其他知识点


测量的效度
测量效度
一个测验或量表实际能测出其所要测的心理特质的程度
有效性与准确性
是随机误差和系统误差的综合反映
信度与效度的关系
效度高,信度高


效度的估计方法
内容效度
含义
一个测验实际测到的内容与所要测量内容之间的吻合程度
条件
要有定义得完好的内容范围
测验项目应是已界定的内容范围的代表性样本
确定方法
逻辑分析法(专家评定法)
复本法
克隆巴赫--平行测验(A\B卷)
再测法
在被试学习知识前测一次,在学过知识后再测一次,后测成绩>前测成绩,效度高
适用范围
成就测验、职业测验(选拔和分类)√
能力倾向和人格测验×
结构效度
含义
一个测验实际测到所要测量的理论结构或特质的程度,或用心理学上某种概念或特质来解释测验分数的恰当程度
特点
1.结构效度的大小取决于事先假定的心理特质理论
2.实测资料无法证实理论时,不一定表面结构效度不高,maybe是理论假设不成立或其他问题
3.结构效度是通过测量什么、不测量什么的证据累积起来予以确定的,不可能有单一的数量指标来描述结构效度
确定方法
1.测验内部寻找证据(测验内法)
内在一致性系数(克隆巴赫α系数)
2.测验之间寻找证据
a.相容效度法
b.汇聚效度(求同效度)法
同一特质,不同方法
c.区分效度(求异效度)法
不同特质,同一方法
多质多矩阵
d.因素分析法(多元线性回归)
探索性因素分析(EFA)
验证性因素分析(CFA)
多种特质--多种方法矩阵法
MTMM矩阵
考查测验的实证效度法
3.发展水平变化
智力的年龄差异--智力量表
适用范围
智力测验和人格测验√
实证效度(效标关联效度)
含义
一个测验对处于特定情境中个体的行为进行估计的有效性
效标的含义
衡量一个测验是否有效的外在标准
常用效标
学业成就、等级评定、临床诊断、专门的训练成绩、实际的工作表现、对团体的区分能力以及其他现成的有效测验
效标测量要求
相关性
有效性
无污染
客观性
实用性
实证效度的类别(时间差异)
同时效度
诊断现状
预测效度
预测个体将来的行为
确定方法
相关法
区分法
命中率法
正命中率
A/A+B
总命中率
A+D/A+B+C+D
功利率法
收益>成本
基础率、灵敏度、确认度
基础率低,灵敏度高的测验有效
基础率高,确认度高的测验有效
其他效度
表面效度
外行看热闹
合成效度与区别效度
内部效度与外部效度
效度的影响方法
测验的构成
测验的实施过程
被试情况
所选效标的性质
测量的效度
效度的改进方法
通过标准化全面减少各种测量误差
精心编制测验量表,避免出现较大的系统误差
妥善组织测验,控制随机误差
创设标准的应试情境,控制随机误差
选好正确的效标,定好恰当的效标测量,正确地使用有关公式
项目分析
难度
定义
被试完成测验项目任务时所遇到的困难程度,通常用P来表示
难度的计算
二分法计分项目
通过率

两端分组法
人数较多
总分最高的27%和总分最低的27%

非二分法计分项目


难度的校正公式
CP=KP-1/K-1
CP为矫正后的难度
P为矫正前的难度
K为选项的数目
是非题时,K=2
难度的等距化

难度水平的确定
难度范围0.5±0.2
0.3-0.7
0.35-0.65
不考虑难度:效标参照测验和掌握测验
选拔测验:控制录取率
选择题:难度大于猜测概率
防止被试得满分
难度对测验的影响
1.分布状态
难度大:正偏态
难度小:负偏态
区分M、Mo、Md的位置
2.信度
P=0.5,区分度最好=信度最佳
3.鉴别力
P=0.5,鉴别力高;P=1/0,鉴别力低
区分度
定义
被试心理品质水平差异的区分能力或鉴别能力;D表示,D>0,积极区分;D<0,消极区分
取值范围:【-1,1】
区分度的计算
项目鉴别指数法

伊贝尔
0.4+
很好
0.3-0.39
良好,修改会更好
0.2-0.29
尚可,仍需修改
0.2以下
差,需淘汰
相关法
客观题
点二列相关

二列相关


φ相关


主观题
积差相关
皮尔逊积差相关

方差法
S²
得分越分散,即方差越大
区分度的相对性
不同方法,区分值不同
样本容量大小影响相关法区分度值的大小
样本容量越小,其统计值越不可靠
分组标准影响鉴别指数
被试样本的同质性程度影响区分度值的大小
被试团体越同质,即个体之间水平越接近,其题测的区分度值越小
区分度与难度的关系
P=0.5,D最佳
区分度与信度的关系
r随D的提高而提高,且r提高的速度较D的速度快
题目的综合分析和筛选
区分度
难度
人格测验、态度测验和心理健康测验×,保证每个被试理解测题的意思
选项分析
分析异常情况,修改题目
量表的长度
三、项目反应理论
项目反应理论概述
经典测量理论的不足
统计量的样本依赖性
测量分数的测验依赖性
能力与难度量表的不一致性
信度估计的不精确性
测验结果拓宽的优先性
项目反应理论的基本思路
对数学模型的建立和模型中各个参数的 估计
项目反应理论的基本假设
潜在特质空间的单维性假设
局部独立性假设
项目特征曲线(ICC)假设
项目特征曲线与项目特征函数
c是猜测参数
b是难度
a是区分度
模型
单参数模型
只有b
难度一致,不能猜
双参数模型
c=0
不能猜
三参数模型
符合实际情况
函数
项目信息函数
每个项目对每个被试进行评价时所提供信息的大小
计算出来的值叫项目信息量
项目信息量↑,测量误差↓
图形的高度,由a、c决定
位置,由难度b影响
影响因素
区分度a,提高作用
猜测率c,降低作用
测验信息函数
测验和项目信息函数的性质
项目反应理论的优点
项目反应理论的应用
四、概化理论
测验情境关系说
测量目标
测量侧面
随机侧面
固定侧面
方差分量的估计
概化系数与可靠性指数
概化系数
常模参照测验
相对误差
可靠性指数
目标参照测验
绝对误差
G研究与D研究
G研究——在观察域上收集数据
又称:分析研究
D研究——根据G研究的结果来做出决策
又称:决策研究
心理测验及其应用
一、心理测验的编制技术
测验编制的基本程序
确认测验目的
制定编题计划
编辑测验项目(题目编制技术)
预测与项目分析
合成测验
测验的标准化
鉴定测验
编写测验说明书
测验目标与双向细目表
测验目标
命题双向细目表
优点
避免盲目性,而有计划性
把握试题的比重和分量
提高内容效度,克服专家评定法的一些不足
题目编制技术
题目编制的一般原则
测题的种类及编制
固定应答型题目
自由应答型题目
测验标准化
内容标准化
施测标准化
评分标准化
建立常模
为了能标准化地解释测验分数,常模分数是使用测验的人来解释被试分数的唯一依据
测验等值技术
测验等值的含义
通过对考核同一心理品质的多个测验形式做出测量分数系统转换,使得这些不同测验形式的测验分数之间有可比性
测验等值的条件
同质性
等信度
公平性
可递推性
对称性
样本不变性
测验等值的一些基本概念和专用技术名词
测验等值关系计算的基本方法
等百分位等值
线性等值
测验等值结果的表示方法
表列法
公式法
图示法
测验等值的一般步骤
二、心理测验的实施
测验的设计
施测的程序和步骤
测验的实施过程
测验分数的解释
解释测验分数意义需遵循的原则
向受测者报告测验分数应遵循的原则
三、测验常模
分数转换和合成
分数转换
分数转换
原始分数
导出分数
含义
常见的导出分数
百分等级
瑞文的高级推理
标准分数
Z分数
标准分数的变式
T分数
MMPI
标准九分数
非线性转换
标准十分数
16PF
CEEB分数
分数的合成
含义和种类
合成方法
临床诊断
主观
加权求和
客观
相互代偿作用
多重回归
多重划分
连续栅栏法
飞行员选拔
常模与常模团体
常模
常模团体
含义
确定常模团体的注意事项
呈现常模的方法
转化表
剖析图
常模的编制
子主题
子主题
子主题
几种常用的常模
组内常模
百分等级常模
标准分数常模
发展常模
智力年龄
年级常模
发展顺序量表
发展商数
四、标准参照测验
标准参照测验的定义与作用
目标参照测验
题目分析
内容范围的确定
内容效度分析
专家评定法
如填写内容评定表、五级量表
测验的预测
前测-后测方法
已接受教学组-未接受教学组方法
对照组方法:即由教师评定是否掌握知识的两组
难度的分析
区分度分析
难度差值
相关系数
信度与效度
信度
分类一致性信度
P=(a+d)/N
荷伊特信度
方差分析法,不需考虑分解点问题
效度
内容效度
效标关联效度(决策效度)
标准参照分数
内容参照分数
掌握分数
正确百分数
内容标准分数
等级评定量表
结果参照分数
期望结果的概率
预期的效标分数
分数解释
专家判定法
Nedelsky法
客观
Angoff法
客观+主观
效标组预测法
临界组法
对照组法
五、常用的心理测验
成就测验
含义
对个体在一阶段的学习或训练之后知识、技能的发展水平的测定,也称学绩测验
一般是团体测验
属于最高行为测验
标准化
命题组卷标准
施测的标准化
评分的标准化
测验分数解释标准化
编制步骤
确定测验目的,选定测验编制方法
分析测量目标,拟定测验编制计划
编题征题与选题组卷
调查测验质量参数,编制测验常模
编写测验指导书,正式出版发行
智力测验
定义
指在一定条件下,使用特定的标准化测验量表对被试施加刺激,从被试的反应中测量其智力的高低
个体智力测验
比内量表
比内--西蒙量表
世界上第一个智力量表
智力年龄来评估个体智力
斯坦福--比内量表
首次引入比率智商的概念
1960年,引入离差智商
IQ=100+6Z
2003年,IQ=100+15Z
中国比内量表
韦克斯勒智力测验
韦氏成人智力量表
WAIS-R
16-74岁成人
6个言语量表+5个操作量表
韦氏儿童智力量表
WISC
1949年,采用离差智商代替比率智商
6-16岁儿童
韦氏幼儿智力量表
WPPSI
4-6.5岁儿童
考夫曼量表
儿童成套评价
2.5-12.5岁
青少年和成人智力测验
11岁以上
麦卡锡幼儿智能测验
2.5-8.5岁
5个量表18个测验
伍德科克--约翰逊认知能力测验
DN认知评价系统(CAS)
PASS理论
P-计划性
A-注意性
S-同时性加工
S-继时性加工
团体智力测验
陆军测验
陆军甲种
世界上第一个团体智力测验
陆军乙种
非文字测验
瑞文推理测验
瑞文渐进图阵
百分等级表示
非文字型的图形测验
跨文化的公平性
标准
5.5岁+
中等水平
彩图
幼儿和智力低于平均水平的人
属于最低水平的测验
高级
高智力成人
最高水平
认知能力测验(CAT)
桑代克
初级测验
文字测验
数量测验
非文字测验
离差智商+百分等级+标准九分数
翁德里克人事测验(WPT)
人事选拔
文化公平智力测验(CFIT)
卡特尔关于液态智力和晶太智力
画人测验
6min画出一个全身的人像
能力倾向测验
产生原因
特点
比较著名的能力倾向测验
学术能力倾向测验(SAT)
分辨能力倾向测验(DAT)
一般能力倾向成套测验(GATB)
更注重实操
多维能力倾向成套测验(MAB)
基本心理能力测验(PMA)
特殊能力测验
音乐能力测验
美术能力测验
机械能力测验
空间关系能力测验
心理运动能力测验
文书能力倾向测验
文书测验
明尼苏达文书测验
创造力测验
吉尔福特发散思维测验(南加利福尼亚测验)
3维
流畅性+变通性+独特性
托伦斯创造性思维测验
4维
3维+精确性
芝加哥大学的创造力测验
用于小学至高中生
人格测验
含义
通过一定的方法,对在人的行为中起稳定调节作用的心理特质和行为预测进行定量分析,以便预测个人未来的行为
自陈测验
定义
特点
优点
量大,若干特质
纸笔测验,团体施测
比较客观,应用广泛
缺点
反应偏差的存在
反应定势
社会赞许倾向
反应形态
随意勾选答案
自陈量表的编制方法
逻辑分析法
人格理论
爱德华的个人偏好量表(EPPS)
詹金斯活动调查表
显性焦虑表
因素分析法
16PF
EPQ
经验法
MMPI
综合法
逻辑分析法→经验法→因素分析法
CPAI--中国人个性测量表
CPI-加州心理调查表
常用的自陈量表
《明尼苏达人格调查表》(MMPI)
1943年
10个临床量表+4个效度量表
T分数
L(说谎量表)、F(诈病量表)、K(校正量表)、Q(疑问量表)
宋维真
MMPI中文版
16岁以上具有初中文化的中国人
《卡特尔16种人格因素量表》(16PF)
因素分析法
标准10分制
《艾森克人格问卷》(EPQ)
四个分量表组成
精神质--P
外倾性--E
神经质--N
说谎量表--L
16岁以上
T分数
爱德华个人偏好量表(EPPS)
逻辑分析法
采用强迫选择
“大七”人格问卷
大五人格--NEO
其他自陈人格量表
加州心理调查表(CPI)
儿童14种人格因素问卷(CPQ)
“Y-G”性格测验
学生性格量表
投射测验
定义
向被试提供一些未经组织的刺激情境,让他在不受限制的情境下,自由表现出他的反应,分析反应的结果,便可推断他的人格结构
假设
无意心理特征
不知不觉
特点
6个
分类
联想法
罗夏克墨迹测验(RIT)
反应部位、速度、内容
构造法
主题统觉测验(TAT)
完成法
选排法
表露法
常用的投射测验
罗夏克墨迹测验(RIT)
主题统觉测验(TAT)
莫瑞和摩尔根
情景测验
品格教育测验
道德两难故事法
情景压力测验
人格测验的其他方法
人格评定量表
莱氏品质评定量表
猜人测验
认知风格
镶嵌图形测验(EFT--隐蔽图形测验)
威特金
场依存性和场独立性
社会计量法
莫雷诺1934年
社会关系图解法
社会距离量表
人格测验中的问题
态度测验
瑟斯顿量表(等距量表法)
利克特量表(总加量表法)
哥特曼量表(累积量表法)
奥斯古德编制的语义分化量表
Q分类技术
迫选技术
内隐联想测验
兴趣测验
斯特朗职业兴趣问卷
库德职业兴趣调查表(KOIS)
霍兰德职业兴趣测验
心理健康量表
SCL--90症状自评量表
抑郁量表
抑郁自评量表(SDS)
流行病学调查抑郁自评量表(CES--D)
焦虑量表
显性焦虑量表(MAS)
状态--特质焦虑量表(STAT)
测验焦虑量表(TAI)
贝克焦虑量表(BAI)
汉密顿焦虑量表(HAMA)
焦虑自评量表(SAS)
发育量表
格赛尔发展量表(GDS)
丹佛发展筛选测验(DDST)
贝利婴儿发展量表(BSID)
六、心理测验的应用
心理咨询
在自我认识、人生规划咨询中的应用
在神经症、人格障碍等咨询中的应用
人事测评
在人的心理特点评估中的应用
评价中心方法
无领导小组
文件筐测验
PM量表
领导风格
人员培训后的心理特点评估
工作人员的绩效评估
教育评价
在测量学生的学习与发展状况中的应用
按照测验的目的分
安置性测验
形成性测验
诊断性测验
终结性测验
在测量教师评价中的应用
研究中的应用
搜集资料
建立和检验假说
实验分组