导图社区 第二章 经典测量理论
研究生考试312全国统考测量心理学第二章经典测量理论思维导图知识框架。心理测量是通过科学、客观、标准的测量手段对人的特定素质进行测量、分析、评价。这里的所谓素质,是指那些完成特定工作或活动所需要或与之相关的感知、技能、能力、气质、性格、兴趣、动机等个人特征,他们是以一定的质量和速度完成工作或活动的必要基础。
编辑于2021-04-23 19:18:00心理学的主要实验包括听觉实验、视觉实验、知觉实验、学习实验、记忆实验、情绪实验等。下图为心理学主要实验总结,内容全面细致。
研究生考试心理学全国统考312测量心理学第五章 常用的心理测验思维导图知识精讲。心理测量是通过科学、客观、标准的测量手段对人的特定素质进行测量、分析、评价。这里的所谓素质,是指那些完成特定工作或活动所需要或与之相关的感知、技能、能力、气质、性格、兴趣、动机等个人特征,他们是以一定的质量和速度完成工作或活动的必要基础。
研究生入学考试全国统考心理学312测量心理学第四章 心理测验思维导图知识点结构框架。心理测验是根据一定的法则和心理学原理,使用一定的操作程序给人的认知、行为、情感的心理活动予以量化。心理测验是心理测量的工具,心理测量在心理咨询中能帮助当事人了解自己的情绪、行为模式和人格特点。
社区模板帮助中心,点此进入>>
心理学的主要实验包括听觉实验、视觉实验、知觉实验、学习实验、记忆实验、情绪实验等。下图为心理学主要实验总结,内容全面细致。
研究生考试心理学全国统考312测量心理学第五章 常用的心理测验思维导图知识精讲。心理测量是通过科学、客观、标准的测量手段对人的特定素质进行测量、分析、评价。这里的所谓素质,是指那些完成特定工作或活动所需要或与之相关的感知、技能、能力、气质、性格、兴趣、动机等个人特征,他们是以一定的质量和速度完成工作或活动的必要基础。
研究生入学考试全国统考心理学312测量心理学第四章 心理测验思维导图知识点结构框架。心理测验是根据一定的法则和心理学原理,使用一定的操作程序给人的认知、行为、情感的心理活动予以量化。心理测验是心理测量的工具,心理测量在心理咨询中能帮助当事人了解自己的情绪、行为模式和人格特点。
经典测量理论
误差及理论模型(CTT)
假设
可测性假设
∵凡客观存在的事物都有其数量(桑代克)
凡有数量的东西都可以测量(麦克考)
心里特质是一种客观存在
∴心理特质可测量
心理特质
内部相关、行为概括、抽象性
一般神经心理系统,不同刺激相同反应
稳定
精神面貌-多特质多层次
决定反应倾向,预测行为
心理测量的误差
含义——与测量目的无关、不准确 不一致
分类
随机误差
偶然、不易控制
影响准确性+一致性(稳定性)
系统误差
恒定有规律的
影响准确性
来源及控制
来源
测量工具—量表是否稳定
被测对象
受测者真正水平是否正常发挥
生理心理状态
动机强弱
施测过程—偶然因素
控制
测量工具—↑科学性
被测对象—主被试配合、规范
施测过程—同条件下施测、评分客观、解释标准化
CTT数学模型
基本概念
观察分数X—实测分数
真分数T—真正水平、理论构想
误差分数E—随机误差
模型:X=T+E
线性关系、只相差一个随机误差
假设公理
反复测量,ϵ(X)=T或ϵ(E)=0
E是服从均值为0的正态分布的随机变量
T、E相关为0,p(T,E)=0
平行测验之间E相关为0,p(E1,E2)=0平行测验:不同测验的特质、形式、数量、难度、区分度一致
E是随机误差,没有包含系统误差在内;
结论说明
T假定不会变,测量的任务—估计T大小
假定X、T线性关系
测量误差完全随机,服从均值为0的正态分布
公式
S²(X)=S²(T)+S²(E)=S²(V)+S²(I)+S²(E)
S²(X)=S²(T)+S²(E)
观察分数变异=真分数变异+随机误差变异
S²(T)=S²(V)+S²(I)
真分数变异=与测验目的有关的变异+与测验目的无关的变异
测量的信度
定义
稳定性、一致性、可靠性
等价定义(3)
信度=真分数变异/观察分数变异之比
信度=真分数&观察分数相关系数的平方
信度=两个平行测验间相关系数
估计方法
重测信度
含义
同测验、同组、前后两次
跨时间的一致性
计算:皮尔逊积差相关
条件
所测特质稳定
遗忘和练习效果基本互相抵消(智力测验间隔6个月)
两次施测之间无学习
误差来源:时间间隔(主);测验条件、受测者身心、所测特质不稳定(次)
评价
优:测验结果是否随时间变化的资料,可预测将来
缺:易受练习和记忆的影响,只能测稳定特质
复本信度
含义
两个平行测验,对同一组施测
等值性系数:同时连续施测——跨形式
稳定性与等值性系数:隔一段时间测——跨时间和形式
计算:皮尔逊积差相关
条件
能构造两份及以上真正的平行测验
被试有条件接受两个测验
误差来源
等值性系数——题目内容(主),被试情绪、动机(次)
稳定性与等值性系数——内容&时间间隔
评价
优:范围大
缺:平行测验难构造,受练习&记忆&迁移影响,难度因重复改变
分半信度
含义:一个测验分对等两半;跨两个分半测验间的一致性
计算
斯皮尔曼-布朗公式
弗朗那根公式
卢仑公式
条件
只能施测一次/无副本情况下
测验无法分半时不能用
误差来源:题目本身
评价
优点:可在没有复本的条件下使用
缺点:难分半,不同分法有差异,不适合速度测验
同质性信度
含义
所有题目间的一致性
跨项目一致性
计算
克龙巴赫α系数
库德理查逊公式20
库德理查逊公式21
荷伊特信度
因素分析
条件:看测量目的
误差来源:内容取样+所研究行为的异质性
评价
优点:只测一次
缺点:不适用速度测验
评分者信度
含义
K个人评价N个人
跨评分者一致性
计算
K=2,积差相关/等级相关
K=3-20&N=3-7,肯德尔和谐系数(W)
N>7,卡方检验
条件:适用于无法客观计分的测验
误差来源:评分者间差异
评价
优:适合无法客观计分的
缺:主观判断影响
画表格
影响因素及改进方法
影响因素
主试
不按规定
评分标准不一致
被试
个体心理特质水平
团体同质性↑,信度↓,易低估
测量工具:稳定,试题取样&难度,测验长度↑/同质性题目↑-信度↑
施测过程:环境,时间间隔↓-信度↑
改进方法
主试:施测规程&标准给分
被试:恰当被试
测量工具:测验长度↑且同质,难度接近正态且中等
施测过程:按测验手册,减少无关因素
作用
信度是随机误差(E)的反映
解释测验分数(区间估计)
不同分数比较
经典测量理论的评价
优点
直观易懂,计算简便,容易推广
适用性广,方便分析
足够精确,结果可信
局限
信度精度不高,平行测验难
难算独立误差
依赖样本抽样
参数与被试不在同一参照系
真&观察分数的线性关系假定×
不适合标准参照测验
项目分析
难度
通过率P表示
计算
二分法计分项目
通过率:P=R/N
极端分组法(27%)
非二分法
选择题的猜测校正
全体被试vs某个项目的通过率:CP=(KP-1)/(K-1)
某个被试vs多个项目的分数:S=R-W/(K-1)
难度水平的确定(取决于目的和性质)
常模参照:p→0.5,区分个体差异
标准参照&掌握,不考虑P
选拔&录用,p→录取率
选择题,p>猜测概率
速度测验,p不宜过高且接近;难度测验,p→0.5
人格、态度、心理健康不需要p
难度对测验的影响
分布形态
P↑,正偏态(筛选性)
P↓,负偏态(达标性)
P中等,正态
离散程度&信度
过难-低分段;过易-高分段;→全距↓,信度↓
最佳:p靠近0.5
难度的等距转换
难度属于顺序变量,目的:难度→等距变量
Z为等距变量,可转Z或△=13+4Z或Z'=Z+5
区分度
含义
区分or鉴别能力
D[-1,+1]:D+积极区分;D-消极区分;D=0无区分作用
计算
项目鉴别指数法
(27%)
>0.4很好,0.3-0.39良好,0.2-0.29尚可,<0.19差
相关法:项目分数与测验总分的相关
方差法:方差↑,鉴别潜力↑
区分度的相对性(多选)
计算方法不同,区分度不同
样本容量↑,影响相关法计算区分度值;样本容量↓,统计值不可靠↓
分组越极端,D↑
被试团体同质↑,区分度值↓
区分度与难度的关系(简答)
难度→0.5,区分度↑
难度→1/0,区分度↓
难度分布广↑,梯度大↑,难度呈正态,平均保持在0.5,区分度较好
题目的综合分析和筛选
看区分度:>0.3较好
看难度:0.35-0.65较好
选项分析
分析原因,酌情修改
测量的效度
定义
所要测的心理特质的程度
是随机误差(E)和系统误差(I)的综合反映
估计方法
内容效度
含义:实际测到&所要测量的吻合度
用途:成就测验&职业测验
确定方法
逻辑分析法专家评定法
范围+双向细目表+量表
统计法
克龙巴赫法:平行测验间相关:相关↑-效度↑
再测法:前后测,后成绩>前-效度↑
内容效度比
经验法:不同团体的差异
结构效度(构想/构念/理念)
含义:实际测到的理论结构/特质
用途:智力测验&人格测验(16PF)
确定方法
测验内部:内容效度,被试答题过程,同质性信度(α)
测验之间
相容效度法:新编测验与同质旧测验的相关-相关↑效度↑
区分效度法:新编与不同质旧测验的相关-相关↑效度↓
实证效度法:分两类看得分差异-差异↑效度↑
多种特质-多种方法矩阵法:相容效度&区分效度综合
因素分析法
特点
心理特质理论
资料无法证实-结构不一定不高-假设不成立
内容选择积累确定
实证效度(效标关联)
含义
对特定情景的行为估计
时间差异:同时效度&预测效度
用途:同时-诊断现状;预测-预测行为
确定方法
相关法:测验分数&效标测量的相关
区分法:分组分析分数差异
预期表法:双维图表
命中率&基础率&灵敏度&确认度
功利率法:好处>消耗
效标
是否有效、外在标准、预测行为
常用效标(多选题)
不能是描述性资料
观念效标&效标测量(阿斯汀)
总结
内容效度-测具体属性(成就)
结构效度-测抽象概念(自我效能感&人格类型)
实证效度-预测结果测验(人事选拔)
影响因素及改进方法
影响因素
主试:不遵守指导语
被试:个体身心/团队同质性
测量工具:代表性/指导语/内容/难度/长度
施测过程:意外
信度&效标选取——相似性&线性关系
改进方法
主试:严格按规程、标准
被试:情景标准,团体同质性
测量工具:避免大系统误差
施测过程:控制随机误差
其他:保证信度,选择效标
作用
用测验分数预测效标分数
效度系数²=决定系数
信度和效度的关系(简答题)
信度↑(必要非充分条件)效度↑
效度↑-信度一定↑;信度↑-效度不一定↑;信度↓-效度一定↓
效度受信度制约