导图社区 第二章经典测量理论
测量理论一般分为经典测量理论、概化理论和项目反应理论三种。真分数理论又称经典测验理论CTT classical test theory。 1. 含义 真分数:一个测量工具在没有测.
编辑于2022-12-19 17:34:50 福建省第五章 心理测验 第一节 心理测验概述 一、心理测验的定义 ◆心理测验实质上是对行为样本的客观和标准 化的测量 通俗地说,心理测验就是借助心理量表,对心理特征和行 为的典型...
第四章心理测验 教学内容:教学内容:1-1心理测验及作用1-1-1心理测验的定义1-1-2心理测量的用途1-1-3心理测验在人员素质测评中的优势1-1-4意义1-1-5心理测验分类1-2常用的心理测验的应用1-2-1认...
心理测量学的第三部分,内涵选择题考点、重点、难点,适用于312统考,研究生考试心理学全国统考312测量心理学第三章 测量理论的新发展思维导图知识要点框架。心理测量是通过科学、客观、标准的测量手段对人的特定素质进行测量、分...
社区模板帮助中心,点此进入>>
第五章 心理测验 第一节 心理测验概述 一、心理测验的定义 ◆心理测验实质上是对行为样本的客观和标准 化的测量 通俗地说,心理测验就是借助心理量表,对心理特征和行 为的典型...
第四章心理测验 教学内容:教学内容:1-1心理测验及作用1-1-1心理测验的定义1-1-2心理测量的用途1-1-3心理测验在人员素质测评中的优势1-1-4意义1-1-5心理测验分类1-2常用的心理测验的应用1-2-1认...
心理测量学的第三部分,内涵选择题考点、重点、难点,适用于312统考,研究生考试心理学全国统考312测量心理学第三章 测量理论的新发展思维导图知识要点框架。心理测量是通过科学、客观、标准的测量手段对人的特定素质进行测量、分...
经典测量理论
误差及理论模型
1个假设
心理特质可测量需要两个假设
可测性假设
凡客观存在的事物都有其数量(桑代克)
凡有数量的东西都可以测量(麦考尔)
tip
心理特质
能力、人格等
2类误差(4选择)
测量误差
由那些与测量目的无关的变化因素引起的不准确不一致的测量效应
测量误差是不可避免的,只能尽量缩小
分为
随机误差
由与测量目的无关的、偶然因素引起的,而又不易控制的误差
即不一致、不准确
系统误差
由与测量目的无关的,引起的恒定而有规律的稳定的误差
即一致但不准确
误差来源及控制(可能考简答)
来源
测量工具
某些原因导致测量工具的
信度不好
效度不高
例如
题目过少,难度过高或过低、用词不当、时限过短等
测量对象
主要原因是受测者真正水平是否得到正常发挥
施测过程
原因主要是一些偶然因素
包括
施测物理环境
主试的某些属性
评分记分环节出现的疏漏
意外干扰等
控制
测量工具
测验编制的标准化
收集材料具有丰富性、普遍性
项目取样具有代表性
项目难度有一定的分布范围
测验用语简洁明了
被测对象
主试和被试相互配合及操作规范
施测过程
对受测者必须在相同条件下施测
评分客观
对测验结果解释的标准化
1个模型(3选择)
基本概念
观察分数(X)
实测分数
真分数(T)
含义
反映被试某种心理特质真正水平的数值
操作定义
无数次测量的平均值
特点
是理论上构想出来的抽象概念
观察分数越接近真分数,测量的误差越小
只要X和T相差不大,测量即可接受
误差分数(E)
观察分数和真分数之间的差距
CTT数学模型
X=T+E
观察分数=真分数+误差分数
观察分数与真分数之间呈线性关系
假设公理
1. 若某人的心理特质可用平行测验反复测量足够多次,则其观察分数的平均值会接近于真分数
2. 真分数和误差分数之间的相关为零
3. 各平行测量上的误差分数之间相关为零
3条结论
1. 反映个体某种心理特质的真分数是不变的
2. 观察分数被假定等于真分数与误差分数之和
3. 测量误差完全随机,并服从均值为零的正态分布
1个公式(2选择)
观察分数变异=真分数变异+测量误差变异
观察分数变异=有效变异+稳定的无效变异+测量误差变异
信度
定义(5选择)
质性定义(不可量化)
信度即是测量结果的可靠性
量性定义(可量化)
信度乃是真分数变异与观测分数之比
可解释真分数的变异
信度乃是真分数与观测分数的相关系数的平方
信度乃是两个平行测验间的相关系数
即皮尔逊积差相关
公式和变式都要了解意思
估计方法(11选择,2综合)
重测信度
含义
用同一测验,对同组被试前后施测两次,两次测验分数所得的相关系数
用于估计测验的跨时间一致性
使用条件
所测量的特质稳定
遗忘和练习的效果基本上相互抵消
如智力测验需间隔6个月左右
两次施测之间,被测查的心理特质方面没有获得更多的学习和训练
计算方法
皮尔逊积差相关
误差来源
由时间间隔造成
如
测验条件和受测者身心状况的改变
测验所测的特质本身不稳定
评价
优点
只需一个测验
缺点
间隔时间
短,受练习和训练影响
长,个体发展导致相关降低
复本信度
含义
根据一组被试在两个平行等值测验上的得分计算的相关系数
分为
等值性系数
两个复本同时连续施测
用于估计测验的跨形式一致性
稳定性与等值性系数
两个复本相距一段时间施测
用于估计测验的跨时间和形式一致性
使用条件
构造出两份及以上平行测验(A、B卷)
尽量缩短间隔时间,排除记忆和练习的干扰
计算方法
两个复本测验上所得分数的皮尔逊积差相关
误差来源
等值性系数
主要由题目内容造成
稳定性与等值性系数
除题目内容影响外,还会受到时间间隔影响
评价
优点
应用范围较重测信度大
缺点
严格的平行测验很难造出来
仍然容易受练习,记忆和迁移的影响
分半信度
含义
按正常程序施测,全部项目分为相等的两半,根据这两半测验的分数计算其相关关系
使用条件
通常在只能施测一次或没有复本的情况下使用
当一个测验无法对等分半时不能用(可以按奇偶分半,题目难度分半,题目内容分半)
计算方法
由于算出只有半个信度,应用斯皮尔曼-布朗公式加以矫正
斯皮尔曼-布朗公式(常考)
rhh为两半测验分数间的相关系数,用皮尔逊积差相关得出
rxx为整个测验的信度值

r11为原测验信度值
rnn为测验长度增加为n倍后的测验信度值
局限
斯皮尔曼-布朗公式只有在两半测验的变异数方差齐性时才能使用,否则用下列公式
 弗伦那根公式
分别是两半信度的方差
测验的总方差
 卢仑公式
两半测验分数之差的方差
测验的总方差
误差来源
题目本身
评价
优点
在没有复本的条件下使用
缺点
有些题目难以分半,且不同分半方法之间有差异
不适合用于速度测验(测时间,无法分半)
同质性信度
含义
也称内部一致性
指的是测验内部所有题目间的一致性系数
用于估计测验跨项目的一致性
计算方法
库德理查逊KR20公式
仅适用于(0,1)计分
K:一个测验的题目数
Pi为答对第i题的人数的比例
Qi为答错第i题的人数的比例
为测验总分方差
 库德理查逊KR21公式
也仅适用于(0,1)计分
克隆巴赫α系数(三个公式里最重要)
仅适用于非(0,1)计分
荷伊特信度
无明确使用范围,使用方差分量比描写测验内部一致性
因素分析
误差来源
来源于内容取样和所研究行为的异质性
评价
优点
只施测一次,可以排除练习和记忆的效果
缺点
只可在测量单一概念的测验上使用,不适合应用于速度测验
评分者信度
含义
抽取部分试卷,由两个或多个评分者独立按评分标准打分,然后求其相关
计算
评分者2人
皮尔逊积差相关
斯皮尔曼等级相关
评分者3~6人
肯德尔和谐系数
直接比较法
W系数
对偶比较法
U系数
当被评者多于7个,可进行卡方检验
误差来源
评分者之间的差异
评价
优点
适合无法客观计分的测验
缺点
容易受到评分者主观判断的影响
影响及改进(2简答,1综合)
影响因素
被试
个人
心理特质水平的稳定性
如身心状况、注意力、态度等
团队
异质
信度会被高估
同质
信度会被低估
均分过高或过低
信度会被低估
主试与评分者
施测人员不按规定施测,评分者评分的标准不一
施测情境
考场、光线、设备是否齐全、桌面
测验本身
测量工具是否稳定,试题数量、试题之间的同质性程度、试题难度等
两次施测的时间间隔
越短,信度越高
改进方法
主试方面
主试严格执行施测规程
评分者严格按标准给分
被试方面
选取恰当的被试团体
提高测验在各同质性较强的亚团体上的信度
测量工具方面
精心编制量表
避免较大系统误差
适当增加测验的长度
需要注意两点
新增项目与试卷中的项目同质
新增项目的数量必须适度
使测验中所有试题的难度接近正态分布,并控制在中等水平
努力提高测验试题的区分度
施测过程方面
按测验手册要求进行布置,减少无关因素干扰
作用(2选择)
①信度
是测量过程中随机误差大小的反映
信度大,随机误差小
信度与系统误差无关
②信度
可以解释个人分数的意义
测量的标准误

SE:标准误
Sx:标准差
rxx:测验的信度
③信度
可以帮助进行不同测验分数的比较
效度
定义(2选择)
含义
—个测验实际能测出其所要测的心理特质的程度
等于测量中测量有关的变异与实得变异之比
差异的标准误
SEd:两测验的标准误
Sx:两测验化为标准分数做差后的标准差
rxx ryy:两测验的信度
公式


效度系数的平方

有效变异数

总变异数
估计方法(6选择,1综合)
内容效度
含义
实测内容与要测内容之间的吻合程度
用途
成就测验,职业测验(选拔和分类)
不适用于
能力倾向测验
人格测验
确定方法
逻辑分析法(专家评定法)
含义
由专家对测验项目和原定内容范围作出判断,是一种定性分析方法,有时又称逻辑效度
具体步骤
①明确范围
②将题目与编制的双向细目表对照
③制定评定量表,考察题目的覆盖率、比例、难度等,对各方面作出评定
统计法
科隆巴赫法(复本法、统计分析法)
含义
抽取两套平行测验,施测于被试,求其相关
相关高
可把它作为评估测验内容效度的一个证据
相关低
则说明两个测验中至少有一个缺乏内容效度
再测法
含义
训练前,先做一次测验
学过该知识后,再做同样的测验
若后测成绩显著优于前测,说明内容效度较高
内容效度比
经验法
含义
不同被试团体在测验得分和对每题的反应存在较大差异
例如
若该测验总分随年级增高而增高,则说明有内容效度
tip
表面效度
外行人认为高就高
内容效度
实际内容与所测内容相关高才高
构想效度(结构效度,构念效度)
含义
实测到所要测的理论结构或特质的程度
例如
卡特尔根据他的人格理论制作了16PF,结构效度应该是高的
用途
智力测验,人格测验
确定方法
测验内部
研究测验内部构造来分析结构效度
测验内部构造,如
测验的内容
对测题反应的过程
项目间或分测验间的关系
指标
内在一致性系数(K-R20、K-R21、克隆巴赫α系数)
即测量同一品质的题目间一致性程度高,则结构效度高
测验外部
特点
考虑几个测验间的相关,考察它们是否在测量同一心理结构
分类
相容效度法
求新编测验与结构效度高的旧测验相同特质的相关系数
相关高
结构效度高
汇聚效度(求同效度)
求新编测验与结构效度高的旧测验不同方法相同特质的相关系数
相关高
结构效度高
区分效度法(求异效度)
求新编测验与结构效度高的旧测验相同方法不同特质的相关系数
相关高
结构效度低
多种特质-多种方法矩阵法
求同效度和求异效度的综合应用
因素分析法(理解即可)
对一组测验进行因素分析,找出影响测验的共同因素
共同因素上的负荷量就是测验的因素效度
测验分数总变异中有关因素的比例就是该测验结构效度的指标
实证效度法
根据校标将人分为两类,考察其得分差异
根据得分分为高低组,考察其校标差异
若差异显著
说明结构效度高
效标关联效度(实证效度)
含义
对特定情境中的个体行为进行估计的有效性
说明应该以实践的效果作为检验标准
例如
研究生考试选拔人才,具备高的科研能力,说明实证效度高
效标
指被估计的行为是检验效度的标准,就是衡量一个测验是否有效的外在标准
分类及用途
同时效度
含义
效标资料与测验分数同时搜集
用途
诊断现状
预测效度
含义
测验之后根据实际工作成绩来确定校标
用途
预测某个个体的行为
常用效标
学业成就、等级评定、临床诊断、专门的训练成绩
确定方法
相关法
求测验分数与校标测量之间的
积差相关
点二列相关
二列相关等
区分法
根据校标测量的好坏分组,回头分析测验分数的差异
若差异大(即两组相关低)
则实证效度高
命中率及基础率、灵敏度、确认度

正命中率(常考)
含义
正确测出的比例
公式
A/(A+B)
负命中率
含义
正确排除的比例
公式
D/(C+D)
总命中率
含义
正确测出和正确排除的比例
公式
(A+D)/(A+B+C+D)
基础率
含义
符合标准的人占总人数的比例
公式
(A+C)/(A+B+C+D)
灵敏度
含义
符合标准的人能被筛选出的比例
公式
A/(A+C)
确认度
含义
不符合标准的人能被排除的比例
公式
D/(B+D)
内部效度与外部效度
内部效度
又称内部一致性效度,它反映了测验的构想效度
外部效度
指将研究结果概化到其他情境和总体的程度
影响及改进(可能考简答)
影响因素
测验的构成
测验的实施过程
被试情况
所选效标的性质
测量的信度
改进方法
通过标准化全面减少各种测量误差
精心编制测验量表避免出现较大的系统误差
妥善组织测验,控制随机误差。
创设标准的应试情境,让每个被试都能发挥正常的水平
选好正确的效标,定好恰当的效标测量,正确地使用有关公式
作用(1选择)
详见心理统计学
信效度的关系(1选择)
信度高是效度高的必要而非充分的条件
一个测验效度高,其信度必然高
一个测验信度高,其效度不一定高
测验的效度受它的信度制约
推知
效度≤信度
效度系数≤信度的平方根

项目分析
难度(4选择)
含义
指测验项目的难易程度
难度的计算
二分法计分项目
用项目的通过率作为衡量难度的指标
通过率
以答对或通过该项目的人数的百分比来表示
计算
人数较少时
求通过率
P=R/N
R:答对或通过该项目的人数
N:全体被试数
P:项目难度
P值越大,题目越容易
人数较多时
将被试分为三组
最高的27%被试作为高分组
最低的27%被试作为低分组
求通过率


高分组的通过率

低分组的通过率

项目难度
非二分法计分项目
无猜测率的题目


项目难度
所有被试在该项目的平均分
该项目的满分
有猜测率(即选择题)


校正后的难度

选项的数目

原难度
难度水平的确定
取决于测验的目的和性质
①对于标准参照测验和掌握测验,可不考虑难度
②对于选拔测验,应将测验的项目难度控制在录取率左右
③对于选择题,难度应该大于猜测概率
无论何种测验,一般都应防止被试得满分。因为满分的意义是不明确的
难度对测验的影响
难度大
分数分布将呈现为正偏态
难度小
将呈现负偏态
平均难度在0.5左右为宜的测验
一般能力测验
速度测验
成就测验
选拔测验
录用测验
正偏态适合
筛选性测验
如
数学竞赛
负偏态适合
达标型测验
如
中学会考
难度以集中在0.5左右为最佳,以集中在两端最差
可能考简答
难度的等距转换(看看就好)
可以将难度转化为Z分数
为了克服Z分数的负值和小数点的缺点,可转换为另外的难度指标
Δ=13+4Z,Z'=Z+5
区分度(3选择)
含义
指测验项目对被试心理品质水平差异的区分能力
即测验项目
水平高的人得分高
水平低的人得分低
区分度D的取值为-1~1
积极区分
D为正值,且D越大区分效果越好
消极区分
D为负值,D越小越消极(高分组得分比低分组还低)
无区分作用
D为0
计算
项目指数鉴别法


高分组的通过率

低分组的通过率
相关法
含义
求项目分数与测验总分的相关
分类
点二列相关
二列相关
积差相关
φ相关
分别在不同条件使用,求出的相关系数越大,则区分度越好
方差法(理解即可)
在某项目上的得分越分散,即方差越大,则该试题鉴别潜力越大。
区分度的相对性
不同的计算方法,所得区分值不同
样本容量越小,其统计值越不可靠
分组越极端,D值越大
被试样本的同质性程度影响区分度值的大小
区分度与难度的关系
难度越接近
0.5时,项目潜在的区分度越大
1或0时,项目潜在的区分度越小
应使整个测验的难度呈正态分布,且平均水平保持在0.5左右
区分度与信度的关系
区分度越高,信度就越高
且信度比区分度提升快
不太重要,看看即可
题目筛选(1选择)
要看区分度,0.3以上是比较好
要考虑难度,在0.65到0.35之间比较好
要进行选项分析
分析出现上述异常情况的原因,并酌情修改选项或题目
评价
经典测量理论的优点
经典测量理论(CTT)直观易懂,计算方便,容易推广
理论假设较弱,适于推广
多数情况下都足够精确,结果可信
经典测量理论的局限
对信度的估计精度不高,难以实现平行测验
难以精确被试个体的独立误差
对样本抽样依赖大,却难以获得代表性样本
参数指标与被试水平之间关系模糊
不适合标准参照测验
真分数(T)与观察分数(X)之间存在线性关系的假定不合理
没考过,看看就好