导图社区 心理评估第二章
应用心理学专业的《心理评估》第二章心理测量学的基本原理,测量是人们根据一定的法则,对客观事物的属性进行某种数量化确的过程。
编辑于2023-09-25 15:33:35 贵州心理评估第二章心理测量学的基本原理
第一节测量与量表的基本概念
测量与心理测量
测量
概述:人们根据一定的法则,对客观事物的属性进行某种数量化确的过程
种类
物理
社会
生理
心理测量
完成过程必备条件
测量对象:具体指所测物与人的属性和特征
测量工具:又称法则,是对事物的属性进行分派数字的依据,包括制定测量用时所遵循的标准,也包含测量实施的过程所遵守的规则
测量结果:是用数字来表示的,即表示事物属性和特征的数字和符号
心理测量:是依据一定的心理学理论,并采用一定的操作程序,对人的行为做出的某种数量化确定
测量的要素
一定的参照点
参照点:是量的计算起点,有绝对零点与相对零点之分
绝对零点:表示事物处于一种“全无”状态
相对零点:不表示“全无”状态,它是人们为了比较事物的方便,参照一定的标准而确定的零点 (心理测量中只有相对零点)
良好的测量单位
单位是计量事物标准量的名称,没有单位,事物数量的多少与大小就无法表示(心理测量的单位不够完善,既无统一的单位,也不符合等距的要求)
好的单位必满足条件
具有确定的意义,即单位在所有人的心目中具有同一意义,不允许有不同的解释
要有相等的价值,即单位与单位之间的距离是相等的
测量的量表
概述:要对某个事物进行测量,必须有一个定有参照点和单位的连续体,将要测量的事物发在这个连续体的适当位置上,依据它距离参照点的远近把事物的属性描述出来,这个连续体就是量表
史蒂文斯将测量从低级到高级分成的4个水平
1.称名量表:是表示事物属性或类别的一种类别的一种量表
2.顺序量表:是对事物进行排序所形成的量表(既没有计算时的绝对零点,又没有相等的测量单位)
3.等距量表:是一种具有相等的测量单位的量表(没有计算时的绝对零点,只有相等的零点)
4.比率量表:是一种既有绝对零点,又具有相等的测量单位的一种测量量表(如测量长度、重量、投资等)
心理测验及其要素
行为样本:是反映个体行为特征的一组代表性的行为
标准化
概述:是指测验编制与实施等所遵循的一套标准测量工具,其目的是确保测量结果的准确
标准化内容
测验材料的标准化
测验实施的标准化
测验评分的标准化
测验解释的标准化
客观性:是衡量科学性的一个重要标准,对于心理测验非常重要,是决定一个心理测验能否存在的必要条件
心理测验的特性
定量性
间接性
客观性
相对原则性
第二节测验常模
常模的意义:常模是指标准化样组在某一个测验上的平均水平,可以用它来反映个体分数在团体中相应位置的高低
常模团体的获得
常模团体的条件
样本要明确
样本要有代表性
取样过程要有详细说明
样本大小适当
常模团体抽取的方法
简单随机抽样/纯随机抽样(是最基本的抽样方法)
系统抽样/机械抽样
分层抽样
整群抽样
常模类型
发展常模
概念:是指儿童的身心特质按照正常途径发展所处的发展水平
类型
发展顺序常模
年龄常模
年级常模
百分位常模
概念:百分等级常模是指一群分数中低于某分数所占的百分比
类型
百分等级常模
百分数常模
标准分数常模
Z标准分数
Z标准分数的线性转换
非线性转换——正态化标准分
常模分数的表示方法
转换表:一般由观测分数、导出分数或对常模团体的具体描述等要素所构成的表格,有简单转换表和复杂转换表
剖析图:是以图形的方式表示测验分数转换关系的,其特点是直观性强,既能给出量的描述,又能给出质的描述
第三节信度、效度与项目分析
信度
信度理论
误差种类与误差分数
误差是指与测量目的无关的因素所引起的测量结果的不一致或不准确
种类
随机误差:是由偶然的、无法控制的因素所引起的误差
系统误差:是由一些恒定的、有规律性的因素所引起的误差
真分数与基本假设
信度的定义:信度要解释的问题主要是测量工具的稳定性或可靠性
信度的估计方法
重测信度:又称稳定性系数,计量方法采用的是重测法,即用同一份测验对同一组被试在不同时间测试两次所得结果的相关系数
复本信度:又称等值性系数,是对同一组被试在最短时间内测试两个等值测验所得的相关系数,认知测验较为常用
内部一致性信度
间接评估不同项目样本效果的方法
计算方法
分半法
库德-理查逊(K-R)
克龙巴赫α系数法
评估者信度:指分析评分试者给出不同的测验分数
信度指标与解释
信度系数
测量标准误
影响信度的因素
测验长度
概念:是指测验的题目数量
一般而言,测量越长,信度越高,原因
测验越长,测验内容的分布范围越广,试题取样越恰当,代表性越强
测验越长,被试测验分数受猜测的影响越小
样本特征:信度是以相关系数来表示的,而相关系数的大小受样本性质及其分数分布的影响
测验难度:难度对信度的影响只存在于最高行为测验中
效度
是指一种评估工具测到所需测验特质的程度,也就是测验工具的有效性、准确性
效度概述
效度的定义:在测量理论中,效度是指与测量目的有关的有效方差与测验分数方差(由真分数方差和随机误差分数方差构成)的比值
效度与信度的关系
信度高是效度高的必要非充分条件(信度只反映随机误差的影响,效度同时考虑了随机误差和系统误差的影响)
效度受信度的制约
效度的性质
相对性
连续性
效度的类别与估计方法
类别
内容效度:指一个测验对所需内容的覆盖程度,目的是探讨测验题目的恰当性问题
结构效度
指心理学理论对所测行为的解释程度
检验结构效度资料的方法
测验内方法
以研究测验的内部构造来证明测验的结构效度
测验的证据来源
内容效度法
内部一致性
分析被试的解题过程或反应特点
测验间方法:以两个或两个以上测验关系的分析作为结构效度证据
效标效度
效标效度或效标关联效度又称统计效度或实证效度,主要通过研究某个测验与某些效标变量之间的相关程度以检验的有效性
类别
同时效度
预测效度
估计方法
效度系数(是评估效度的基本方法)
组的分类
命中率
预期表
功利率
效度的指标与解释
决定系数:效度系数的平方称为决定系数,它表示由测验正确预测或解释的效标方差的比例
预测标准误:未反映出个体分数的差异,为此除了用决定系数表示效度外,还需要预测标准误来表示
影响效度的因素
测验的组成
测验的实施
被试的状态
效标的性质
样本的特征
项目分析
难度
难度的定义:项目难度是指项目的难易程度,是反映最高行为测验难度水平的一个指标
计算的方法
区分度
项目区分度是用于分析项目对所测心理特质的区分程度或鉴别能力,即区分项目优劣的指标,亦即衡量项目有效性的指标,又称项目鉴别力
估计方法
鉴别指数
项目与总分的相关
积差相关法
点二列相关法
二列相关法
猜测度:用于分析学生对试题猜测的可能性程度,主要针对选择题、判断题
第六章测验的选择及其注意事项
测验的选择
符合测量目的
考察测验的实际因素
达到心理测量学的技术要求
量表选择的决策)
被试误差及其控制
反应定势
1.默认
2.装好和装坏
3.推诿
4.极端性
5.求“快”与求“精”
6.猜测与谨慎
应试技巧与练习效应
动机与焦虑
第五节量表编制的一般过程
确定测验目的
测验用途
测验对象
测验目标
编制试题
拟定项目编制计划
试题来源
1.直接从正式出版的标准测验及相关资料中选择合适的项目
2.由测验编织者和专家自行编写
3.依据临床观察和记录形成项目,心理测量中各种观察量表或检核表大多来源于观察到的行为表现
命题的一般原则
1.内容选取方面
①内容上要考虑项目内容符合测验目的,避免贪多而乱出题目
②要求测试题的内容取样要有代表性,符合命题计划,且比例恰当
2.文字表述和理解方面
①文字表述上应力求浅显简短,且不可遗漏必要的条件
②字句要简单明了,适合所测团体的阅读理解水平
③每一项目应有确定且不应引起歧义或争议(除创造力和人格测验外)
3.难度分布方面:要有一定的分布范围,各种难度都要有一些,且项目的排列要由易到难排序
4.项目数量方面:编制测验时,要建立测验的项目题库,其中的项目数量应当是计划题量的几倍,以备项目分析时删除或淘汰
5.社会敏感性方面:应当尽量避免编制涉及社会禁忌或个人隐私的社会敏感性的题目
测验编排与预测
试题的审定
审核内容
①修改题意不清、用词不适、逻辑不当、内容重复的试题
②检查试题内容与计划内容是否吻合
③审核试题难度是否符合测验目的
试题的编排
1.并列直进式
2.混合螺旋式
预测与项目分析
预测中应注意的事项
①预测的一组被试应取自将来正式测验拟应用的全域中
②预测应力求按正规的要求进行,使其与将来正式测验的情况相近
③预测的实施,应使被试有足够的完成作业时间
④在预测过程中,应就被试反应情况随时加以记录
测试题性能的复核
标准化
测验标准化
1.测验内容标准化:在经典测验理论中,指对于所有被试都给予相同的测试题,否则就无法对测验结果进行比较
2.所有被试都要尽可能相同的条件接受测验。具体四个一致:导语、测验时限、评分标准、测验环境一致
3.测验记分标准化:标准化的第三个要素是客观性
测验信度和效度的鉴定
常模的建立
编写测验手册
测验手册内容
测验目的与功用
选材依据
测验的基本特征
实施方法
标准答案
评分
常模资料
第四节项目反应理论
经典测量理论的局限性
各参数估计的样本依赖性太大
信度估计精确性不高
相同测量标准误差难做到
能力量表与难度量表不配套
项目反应理论的基本假设
潜在特质空间假设
局部独立性假设
项目特征曲线假设
项目反应模型
逻辑斯蒂模型
等级反应模型
题目与测验信息量
与经典测验理论中的信度估计方法不同,项目反应理论用统计学中的信息函数来描述项目或测验的质量
项目反应理论的应用——计算机自适应测验
心理评估第二章心理测量学的基本原理
第一节测量与量表的基本概念
测量与心理测量
测量
概述:人们根据一定的法则,对客观事物的属性进行某种数量化确的过程
种类
物理
社会
生理
心理测量
完成过程必备条件
测量对象:具体指所测物与人的属性和特征
测量工具:又称法则,是对事物的属性进行分派数字的依据,包括制定测量用时所遵循的标准,也包含测量实施的过程所遵守的规则
测量结果:是用数字来表示的,即表示事物属性和特征的数字和符号
心理测量:是依据一定的心理学理论,并采用一定的操作程序,对人的行为做出的某种数量化确定
测量的要素
一定的参照点
参照点:是量的计算起点,有绝对零点与相对零点之分
绝对零点:表示事物处于一种“全无”状态
相对零点:不表示“全无”状态,它是人们为了比较事物的方便,参照一定的标准而确定的零点 (心理测量中只有相对零点)
良好的测量单位
单位是计量事物标准量的名称,没有单位,事物数量的多少与大小就无法表示(心理测量的单位不够完善,既无统一的单位,也不符合等距的要求)
好的单位必满足条件
具有确定的意义,即单位在所有人的心目中具有同一意义,不允许有不同的解释
要有相等的价值,即单位与单位之间的距离是相等的
测量的量表
概述:要对某个事物进行测量,必须有一个定有参照点和单位的连续体,将要测量的事物发在这个连续体的适当位置上,依据它距离参照点的远近把事物的属性描述出来,这个连续体就是量表
史蒂文斯将测量从低级到高级分成的4个水平
1.称名量表:是表示事物属性或类别的一种类别的一种量表
2.顺序量表:是对事物进行排序所形成的量表(既没有计算时的绝对零点,又没有相等的测量单位)
3.等距量表:是一种具有相等的测量单位的量表(没有计算时的绝对零点,只有相等的零点)
4.比率量表:是一种既有绝对零点,又具有相等的测量单位的一种测量量表(如测量长度、重量、投资等)
心理测验及其要素
行为样本:是反映个体行为特征的一组代表性的行为
标准化
概述:是指测验编制与实施等所遵循的一套标准测量工具,其目的是确保测量结果的准确
标准化内容
测验材料的标准化
测验实施的标准化
测验评分的标准化
测验解释的标准化
客观性:是衡量科学性的一个重要标准,对于心理测验非常重要,是决定一个心理测验能否存在的必要条件
心理测验的特性
定量性
间接性
客观性
相对原则性
第二节测验常模
常模的意义:常模是指标准化样组在某一个测验上的平均水平,可以用它来反映个体分数在团体中相应位置的高低
常模团体的获得
常模团体的条件
样本要明确
样本要有代表性
取样过程要有详细说明
样本大小适当
常模团体抽取的方法
简单随机抽样/纯随机抽样(是最基本的抽样方法)
系统抽样/机械抽样
分层抽样
整群抽样
常模类型
发展常模
概念:是指儿童的身心特质按照正常途径发展所处的发展水平
类型
发展顺序常模
年龄常模
年级常模
百分位常模
概念:百分等级常模是指一群分数中低于某分数所占的百分比
类型
百分等级常模
百分数常模
标准分数常模
Z标准分数
Z标准分数的线性转换
非线性转换——正态化标准分
常模分数的表示方法
转换表:一般由观测分数、导出分数或对常模团体的具体描述等要素所构成的表格,有简单转换表和复杂转换表
剖析图:是以图形的方式表示测验分数转换关系的,其特点是直观性强,既能给出量的描述,又能给出质的描述
第三节信度、效度与项目分析
信度
信度理论
误差种类与误差分数
误差是指与测量目的无关的因素所引起的测量结果的不一致或不准确
种类
随机误差:是由偶然的、无法控制的因素所引起的误差
系统误差:是由一些恒定的、有规律性的因素所引起的误差
真分数与基本假设
信度的定义:信度要解释的问题主要是测量工具的稳定性或可靠性
信度的估计方法
重测信度:又称稳定性系数,计量方法采用的是重测法,即用同一份测验对同一组被试在不同时间测试两次所得结果的相关系数
复本信度:又称等值性系数,是对同一组被试在最短时间内测试两个等值测验所得的相关系数,认知测验较为常用
内部一致性信度
间接评估不同项目样本效果的方法
计算方法
分半法
库德-理查逊(K-R)
克龙巴赫α系数法
评估者信度:指分析评分试者给出不同的测验分数
信度指标与解释
信度系数
测量标准误
影响信度的因素
测验长度
概念:是指测验的题目数量
一般而言,测量越长,信度越高,原因
测验越长,测验内容的分布范围越广,试题取样越恰当,代表性越强
测验越长,被试测验分数受猜测的影响越小
样本特征:信度是以相关系数来表示的,而相关系数的大小受样本性质及其分数分布的影响
测验难度:难度对信度的影响只存在于最高行为测验中
效度
是指一种评估工具测到所需测验特质的程度,也就是测验工具的有效性、准确性
效度概述
效度的定义:在测量理论中,效度是指与测量目的有关的有效方差与测验分数方差(由真分数方差和随机误差分数方差构成)的比值
效度与信度的关系
信度高是效度高的必要非充分条件(信度只反映随机误差的影响,效度同时考虑了随机误差和系统误差的影响)
效度受信度的制约
效度的性质
相对性
连续性
效度的类别与估计方法
类别
内容效度:指一个测验对所需内容的覆盖程度,目的是探讨测验题目的恰当性问题
结构效度
指心理学理论对所测行为的解释程度
检验结构效度资料的方法
测验内方法
以研究测验的内部构造来证明测验的结构效度
测验的证据来源
内容效度法
内部一致性
分析被试的解题过程或反应特点
测验间方法:以两个或两个以上测验关系的分析作为结构效度证据
效标效度
效标效度或效标关联效度又称统计效度或实证效度,主要通过研究某个测验与某些效标变量之间的相关程度以检验的有效性
类别
同时效度
预测效度
估计方法
效度系数(是评估效度的基本方法)
组的分类
命中率
预期表
功利率
效度的指标与解释
决定系数:效度系数的平方称为决定系数,它表示由测验正确预测或解释的效标方差的比例
预测标准误:未反映出个体分数的差异,为此除了用决定系数表示效度外,还需要预测标准误来表示
影响效度的因素
测验的组成
测验的实施
被试的状态
效标的性质
样本的特征
项目分析
难度
难度的定义:项目难度是指项目的难易程度,是反映最高行为测验难度水平的一个指标
计算的方法
区分度
项目区分度是用于分析项目对所测心理特质的区分程度或鉴别能力,即区分项目优劣的指标,亦即衡量项目有效性的指标,又称项目鉴别力
估计方法
鉴别指数
项目与总分的相关
积差相关法
点二列相关法
二列相关法
猜测度:用于分析学生对试题猜测的可能性程度,主要针对选择题、判断题
第六章测验的选择及其注意事项
测验的选择
符合测量目的
考察测验的实际因素
达到心理测量学的技术要求
量表选择的决策)
被试误差及其控制
反应定势
1.默认
2.装好和装坏
3.推诿
4.极端性
5.求“快”与求“精”
6.猜测与谨慎
应试技巧与练习效应
动机与焦虑
第五节量表编制的一般过程
确定测验目的
测验用途
测验对象
测验目标
编制试题
拟定项目编制计划
试题来源
直接从正式出版的标准测验及相关资料中选择合适的项目
由测验编织者和专家自行编写
依据临床观察和记录形成项目,心理测量中各种观察量表或检核表大多来源于观察到的行为表现
命题的一般原则
内容选取方面
内容上要考虑项目内容符合测验目的,避免贪多而乱出题目
要求测试题的内容取样要有代表性,符合命题计划,且比例恰当
文字表述和理解方面
文字表述上应力求浅显简短,且不可遗漏必要的条件
字句要简单明了,适合所测团体的阅读理解水平
每一项目应有确定且不应引起歧义或争议(除创造力和人格测验外)
难度分布方面:要有一定的分布范围,各种难度都要有一些,且项目的排列要由易到难排序
项目数量方面:编制测验时,要建立测验的项目题库,其中的项目数量应当是计划题量的几倍,以备项目分析时删除或淘汰
社会敏感性方面:应当尽量避免编制涉及社会禁忌或个人隐私的社会敏感性的题目
测验编排与预测
试题的审定
审核内容
修改题意不清、用词不适、逻辑不当、内容重复的试题
检查试题内容与计划内容是否吻合
审核试题难度是否符合测验目的
试题的编排
并列直进式
混合螺旋式
预测与项目分析
预测中应注意的事项
预测的一组被试应取自将来正式测验拟应用的全域中
预测应力求按正规的要求进行,使其与将来正式测验的情况相近
预测的实施,应使被试有足够的完成作业时间
在预测过程中,应就被试反应情况随时加以记录
测试题性能的复核
标准化
测验标准化
测验内容标准化:在经典测验理论中,指对于所有被试都给予相同的测试题,否则就无法对测验结果进行比较
所有被试都要尽可能相同的条件接受测验。具体四个一致:导语、测验时限、评分标准、测验环境一致
测验记分标准化:标准化的第三个要素是客观性
测验信度和效度的鉴定
常模的建立
编写测验手册
测验手册内容
测验目的与功用
选材依据
测验的基本特征
实施方法
标准答案
评分
常模资料
第四节项目反应理论
经典测量理论的局限性
各参数估计的样本依赖性太大
信度估计精确性不高
相同测量标准误差难做到
能力量表与难度量表不配套
项目反应理论的基本假设
潜在特质空间假设
局部独立性假设
项目特征曲线假设
项目反应模型
等级反应模型、逻辑斯蒂模型
题目与测验信息量
与经典测验理论中的信度估计方法不同,项目反应理论用统计学中的信息函数来描述项目或测验的质量
项目反应理论的应用——计算机自适应测验