导图社区心理咨询师考试专用！超全面的【心理学测量学】笔记

心理咨询师考试专用！超全面的【心理学测量学】笔记

【心理咨询-心理测量学】课程的个人学习笔记，已高分考取中科院心理研究所“心理咨询师”培训项目证书。这套笔记共6个：普通心理学、社会心理学、发展心理学、变态与健康心理学、心理测量学、咨询心理学。

编辑于2023-02-21 23:57:00

测量心理学

菜菜不菜

他的近期作品查看更多>>

心理咨询师考试专用！超全面的【心理学测量学】笔记

社区模板帮助中心，点此进入>>

菜菜不菜

他的近期作品查看更多>>

相似推荐
大纲

妈妈必读：一张0-1岁孩子认知发展的精确时间表
- 11.8k
- 1.8k
- 413
- 38
- 0
Ethan
英语词性
- 64.5k
- 6.6k
- 2.4k
- 578
- 0
Ethan
法理
- 29.8k
- 67
- 376
- 49
- 1
Dasein
刑法总则
- 40.1k
- 148
- 965
- 156
- 0
Dasein
【华政插班生】文学常识-先秦
- 6.2k
- 4
- 70
- 2
- 0
Dasein
【华政插班生】文学常识-秦汉
- 3.7k
- 0
- 54
- 10
- 0
Dasein
文学常识：魏晋南北朝
- 4.6k
- 3
- 90
- 20
- 0
Dasein
【华政插班生】文学常识-隋唐五代
- 5.3k
- 8
- 98
- 6
- 0
Dasein
【华政插班生】文学常识-两宋
- 3.5k
- 5
- 70
- 8
- 0
Dasein
民法分论
- 10.1k
- 37
- 291
- 28
- 0
Dasein

05心理咨询-心理测量学知识

第一节概述

第一单元测量与测量量表

一、测量的概念

定义

依据一定法则用数字对事物加以确定

定义3要素

事物

被测量的对象

数字

代表某一事物或该事物属性的量

法则

测量所依据的规则和方法。如称重、温度计量、智力测验

二、测量要素

1.参照点

确定事物的量的计算起点。如生理零度。参照点不同，测量结果便无法比较

分类

绝对零点

意义为“无”的参照点。如重量、长度的零点

相对零点

以一个确定的事物量为计算起点的参照点。如以海平面相对的海拔高度

2.单位

计量的类别。如时间、重量等。没有单位无法进行测量

好的单位的两个条件

有确定的意义

相邻两个单位点之间的差值总是相等的

三、测量量表

定义

依据某一法则在一个定有单位和参照点上表现事物属性的连续体

将被测量的事物放在量表适当位置上，看其距离参照点的远近，便会得到一个测量值，就是对其属性的数量化说明

分类

命名量表

测量水平最低的量表形式

1.代号

用数字代表个别事物。如学生编号

2.类别

用数字代表具有某一属性的事物全体。如用1代表男，用2代表女

命名量表只用作标记和分类，不能做量化分析

顺序量表

比命名量表水平高

顺序量表的数字不仅指明类别，同时也指明类别的大小或其含有的某种属性的程度。如考试名次、工资级别、能力等级、喜爱程度等

主要用于分等或排序

等距量表

比顺序量表水平高

等距量表的数字既有大小关系，也有相等单位，数值可以做加减运算，但没有绝对零点，不能做乘除运算。如温度计，可以说200度比100度高100度，但不能说200度是100度的2倍

等距量表的数字加或减一个常数，或用一个常数去乘或除，不破坏原来数据之间等距关系。因此，一个量表上的数值可以转换为另一个具有不同单位的量表上的数值，以便比较

等比量表

最高水平量表

等比量表的数字既有相等单位，又有绝对零点。如长度、重量、时间量表

等比量表的数值可以做加减乘除运算。如甲体重80公斤，乙40公斤，，既可以说甲比乙多40公斤，也可以说甲是乙的2倍

心理测量使用的量表

心理测量难以确定绝对零点，相对单位也很难获得

心理测量一般使用顺序量表

心理测量可将顺序量表得到的数据转换为等距数据来进行统计

第二单元心理测量的基本概念

一、心理测量的定义

定义

依据心理学理论，使用一定的操作程序，通过观察人的少数有代表性的行为，对于贯穿在人的全部行为活动中的心理特点，做出推理和数量化分析的一种科学手段

心理测量的对象是人的行为，测量的是人对测验题目的反应

心理测量只对少数经过慎重选择的行为样本进行观察，间接推知受测者的心理特征

为使不同受测者所获数值有比价性，测验条件对所有受测者必须是相同的

个人在测验中所得原始分数不具任何意义，只有将其与其他人的分数或常模进行比较才有意义。常模的作用使给测验分数提供比较标准

二、心理测量的性质

心理现象复杂，测量困难，心理测量不能与物理测量等量齐观。心理测量具有独特性——

间接性：经外显行为测量间接推论心理特征

相对性：人的行为没有绝对标准

客观性：量化必须有标准

测验用的项目或作业、施测说明、主测者的语言、施测时的物理环境等，是标准化的，测验的刺激必须是客观的；

评分计分的原则和手续是标准化的

分数转换与解释是标准化的，结果推论是客观的

第三单元心理测验的分类

心理测验种类概括

英语发表的测验5000多种

1989年出版的《心理测验年鉴》第十版（MMY-10）收录的常用心理测验近1800种

按测验功能分类

智力测验

测量人的一般智力水平

如比内-西蒙、斯坦福-比内智力量表、韦克斯勒儿童和成长智力量表

特殊能力测验

偏重测量个人的潜在能力。多用于升学、职业指导、特殊工种人员筛选

如音乐、绘画、机械技巧、文书等才能测验

人格测验

测量性格、气质、态度、兴趣、情绪、动机、信念等个性心理特征。有问卷法和投射法

如明尼苏达多相人格测验（MMPI）、卡特尔16种人格因素问卷（16PF）、艾森克人格问卷（EPQ）、罗夏墨迹测验、主题统觉测验（TAT）

按测验材料的性质分类

文字测验

以文字材料的言语提出刺激，受测者用言语做出反应

易受受测者文化水平影响

如各种人格、智力测验问卷

操作测验

以图形、实物、工具、模型辨认和操作，无须用言语作答的测验

不受文化因素制约

如瑞文测验

按测验材料的严谨程度分类

客观测验

呈现刺激的词句、图形等有明确的含义，受测者通过直接理解、无须发挥想象力进行猜测和遐想即可做出反应

投射测验

刺激没有明确意义、问题模糊，对受测者的反应也没有明确规定，受测者一定要凭想象力加以弥补，使之有意义，才能做出反应

按测验的方式分类

个别测验

以一对一的形式进行测验

优点

主测者可对受测者进行具体仔细的观察，并有充分机会与受测者合作，使结果可靠

缺点

资料收集效率低，测验手续繁杂，主测者须经过严格训练，不易掌握

团体测验

有一个或几个主测者同时对较多受测实施测验

优点

效率高、收集资料量大、主测不必经过严格训练

缺点

受测者行为可控性比较低，结果不及个别测验可靠

按测验要求分类

最高行为测验

要求受测者尽可能做出最好的回答。测验题有正确答案

如智力测验、成就测验

典型行为测验

要求受测者按照通常的习惯方式做出反应，测验题没有正确答案

如人格测验

第四单元正误测验观

一、错误测验观

测验万能论

测验无用论

心理测验即智力测验

二、正确测验观

心理测验是重要的心理学研究方法之一，是决策的辅助工具

心理测验作为研究方法和测验工具尚不完善

第五单元心理测验在心理咨询中的应用

一、智力测验

用于评估可疑智力障碍者的智力状况

有特殊需求时评估智力状况

国内常用量表

吴天敏修订的中国比内量表，龚耀先修订的韦氏成人智力量表（WAIS-RC）&韦氏儿童智力量表（C-WISC）&韦氏幼儿智力量表（C-WYCSI），张厚粲修订的瑞文标准测验（SPM），李丹修订的联合瑞文测验（CRT）等

二、人格测验

有助于心理咨询师了解来访者的人格特征，便于对其心理问题有更深入的了解

指导进行针对性心理咨询或治疗

国内常用的有艾森克人格问卷（EPQ），卡特尔16种人格因素问卷（16PF），明尼苏达多相人格测验（MMPI）

三、心理评定量表

用于检查某方面心理障碍的存在、了解程度，反映病情演变情况

常用测验：精神病评定量表，躁狂状况评定量表，抑郁量表，焦虑量表，恐怖量表等

第六单元心理测量的发展史

早期测量思想与实践

中国

孔子观察学生差异-中人观点；始于汉代兴于隋唐的科举取士

古希腊

测智力技能，运动才干

欧洲中世纪的考试

一、科学心理测验的产生与发展

首倡者

英·高尔顿；研究测量差异遗传性的方法

促进者

美·卡特尔；1890在《心理》杂志上发表“心理测验与测量”一文

发展者

法·比内（西蒙）；1905在《心理学年报》发表“诊断异常儿童智力的新方法”

四个方面发展

1.操作测验的发展

基于比内-西蒙智力文字材料的智力测验的局限，有了操作测验的问世与发展

2.团体智力测验的发展

基于比内-西蒙智力个别测验的局限，一战时在奥帝斯团体测验基础上发展出陆军甲种、乙种智力测验，后经由在民间广泛应用

3.能力倾向测验的发展

20世纪30年代因素分析盛行催生了多项能力倾向测验

4.人格测验的发展

在智力测验影响下，产生了性格、气质、精神状态、人际关系、动机、兴趣……

二、现代心理测验在我国的发展

源于1914年前后

20世纪20-30年代，两次修订比内-西蒙量表

1979年后，蓬勃发展，进行本土化，对国外广泛应用的智力、人格测量工具进行了修订，后编制了适合我国文化背景的智力测验、适应行为量表等

第二节测验的常模

第一单元常模团体

一、常模团体的性质

概念

常模团体是具有某种共同特质的人所组成的一个群体，或该群体的样本

性质

样本代表性（代表总体-一般总体、目标总体）、提供标准化测验所获原始分数

任何一个测验都有许多可能的常模团体

常模团体确定步骤：确定一般总体-确定目标总体-确定样本

常模团体成员组成标准：同样的受测者，如性别、年龄、职业、教育水平、经济地位、种族……

二、常模团体的条件

群体构成必须明确界定群体的性质与特征

包括群体内有性质与特征差异的小团体

常模团体必须视所测群体的代表性样本

群体小时，逐一测验，其平均分是该群体的可靠常模

样本大时，只随机取样一部分人作为群体的代表

样本大小要适当

取样误差与样本大小成反比，条件相同，样本越大越好

样本只有几十，须100%；最小样本30-100；全国性常模2000-3000

三、取样方法

简单随机抽样

按随机表顺序选择受测者构成样本；或编号后再随机选择受测者构成样本。随机-机会均等

系统（等距）抽样

编号排序后每隔若干个号码抽取受测者构成样本

分组抽样

总体数目大，难以进行编号时，将群体分成若干组后，再在分组进行随机抽样选择受测者构成样本

分层抽样

先将目标总体按某种变量（如年龄）分成若干层次，再从各层中随机抽样受测者构成样本。可避免简单随机抽样出现特质集中或缺少的现象。最常用

四、常模与常模分数

常模

由标准化样本测试计算所得以供比较的标准量数，即心理测验用于比较和解释测验结果的参照分数标准

常模分数

施测常模样本后，将受测者的原始分数按一定规则转换出来的导出分数

原始分数

如按心理测验计分法得到16PF问卷的E=20、P=8、N=12、L=7

其本身没有意义，须经转换为导出分数，才有意义

导出分数

是具有一定参照点和单位的数值，与原始分数等值，可进行比较

转换既要根据原始分数的分布特点又要遵循统计学的基本原理

第二单元常模的类型

一、发展常模

依据发展中的群体的成绩、发展水平人均表现编制的量表即发展常模。亦称年龄量表

1.发展顺序量表

按年龄顺序反应不同年龄阶段个体心理特征等内容的发展常模

2.智力年龄

智力测验所得智力分数对应的智力年龄水平。简称智龄，是智力年龄量表衡量智力的单位

儿童智龄是基础年龄在较高年龄水平的题目上获得的附加月份之和

另一种年龄量表是根据受测者正确反应题目数或反应时间所得原始分数与年龄常模比较计算智龄

3.年级当量

说明测验结果属于哪一年级水平的年级量表。教育成就测验中常用

年级量表的单位通常为10个月

二、百分位常模

百分等级

一个测验分数的百分等级是指在常模中低于该分数的人数的百分比

百分点（百分位数）

计算处于某一百分比例的人对应的测验分数是多少

百分位常模

四分位数和十分位数

三、标准分常模

将原始分数与平均数的距离以标准差为单位表示出来的量表

其基本单位是标准差，所以叫标准分数

标准分数可通过线性转换和非线性转换两种方式获得

线性转换的标准分数

公式1：Z=X-X'/SD

公式2：Z'=A+B·Z

非线性转换的标准分数

在原始分数非常态公布时，可通过非线性转换使之常态化。主要是将原始分数转化为百分等级，再将百分等级转化为常态分布上的相应标准分数

四、智商及其意义

比内-西蒙用“心理年龄”（MA）表示受测者智力高低，缺乏年龄可比性，后发展出比率智商和离差智商表示智力高低

1.比率智商（IQ）

推孟在心理年龄基础上，用智商表示测验结果

计算公式Q=MA/CA×100（CA为实足年龄）

2.离差智商

以年龄组为样本计算得出的标准分数

维克勒斯将离差智商平均数定为100，标准差定为15，公式IQ=100+15(X-X')/SD（X为受测者的量表分数，X’为受测者所在年龄组平均量表分数，SD为该年龄受测者量表分数标准差）

1960年修订的斯坦福·比内量表的平均数为100，标准差为16

不同测验获得的离差智商只有当标准差相同或相近时才可以比较。标准差不同，意义不同

不同标准差条件下，相同智商分数，有不同的人数百分比

第三单元常模分数的表示方法

一、转换表法

最简单、最基本的表示常模的方法，也叫常模表

转换表显示出一个特定的标准化样组的原始分数与其相对应的等值分数（百分位数、标准分数、T分数、其他任何分数）

测量者可利用转换表将原始分数转换为与其对应的导出分数，从而对测验分数做出有意义的解释

二、剖面图法

将测验分数的转换关系用图形表示出来的方法

第三节测验的信度

第一单元信度的概念

一、信度的定义

同一受测者在不同时间内用同一测验或另一套相等的测验重复测量，所得结果的一致程度。重测分数大体相同，说明该测验的稳定性好，信度高。反之则信度低

信度只受随机误差影响，随机误差越大，信度越低，系统误差具有恒定效应，不影响信度

二、信度的指标

信度系数和信度指数

信度系数

表示同一受测者不同信息（通常是同一受测者的两组资料）之间相关系数的信度指标，反应一组测量实得分数与真分数的符合程度，不直接指出个人测验分数的变异量，可能会存在一定误差。所得分数可能高于或低于或等于真分数

信度指数

信度指数的平方即信度系数

测量标准误

理论上对一个人实施无数次测验，求得的测验分数与真分数之间的平均差值，即测量标准误。实际操作是用一组受测者两次测量结果代替对一个人的反复施测的测量标准误

其计算公式为SE=Sx*（1-rxx）的开方（详见书本）。信度越高，标准误越小，反之亦然

第二单元信度评估的方法

一、重测信度

每一种信息系数只能说明信度的不同方面

重测信度，又称稳定性系数。它是采用重测法，即使用同一测验，在相同条件下对同一组受测者施测两次，所求得的两次得分间的相关系数

由于人的多数心理特征是相对稳定的，两次测量的得分应该是相对稳定的。如果两次得分差别较大，说明测验未能反映较稳定的心理特征，可能是受了随机因素影响。重测间隔2-4周为宜，不宜超过6个月

二、复本信度

又称等值性系数。它是以两个等值但题目不同的测验来测量同一群体，所求得的两个测验上得分的相关系数。反映的是两个测验在内容上的等值性

求复本信度的施测应半数受测者先做A本再做B本，另一半先做B本再做A本，以抵消施测顺序效应

求复本信度的施测，也应考虑时间间隔，两个测验在相同时间内施测，相关系数反映的才是不同等值测验之间的关系。如果两个复本施测有一段时间间隔，则成重测复本信度或稳定于等值系数

三、内部一致性信度

反映题目之间关系的信度系数。它表示测验能够测量相同的内容或特质的程度

1.分半信度

采用半分法估计所得的内部一致性信度系数

只需一种测验形式，一次施测。施测后将测验按项目编号的奇数、偶数分为等值两半，分别计算每位受测者在两半测验上的得分，求出两半分数的相关系数。实际反映的是两半测验项目之间的相关系数，须通过一些公式加以修正，借以估计整个测验的信度

2.同质性信度

代表测验内部所有题目的一致性

当各个测题的得分有较高的正相关时，不论题目的内容和形式如何，其测验为同质的。相反，则测验是异质的

对复杂、异质的心理学变量，采用单一的同质性测验是不行的。通常采用若干相对异质的分测验并使分测验内部具有同质性，来预测异质较标的某一方面

四、评分者信度

用于测量不同评分者之间所产生的误差

为衡量评分者之间的信度高低，可随机抽取若干份测验卷，由两位评分者按评分标准分别给分，然后再依据每份测验卷的两个分数计算相关，即得评分者信度。一般要求在成对的受过训练的评分者之间平均一致性大0.90以上，才认为评分是客观的

多个评分者评定多个对象，并以等级法计分时，可采用特定公式估计评分者信度

第三单元信度与测验分数的解释

一、解释真实分数与实得分数的相关

信度系数可以解释为方差中有多少比例是由真实分数的方差决定的。即测验的总变异量中真分数造成的变异占百分之几。如rxx=0.90时，可以说实得分数中有90%的变异是真分数造成的，仅10%来自测验的误差

二、确定信度可以接受的水平

一般原则：rxx＜0.70时，测验不可靠，不能用；0.70≤rxx＜0.85，可用于团体比较；rxx≥0.85时，才能用于鉴别或预测个人的成绩或作为

几种测验的信度系数

三、解释个人分数的意义

体现在通过应用测量标准误估计真实分数的范围和了解实得分数再测时可能的变化情况

一般采用95%的概率水平，其置信区间为X-1.96SE＜Xr＜X+1.96SE，即95%的可能性真实分数落在所得分数±1.96SE的范围

四、比较不同测验分数的差异

测量标准误和测验信度，在评价两个不同的测验分数是否有明显差异时也很重要。可用于比较两人不同分数的差别和同一受试者在两个测验上的差别

差异分数的标准误计算公司SEd=S*（2-rxx-ryy）的开方

第四单元影响信度的因素

第四节测验的效度

第一单元效度的概念

一、效度的定义

定义

所测量与所要测量的心理特点之间的吻合度，即一个心理测验的准确性

一个测验如果没有效度，则无法发挥其功能

使用标准化测验或自行编制测量工具，首先须鉴定其效度

二、效度的性质

相对性

任何测验的效度是对一定的目标而言的。即测验只有用于与测验目标一致的目的或场合才会有效

不能笼统地说某测验有没有效，评鉴测验效度时，必须考虑其目的与功能

连续性

测验效度只有程度上的不同，不能说有效或无效，只能说效度高低

第二单元效度评估的方法

一、内容效度

什么是内容效度

内容效度指测验题目对有关内容或行为取样的适用性。即该测验是否是所要测量的行为领域的代表性取样

测验题目是行为范围的好样本，则推论有效。反之则无效

想要编制较高内容效度的心理测验，首先要对测验的心理特性有明确的概念，其次要查阅大量资料

内容效度的评估方法

专家评判法

统计分析法

经验推测法

内容效度的特性

非普遍适应性

内容效度不是普遍适用的，是根据具体情况分析得来的

时间特定性

符合过去总体的代表性测验，未必符合现在的总体

专业评判性

不同于表面效度有外行对测验做表达的检查确定，内容效度必须有够资格的专家做详尽、系统的评价建立

二、构想效度

什么是构想效度

构想效度指测验能够测量到理论上的构想或特质程度。即测验的结果是否能够证实或解释某一理论的假设、术语或构想，解释的程度如何

构想效度的评估方法

对测验本身的分析

即研究测验内部结构来界定理论构想，从而为构想效度提供证据

测验的内容效度可以作为构想效度的证据

如维克勒斯智力测验在编制时，按内容分为常识、理解、算数、相似性、记忆广度、词汇、译码、填图、积木图案、图片排列、图形拼凑等分测验，只要分析每一分测验所测量的特性，即可知道此测验所构想的智力结构

测验间相互比较

即通过分析几个测验间的相互关系，找出其共同之处，进而推断这些测验测量的特质是什么，也可以确定这些测验构想效度如何

相容效度

一个测验与相应成熟测验所测验的同一心理特质的相关程度。是构想效度的证据之一

区分效度

与测量不同构想的测验无关性

因素分析法

对一组测验进行因素分析，找到影响测验分数的共同因素，就可能是要测量的特质构想

效标效度的研究证明

一个测验如果效标效度理想，该测验所预测的效标性质和种类，可作为分析测验构想效度的指标

根据效标选取不同的受测者形成对照组，再比较两组受测者的测验成绩。若测验分数能很好地将两组分开，则说明构想效度不错

实验法与观察法证实

观察实验前后分数的差异，也可以验证构想效度

依据所要测量的特质理论构想，预测在某种情况下或经过训练后，受测者的测验得分会有所变化，如果预测得到证实，构想效度就获得的支持证据

三、效标效度

什么是效标效度

测验预测个体在某种情景下行为表现的有效性程度。预测的行为是检验效度的标准，简称效标

根据效标资料是否与测验分数同时获得，将效标效度分为同时效度和预测效度

同时效度

测验所得分数可以与效标同时验证

预测效度

效标资料需要一段时间的搜集才能获得

好的效标必须具备四个条件

能最有效地反映测验目标

具有较高的信度，稳定不随时间而变化

可以客观地加以测量

效标测量方法简单，省时省力，经济实用

效标效度的评估方法