导图社区 心理咨询师考试专用!超全面的【心理学测量学】笔记
【心理咨询-心理测量学】课程的个人学习笔记,已高分考取中科院心理研究所“心理咨询师”培训项目证书。 这套笔记共6个:普通心理学、社会心理学、发展心理学、变态与健康心理学、心理测量学、咨询心理学。
编辑于2023-02-21 23:57:0005心理咨询-心理测量学知识
第一节 概述
第一单元 测量与测量量表
一、测量的概念
定义
依据一定法则用数字对事物加以确定
定义3要素
事物
被测量的对象
数字
代表某一事物或该事物属性的量
法则
测量所依据的规则和方法。如称重、温度计量、智力测验
二、测量要素
1.参照点
确定事物的量的计算起点。如生理零度。参照点不同,测量结果便无法比较
分类
绝对零点
意义为“无”的参照点。如重量、长度的零点
相对零点
以一个确定的事物量为计算起点的参照点。如以海平面相对的海拔高度
2.单位
计量的类别。如时间、重量等。没有单位无法进行测量
好的单位的两个条件
有确定的意义
相邻两个单位点之间的差值总是相等的
三、测量量表
定义
依据某一法则在一个定有单位和参照点上表现事物属性的连续体
将被测量的事物放在量表适当位置上,看其距离参照点的远近,便会得到一个测量值,就是对其属性的数量化说明
分类
命名量表
测量水平最低的量表形式
1.代号
用数字代表个别事物。如学生编号
2.类别
用数字代表具有某一属性的事物全体。如用1代表男,用2代表女
命名量表只用作标记和分类,不能做量化分析
顺序量表
比命名量表水平高
顺序量表的数字不仅指明类别,同时也指明类别的大小或其含有的某种属性的程度。如考试名次、工资级别、能力等级、喜爱程度等
主要用于分等或排序
等距量表
比顺序量表水平高
等距量表的数字既有大小关系,也有相等单位,数值可以做加减运算,但没有绝对零点,不能做乘除运算。如温度计,可以说200度比100度高100度,但不能说200度是100度的2倍
等距量表的数字加或减一个常数,或用一个常数去乘或除,不破坏原来数据之间等距关系。因此,一个量表上的数值可以转换为另一个具有不同单位的量表上的数值,以便比较
等比量表
最高水平量表
等比量表的数字既有相等单位,又有绝对零点。如长度、重量、时间量表
等比量表的数值可以做加减乘除运算。如甲体重80公斤,乙40公斤,,既可以说甲比乙多40公斤,也可以说甲是乙的2倍
心理测量使用的量表
心理测量难以确定绝对零点,相对单位也很难获得
心理测量一般使用顺序量表
心理测量可将顺序量表得到的数据转换为等距数据来进行统计
第二单元 心理测量的基本概念
一、心理测量的定义
定义
依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点,做出推理和数量化分析的一种科学手段
心理测量的对象是人的行为,测量的是人对测验题目的反应
心理测量只对少数经过慎重选择的行为样本进行观察,间接推知受测者的心理特征
为使不同受测者所获数值有比价性,测验条件对所有受测者必须是相同的
个人在测验中所得原始分数不具任何意义,只有将其与其他人的分数或常模进行比较才有意义。常模的作用使给测验分数提供比较标准
二、心理测量的性质
心理现象复杂,测量困难,心理测量不能与物理测量等量齐观。心理测量具有独特性——
间接性:经外显行为测量间接推论心理特征
相对性:人的行为没有绝对标准
客观性:量化必须有标准
测验用的项目或作业、施测说明、主测者的语言、施测时的物理环境等,是标准化的,测验的刺激必须是客观的;
评分计分的原则和手续是标准化的
分数转换与解释是标准化的,结果推论是客观的
第三单元 心理测验的分类
心理测验种类概括
英语发表的测验5000多种
1989年出版的《心理测验年鉴》第十版(MMY-10)收录的常用心理测验近1800种
按测验功能分类
智力测验
测量人的一般智力水平
如比内-西蒙、斯坦福-比内智力量表、韦克斯勒儿童和成长智力量表
特殊能力测验
偏重测量个人的潜在能力。多用于升学、职业指导、特殊工种人员筛选
如音乐、绘画、机械技巧、文书等才能测验
人格测验
测量性格、气质、态度、兴趣、情绪、动机、信念等个性心理特征。有问卷法和投射法
如明尼苏达多相人格测验(MMPI)、卡特尔16种人格因素问卷(16PF)、艾森克人格问卷(EPQ)、罗夏墨迹测验、主题统觉测验(TAT)
按测验材料的性质分类
文字测验
以文字材料的言语提出刺激,受测者用言语做出反应
易受受测者文化水平影响
如各种人格、智力测验问卷
操作测验
以图形、实物、工具、模型辨认和操作,无须用言语作答的测验
不受文化因素制约
如瑞文测验
按测验材料的严谨程度分类
客观测验
呈现刺激的词句、图形等有明确的含义,受测者通过直接理解、无须发挥想象力进行猜测和遐想即可做出反应
投射测验
刺激没有明确意义、问题模糊,对 受测者的反应也没有明确规定,受测者一定要凭想象力加以弥补,使之有意义,才能做出反应
按测验的方式分类
个别测验
以一对一的形式进行测验
优点
主测者可对受测者进行具体仔细的观察,并有充分机会与受测者合作,使结果可靠
缺点
资料收集效率低,测验手续繁杂,主测者须经过严格训练,不易掌握
团体测验
有一个或几个主测者同时对较多受测实施测验
优点
效率高、收集资料量大、主测不必经过严格训练
缺点
受测者行为可控性比较低,结果不及个别测验可靠
按测验要求分类
最高行为测验
要求受测者尽可能做出最好的回答。测验题有正确答案
如智力测验、成就测验
典型行为测验
要求受测者按照通常的习惯方式做出反应,测验题没有正确答案
如人格测验
第四单元 正误测验观
一、错误测验观
测验万能论
测验无用论
心理测验即智力测验
二 、正确测验观
心理测验是重要的心理学研究方法之一,是决策的辅助工具
心理测验作为研究方法和测验工具尚不完善
第五单元 心理测验在心理咨询中的应用
一、智力测验
用于评估可疑智力障碍者的智力状况
有特殊需求时评估智力状况
国内常用量表
吴天敏修订的中国比内量表,龚耀先修订的韦氏成人智力量表(WAIS-RC)&韦氏儿童智力量表(C-WISC)&韦氏幼儿智力量表(C-WYCSI),张厚粲修订的瑞文标准测验(SPM),李丹修订的联合瑞文测验(CRT)等
二、人格测验
有助于心理咨询师了解来访者的人格特征,便于对其心理问题有更深入的了解
指导进行针对性心理咨询或治疗
国内常用的有艾森克人格问卷(EPQ),卡特尔16种人格因素问卷(16PF),明尼苏达多相人格测验(MMPI)
三、心理评定量表
用于检查某方面心理障碍的存在、了解程度,反映病情演变情况
常用测验:精神病评定量表,躁狂状况评定量表,抑郁量表,焦虑量表,恐怖量表等
第六单元 心理测量的发展史
早期测量思想与实践
中国
孔子观察学生差异-中人观点;始于汉代兴于隋唐的科举取士
古希腊
测智力技能,运动才干
欧洲中世纪的考试
一、科学心理测验的产生与发展
首倡者
英·高尔顿;研究测量差异遗传性的方法
促进者
美·卡特尔;1890在《心理》杂志上发表“心理测验与测量”一文
发展者
法·比内(西蒙);1905在《心理学年报》发表“诊断异常儿童智力的新方法”
四个方面发展
1.操作测验的发展
基于比内-西蒙智力文字材料的智力测验的局限,有了操作测验的问世与发展
2.团体智力测验的发展
基于比内-西蒙智力个别测验的局限,一战时在奥帝斯团体测验基础上发展出陆军甲种、乙种智力测验,后经由在民间广泛应用
3.能力倾向测验的发展
20世纪30年代因素分析盛行催生了多项能力倾向测验
4.人格测验的发展
在智力测验影响下,产生了性格、气质、精神状态、人际关系、动机、兴趣……
二、现代心理测验在我国的发展
源于1914年前后
20世纪20-30年代,两次修订比内-西蒙量表
1979年后,蓬勃发展,进行本土化,对国外广泛应用的智力、人格测量工具进行了修订,后编制了适合我国文化背景的智力测验、适应行为量表等
第二节 测验的常模
第一单元 常模团体
一、常模团体的性质
概念
常模团体是具有某种共同特质的人所组成的一个群体,或该群体的样本
性质
样本代表性(代表总体-一般总体、目标总体)、提供标准化测验所获原始分数
任何一个测验都有许多可能的常模团体
常模团体确定步骤:确定一般总体-确定目标总体-确定样本
常模团体成员组成标准:同样的受测者,如性别、年龄、职业、教育水平、经济地位、种族……
二、常模团体的条件
群体构成必须明确界定群体的性质与特征
包括群体内有性质与特征差异的小团体
常模团体必须视所测群体的代表性样本
群体小时,逐一测验,其平均分是该群体的可靠常模
样本大时,只随机取样一部分人作为群体的代表
样本大小要适当
取样误差与样本大小成反比,条件相同,样本越大越好
样本只有几十,须100%;最小样本30-100;全国性常模2000-3000
三、取样方法
简单随机抽样
按随机表顺序选择受测者构成样本;或编号后再随机选择受测者构成样本。随机-机会均等
系统(等距)抽样
编号排序后每隔若干个号码抽取受测者构成样本
分组抽样
总体数目大,难以进行编号时,将群体分成若干组后,再在分组进行随机抽样选择受测者构成样本
分层抽样
先将目标总体按某种变量(如年龄)分成若干层次,再从各层中随机抽样受测者构成样本。可避免简单随机抽样出现特质集中或缺少的现象。最常用
四、常模与常模分数
常模
由标准化样本测试计算所得以供比较的标准量数,即心理测验用于比较和解释测验结果的参照分数标准
常模分数
施测常模样本后,将受测者的原始分数按一定规则转换出来的导出分数
原始分数
如按心理测验计分法得到16PF问卷的E=20、P=8、N=12、L=7
其本身没有意义,须经转换为导出分数,才有意义
导出分数
是具有一定参照点和单位的数值,与原始分数等值,可进行比较
转换既要根据原始分数的分布特点又要遵循统计学的基本原理
第二单元 常模的类型
一、发展常模
依据发展中的群体的成绩、发展水平人均表现编制的量表即发展常模。亦称年龄量表
1.发展顺序量表
按年龄顺序反应不同年龄阶段个体心理特征等内容的发展常模
2.智力年龄
智力测验所得智力分数对应的智力年龄水平。简称智龄,是智力年龄量表衡量智力的单位
儿童智龄是基础年龄在较高年龄水平的题目上获得的附加月份之和
另一种年龄量表是根据受测者正确反应题目数或反应时间所得原始分数与年龄常模比较计算智龄
3.年级当量
说明测验结果属于哪一年级水平的年级量表。教育成就测验中常用
年级量表的单位通常为10个月
二、百分位常模
百分等级
一个测验分数的百分等级是指在常模中低于该分数的人数的百分比
百分点(百分位数)
计算处于某一百分比例的人对应的测验分数是多少
百分位常模
四分位数和十分位数
三、标准分常模
将原始分数与平均数的距离以标准差为单位表示出来的量表
其基本单位是标准差,所以叫标准分数
标准分数可通过线性转换和非线性转换两种方式获得
线性转换的标准分数
公式1:Z=X-X'/SD
公式2:Z'=A+B·Z
非线性转换的标准分数
在原始分数非常态公布时,可通过非线性转换使之常态化。主要是将原始分数转化为百分等级,再将百分等级转化为常态分布上 的相应标准分数
四、智商及其意义
比内-西蒙用“心理年龄”(MA)表示受测者智力高低,缺乏年龄可比性,后发展出比率智商和离差智商表示智力高低
1.比率智商(IQ)
推孟在心理年龄基础上,用智商表示测验结果
计算公式Q=MA/CA×100(CA为实足年龄)
2.离差智商
以年龄组为样本计算得出的标准分数
维克勒斯将离差智商平均数定为100,标准差定为15,公式IQ=100+15(X-X')/SD(X为受测者的量表分数,X’为受测者所在年龄组平均量表分数,SD为该年龄受测者量表分数标准差)
1960年修订的斯坦福·比内量表的平均数为100,标准差为16
不同测验获得的离差智商只有当标准差相同或相近时才可以比较。标准差不同,意义不同
不同标准差条件下,相同智商分数,有不同的人数百分比
第三单元 常模分数的表示方法
一、转换表法
最简单、最基本的表示常模的方法,也叫常模表
转换表显示出一个特定的标准化样组的原始分数与其相对应的等值分数(百分位数、标准分数、T分数、其他任何分数)
测量者可利用转换表将原始分数转换为与其对应的导出分数,从而对测验分数做出有意义的解释
二、剖面图法
将测验分数的转换关系用图形表示出来的方法
第三节 测验的信度
第一单元 信度的概念
一、信度的定义
同一受测者在不同时间内用同一测验或另一套相等的测验重复测量,所得结果的一致程度。重测分数大体相同,说明该测验的稳定性好,信度高。反之则信度低
信度只受随机误差影响,随机误差越大,信度越低,系统误差具有恒定效应,不影响信度
二、信度的指标
信度系数和信度指数
信度系数
表示同一受测者不同信息(通常是同一受测者的两组资料)之间相关系数的信度指标,反应一组测量实得分数与真分数的符合程度,不直接指出个人测验分数的变异量,可能会存在一定误差。所得分数可能高于或低于或等于真分数
信度指数
信度指数的平方即信度系数
测量标准误
理论上对一个人实施无数次测验,求得的测验分数与真分数之间的平均差值,即测量标准误。实际操作是用一组受测者两次测量结果代替对一个人的反复施测的测量标准误
其计算公式为SE=Sx*(1-rxx)的开方(详见书本)。信度越高,标准误越小,反之亦然
第二单元 信度评估的方法
一、重测信度
每一种信息系数只能说明信度的不同方面
重测信度,又称稳定性系数。它是采用重测法,即使用同一测验,在相同条件下对同一组受测者施测两次,所求得的两次得分间的相关系数
由于人的多数心理特征是相对稳定的,两次测量的得分应该是相对稳定的。如果两次得分差别较大,说明测验未能反映较稳定的心理特征,可能是受了随机因素影响。重测间隔2-4周为宜,不宜超过6个月
二、复本信度
又称等值性系数。它是以两个等值但题目不同的测验来测量同一群体,所求得的两个测验上得分的相关系数。反映的是两个测验在内容上的等值性
求复本信度的施测应半数受测者先做A本再做B本,另一半先做B本再做A本,以抵消施测顺序效应
求复本信度的施测,也应考虑时间间隔,两个测验在相同时间内施测,相关系数反映的才是不同等值测验之间的关系。如果两个复本施测有一段时间间隔,则成重测复本信度或稳定于等值系数
三、内部一致性信度
反映题目之间关系的信度系数。它表示测验能够测量相同的内容或特质的程度
1.分半信度
采用半分法估计所得的内部一致性信度系数
只需一种测验形式,一次施测。施测后将测验按项目编号的奇数、偶数分为等值两半,分别计算每位受测者在两半测验上的得分,求出两半分数的相关系数。实际反映的是两半测验项目之间的相关系数,须通过一些公式加以修正,借以估计整个测验的信度
2.同质性信度
代表测验内部所有题目的一致性
当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,其测验为同质的。相反,则测验是异质的
对复杂、异质的心理学变量,采用单一的同质性测验是不行的。通常采用若干相对异质的分测验并使分测验内部具有同质性,来预测异质较标的某一方面
四、评分者信度
用于测量不同评分者之间所产生的误差
为衡量评分者之间的信度高低,可随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再依据每份测验卷的两个分数计算相关,即得评分者信度。一般要求在成对的受过训练的评分者之间平均一致性大0.90以上,才认为评分是客观的
多个评分者评定多个对象,并以等级法计分时,可采用特定公式估计评分者信度
第三单元 信度与测验分数的解释
一、解释真实分数与实得分数的相关
信度系数可以解释为方差中有多少比例是由真实分数的方差决定的。即测验的总变异量中真分数造成的变异占百分之几。如rxx=0.90时,可以说实得分数中有90%的变异是真分数造成的,仅10%来自测验的误差
二、确定信度可以接受的水平
一般原则:rxx<0.70时,测验不可靠,不能用;0.70≤rxx<0.85,可用于团体比较;rxx≥0.85时,才能用于鉴别或预测个人的成绩或作为
几种测验的信度系数
三、解释个人分数的意义
体现在通过应用测量标准误估计真实分数的范围和了解实得分数再测时可能的变化情况
一般采用95%的概率水平,其置信区间为X-1.96SE<Xr<X+1.96SE,即95%的可能性真实分数落在所得分数±1.96SE的范围
四、比较不同测验分数的差异
测量标准误和测验信度,在评价两个不同的测验分数是否有明显差异时也很重要。可用于比较两人不同分数的差别和同一受试者在两个测验上的差别
差异分数的标准误计算公司SEd=S*(2-rxx-ryy)的开方
第四单元 影响信度的因素
第四节 测验的效度
第一单元 效度的概念
一、效度的定义
定义
所测量与所要测量的心理特点之间的吻合度,即一个心理测验的准确性
一个测验如果没有效度,则无法发挥其功能
使用标准化测验或自行编制测量工具,首先须鉴定其效度
二、效度的性质
相对性
任何测验的效度是对一定的目标而言的。即测验只有用于与测验目标一致的目的或场合才会有效
不能笼统地说某测验有没有效,评鉴测验效度时,必须考虑其目的与功能
连续性
测验效度只有程度上的不同,不能说有效或无效,只能说效度高低
第二单元 效度评估的方法
一、内容效度
什么是内容效度
内容效度指测验题目对有关内容或行为取样的适用性。即该测验是否是所要测量的行为领域的代表性取样
测验题目是行为范围的好样本,则推论有效。反之则无效
想要编制较高内容效度的心理测验,首先要对测验的心理特性有明确的概念,其次要查阅大量资料
内容效度的评估方法
专家评判法
统计分析法
经验推测法
内容效度的特性
非普遍适应性
内容效度不是普遍适用的,是根据具体情况分析得来的
时间特定性
符合过去总体的代表性测验,未必符合现在的总体
专业评判性
不同于表面效度有外行对测验做表达的检查确定,内容效度必须有够资格的专家做详尽、系统的评价建立
二、构想效度
什么是构想效度
构想效度指测验能够测量到理论上的构想或特质程度。即测验的结果是否能够证实或解释某一理论的假设、术语或构想,解释的程度如何
构想效度的评估方法
对测验本身的分析
即研究测验内部结构来界定理论构想,从而为构想效度提供证据
测验的内容效度可以作为构想效度的证据
如维克勒斯智力测验在编制时,按内容分为常识、理解、算数、相似性、记忆广度、词汇、译码、填图、积木图案、图片排列、图形拼凑等分测验,只要分析每一分测验所测量的特性,即可知道此测验所构想的智力结构
测验间相互比较
即通过分析几个测验间的相互关系,找出其共同之处,进而推断这些测验测量的特质是什么,也可以确定这些测验构想效度如何
相容效度
一个测验与相应成熟测验所测验的同一心理特质的相关程度。是构想效度的证据之一
区分效度
与测量不同构想的测验无关性
因素分析法
对一组测验进行因素分析,找到影响测验分数的共同因素,就可能是要测量的特质构想
效标效度的研究证明
一个测验如果效标效度理想,该测验所预测的效标性质和种类,可作为分析测验构想效度的指标
根据效标选取不同的受测者形成对照组,再比较两组受测者的测验成绩。若测验分数能很好地将两组分开,则说明构想效度不错
实验法与观察法证实
观察实验前后分数的差异,也可以验证构想效度
依据所要测量的特质理论构想,预测在某种情况下或经过训练后,受测者的测验得分会有所变化,如果预测得到证实,构想效度就获得的支持证据
三、效标效度
什么是效标效度
测验预测个体在某种情景下行为表现的有效性程度。预测的行为是检验效度的标准,简称效标
根据效标资料是否与测验分数同时获得,将效标效度分为同时效度和预测效度
同时效度
测验所得分数可以与效标同时验证
预测效度
效标资料需要一段时间的搜集才能获得
好的效标必须具备四个条件
能最有效地反映测验目标
具有较高的信度,稳定不随时间而变化
可以客观地加以测量
效标测量方法简单,省时省力,经济实用
效标效度的评估方法
相关法
求测验分数与效标资料相关的效度系数。常用积差相关法计算效度系数。另外还有点二列相关公式、二列相关公式计算效度系数
区分法
检验测验分数能否有效地区分由效标所定义的团体的一种方法
具体做法:分析高分组与低分组分布的重叠量,计算每一组内得分超过或低于另一组平均数的人数百分比。重叠量越大,说明两组分数差异越小,测验的效度越差
命中率法
当测验用来做取舍依据时,用其正确决定的比例作为效度指标的一种方法
将测验分数与效标资料分为两类,在测验分数方面确定一个临界分数,高于临界分数者预测其成功,低于临界分数者预测其失败。在效标资料方面根据实际确定一个合格标准,标准上为成功,标准下为失败。以此来进行预测
第三单元 效度的功能
一、预测误差
效度系数的实际意义常以决定性系数(效度系数的平方)表示
标准误估计法公式:Sest=Sy*(1-r2xy)的开方
二、预测效标分数
如果X与Y两变量成直线相关,只要确定出两者的回归方程,就可以由一个变量推出另一个变量。在测验工作中,从测验分数预测效标成绩,常用Y对X的回归方程Y'=a+byxX
三、预测效率指数
公式:E=100(1-K)
第四单元 影响效度的因素
一、测验本身的因素
测验取材的代表性、测验长度、试题类型、难度、区分度、编排方式等都会影响效度
保证测验效度的要求
测验材料必须对整个内容有代表性
测验设计应尽量避免容易引起误差的题型
测验难度要适中,具有较高区分度
测验长度要恰当,有一定的测题量
测题排序先易后难
二、测验实施中的干扰因素
主测者影响因素
是否按标准施测、指导语是否同一正确、测验时限是否一致、评分是否合理等
受测者影响因素
兴趣、动机、情绪、态度、身心健康状况等
三、样本团体的性质
样本团体的异质性
其他条件相同,样本团体越同质、分数分布范围越小,测验效度越低
干涉变量
因样本团体的年龄、性别、教育水平、智力、动机、兴趣、职业……等性质因素等变量称之为干涉变量。使测验对不同的团体具有不同的预测力
四、效标的性质
作为效标的资料属性即效标的性质
由于效标效度是以测验分数和效标测量的相关系数来表示的,所以效标性质会影响效标测量的信度
第五节 项目分析
什么是项目分析
对测验进行定性与定量分析
定性分析包括对测验的内容效度、题目编写恰当性和有效性等方面的分析
定量分析包括对测验的题目难度、区分度等方面的分析
第一单元 项目的难度
一、项目难度的定义
项目难度
测验题目受测者通过的难易程度
难度指标为通过率(通常是能力测验)
通过率计算方法1:P=R/N×100%
通过率计算方法2:受测者未通过每个题目的百分比
二、不同项目的计算方法
二分法计分的项目
题目为选择题的测验项目,受测人数较多时,将受测者分为高分组(NH分数最高的27%受测者组成)、低分组(NL分数最低的受测者27%组成)、中间组(另46%的受测者组成),分别求得高分组和低分组的通过率,然后再取平均值作为每题的难度。计算公式为P=(PH+PL)/2。因为选择题允许猜测,会受到机遇因素的影响,所以P值还需通过特定的公式加以校正
非二分法计分的项目
当测验项目为问答题或不能用二分法计分时,一般用公式P=X'/Xmax×100%
三、难度水平的确定
项目的难度
难度分析的主要目的是为筛选项目。P值越接近0或1,越难以区分受测者能力水平,接近于0.50区别力最高
测验用于选拔或诊断时,应较多选择难度值接近于录取率的项目
选择题P值应大于概念水平,以减少猜测的影响。难度值以0.75为宜
测验的难度
测验的难度取决于组成测验的项目难度。测验分数的分布可以检验测验的难度
心理测验检测的是心理特征的常态分布,受测者样本具有代表性,中等难度的测验接近常态分布
如果测验分数偏高,则为正偏态分布,说明测验难度偏难,反之测验分数偏高,则为负偏态分布,说明测验难度偏低
测验题目的难度最好在0.50±0.20范围
第二单元 项目的区分度
一、定义
指测验项目对受测者的心理特征的区分能力,也叫鉴别力
一个项目,实际水平高者能顺利通过,低者不能通过,则区分度高
项目区分度是评价项目质量和筛选项目的主要指标,也是影响测验效度的重要因素
二、计算方法
理论上用受测者实际水平高低进行区分,但很难得到,实际操作中用其他指标代替
1.鉴别指数
D=PH-PL
方法步骤
按测验总分高低排列答卷
确定高分组和低分组
分别计算高分组和低分组的通过率或得分率
按公式计算出鉴别指数
D<0,反映高水平组得分低于低水平组,项目有问题
2.相关法
以某一项目分数与效标成绩或测验总分的相关,作为项目区分度的指标
常用计算方法有点二列相关、二列相关、相关法等方法
相关越高,越具有区分功能
三、区分度与难度的关系
区分度与难度有密切关系(难度0.5,区分度较大)
第六节 测验编制的一般程序
第一单元 测验的目标分析
一、测验对象
编制测验前,明确测验对象,即测验将用于哪些团体,对测验者的年龄、文化程度、社会背景、经济状况、理解能力等做到心中有数
二、测验用途
明确测验用于描述还是预测、诊断还是选拔。用途不同,取材范围、题目难度不同
1.显示性测验:测验题目与所要测量的心理特征相似的测验
样本测验:题目取自一个很明确的总体的测验。如四则混合运算能力测验
标记测验:题目取自一个很开放的总体的测验。如智力测验
2.预测性测验:预测一些没有被测验的行为的测验
如GRE中的词汇测验能预测受测者将来在大学里的学业表现
预测性测验最重要的是测验分数与预测行为之间的关系
三、测验的目标
测验所要测量的心理或行为特征
目标分析
对测验目标加以分析,将其转换为可操作的术语的过程
1.工作(任务)分析:对预测性测验所要测验的行为做具体的分析。任务分析步骤
确定哪些心理特征和行为可使要预测的活动达到成功。如某项工作包括打字,须假定手指灵活性、手眼协调能力是必须的
建立受测是否成功的标准。如一个好经理的标准是什么
2.对特定概念下定义:测量某种特殊的心理品质,测验编制就必须给所要测量的心理品质下定义
如创造力包括反应的流畅性、灵活性、独创性和相近性
3.确定测验的具体内容:描述性显示测验,主要任务是从确定显示的内容和技能中取样
如成就测验通过双向细目表编制确定测验的具体内容
第二单元 测题的编写
一、搜集资料
已出版的标准测验
最简单、直接的方法是从已出版的各种标准测验中选择合适的题目
理论和专家的经验
理论和专家的经验是题目来源之一
临床观察和记录
也是题目来源之一
二、命题原则
内容方面
题目的内容符合测验的目的
内容取样要有代表性,符合测验计划
题目之间的内容要相互独立
文字方面
准确使用当代语言
避免生僻字
语句简明扼要
既要排除与答案无关的因素,又不能遗漏答题所依据的必要条件
一句话说明一个概念
意义明确,不得暧昧或含糊
尽量少使用双重否定句
理解方面
题目应有确切答案、不能费解、不能超过受测团体的理解水平
社会敏感性方面
尽量避开社会敏感行为问题,涉及社会禁忌、个人隐私的题目尽量不用。菲利普提出鼓励受测者真实回答的3策略
命题时假定受测者具有某种行为,使他不得不在确实没有该行为时才否定
命题时假定规范不一致
指出该行为虽是违规的,但确是常见的
三、编制要领
选择题
既要编好题干,又要编好选项
题干问题必须明确、简单、意义完整
选项切忌冗长,要简明扼要
每题只给一个正确答案,其他为诱导答案
各选项尽量长度相等
避免题干用词与选项用词一致
选项最好同一形式(如人名、日期、现象)、随机排列
是非题
内容以有意义的概念、事实或基本原则为基础
每道题只能包含一个概念,不可出现“半对半错”的情形
尽量避免叙述句,尤其是双重否定叙述
表达意见的题目须说明意义的来源和根据
数目应有适当比例,基本相等且随机排列,题目长度与复杂性应尽量保持一致
简答题
最好采用问句形式
如为填空形式,空格不宜太多,并且所空的应为关键词,空格尽量放在最后
每道题应只有一个正确答案,而且简答具体;对不完整答案,应事先规定评分标准
操作题
明确所要测量的目标,并将其操作化
尽量使用逼真度较高的项目
指导语要简明扼要
制订评分标准,确定计分方法
第三单元 测题的编排与组织
心理测验的编制过程
合成测验-测验预试-信度与效度考察-常模制订-编写指导手册
一、合成测验
选择与审定试题
选择试题形式
测验目的与材料性质。如测记忆适用简单题,测判断适用选择题
接受测验的团体特点。如幼儿宜用口头测验
各种实际因素。如受测人数过多而时间、经费有限,宜选择团体纸笔测验
审定题目
题目范围应与测验计划所列双向细目表一致
题目数量应比最后所需的数目多一倍至几倍,以备筛选或编制复本
题目难度必须符合测验目的
题目的说明必须清楚明白
测题的编排
依据测验目的和性质,并考虑受测者作答时的心理反应方式, 对测题进行合理安排的原则
测题难度排列宜逐步上升
尽可能将同类型测题组合在一起
注意各类型测题的特点
如是非题或选择题中必须将选择相同的测题安排在一起,以免引起受测者的定势反应
如在匹配题和重组题中,所有选项必须安排在同一张纸上
如论述题的题目与答案在同一张纸上留足答题空间
两种常见的测题排列方式
并列直进式
即将整个测验按测题材料性质归为若干个分测验,同一分测验的试题依其难度由易到难排列。如维克勒斯智力量表
混合螺旋式
即先将各类试题依难度分成若干不同的层次,再将不用性质的试题予以组合,做交叉式排列,难度渐次升进。如比内-西蒙智力量表
二、测验预试
初步筛选出的项目虽然在内容和形式上符合要求,但是否具有适当的难度与区分度,必须通过实践来检验
1.预测
项目性能优劣,不能仅凭测验编制者的主观臆测来决定。必须经过预测加以检验 预测注意事项
预测对象应取自将来正式测验准备应用的群体
预测实施过程与情景力求与正式施测相近
预测时限可以稍宽一些,最好使每个受测者能将题目做完
预测中应对受测者的反应情形加以记录,发现有关问题
2.项目分析
预测完以后,对项目的质和量进行分析
质的分析包括内容取样的适用性、题目的思想性、表达的清晰性等
量的分析包括对预测结果的统计分析,确定题目的难度、区分度、备选答案的适合度等
另外,为检验所选项目的性能是否符合要求,还需再选取来自同一总体的另一样本二次预测和项目分析,检验两次预测与项目分析是否吻合
三、信度和效度考察
编好后的测验先在小范围内试用,初步确定测验是否可用,然后再在较大范围内试用,进一步检验信度和效度
1.信度考察
首先考察测验的信度,如果多人或一人多次测量结果不一致,说明测验缺乏信度
2.效度考察
测验编好后,必须考察效度。如果效度低,说明测验所测的东西不是它所要测的东西
四、制定常模
测验分数必须与某种参照系统比较,方能显示它所代表的意义。个人的测验分数与代表一般人同类行为的分数相比较,才能判别所得分数的高低。代表一般人同类行为的分数,即为常模
常模建立,是在将来使用测验的全体对象中,选择具有代表性的一部分人(即标准化样本)的测验分数进行统计与整理,得到具有代表性的分数分布状态
五、编写指导手册
指导手册要想测验使用者说明如何施测,以提高测验的结果的信度和效度。同时,它也是测验使用者评估测验优劣的重要依据
内容
测验的目的和功用
理论背景与材料的依据
如何实施测验的说明
如测验分几个部分、每个部分多少、如何作答、对主测者、测验时限、注意事项
测验的标准答案或计分标准
常模资料
包括常模表、适用团体、测验分数解释
测验的基本特征
包括难度、鉴别力、信度、效度和因素分析的资料,以及这些资料取得的条件、情境和调查的样本、时间等
第七节 心理测验的使用
第一单元 主测者的资格
一、知识结构
基础知识
基础心理学、发展心理学、社会心理学及心理统计学等知识
专业知识
精通人格心理学、能力心理学、变态心理学、工作领域本行业专业知识等
二、专业理论知识与专业技能
专业理论知识
掌握心理测验的专业理论知识,是主测者资格的最基本条件
专业技能
主测者必须具有实际操作心理测验的专业技能和经验,接受严格、系统的心理测验专业训练,熟悉有关测验的内容、适用范围、测验程序、计分方法等
三、职业道德
测验的保密与控制使用
测验中个人隐私的保护
第二单元 测验的选择
所选测验必须符合测验的目的
所选测验必须符合心理测量学的要求
第三单元 测验前的准备及注意事项
测验前的准备工作
预告测验
事先通知受测者时间、地点、内容范围、测题类型,使受孕者及时调整情绪和状态
准备测验材料
熟悉测验指导语
熟悉测验的具体程序
测验中主测者的职责
按指导语的要求实施测验,不带任何暗示;回答、澄清受测者提出的问题
测验前不讲无关的话
对受测者的反应,不做点头、皱眉、摇头灯暗示性动作
对特殊问题要有心理准备,应对突发事件(如停电、计时器故障、突发疾病等)要沉着冷静、机智、灵活应对,不可临阵慌乱
建立协调关系
主测者与受测者建立友好、合作、能促使受测者最大限度地做好测验的关系
第四单元 测验实施的程序及要素
一、指导语
对受测者的指导语,内容包括——
如何选择反应形式(如划√、回答、书写)
如何记录这些反应(如答卷纸、录音、录像)
时间限制
如果不能确定正确反应时该如何操作
例题
有时告知受测者测验目的
二、时限
时限是标准化测验的一部分
有时限要求的测验的时间安排,要遵守时限要求,还需考虑个别测验者的特殊情况,如生病、疲劳、饥饿等影响测验结果的因素
典型行为测验不受时限限制
三、测验的环境条件
测验的环境条件会对测验结果造成影响
测验环境安排要充分考虑气温、光线、通风、噪音等多种环境因素的影响
第五单元 受测者误差及控制方法
一、应试技巧与练习效应
应试技巧
受测者的测验经验、应试技巧、对测验程序的熟悉度,都会影响测验成绩
练习效应
在涉及个体认知功能的测验上,任何一个测验在第二次应用或重复测验时,都有联系效应使测验成绩提高
具体表现
教育背景差、经验少、智力高者联系效应大
重速度的测验练习效应较明显
重复相同测验练习效应大于复本测验
两次测验时间间隔越小练习效应越大
练习效应约1/5个标准差,第三次以后效应不明显增加
控制方法
尽量设法使每个受测者对测验材料的步骤和所需技巧有相同的熟悉度
提高标准化测验的编制水平
二、动机与焦虑因素
应试动机
受测者的测验动机会影响答题的态度、注意力、持久性、反应速度,而影响测验成绩
在测量成就、智力、能力倾向等变量时,受测者动机强烈可能影响测验成绩
测量态度、兴趣、人格等典型表现时,动机效应也可能会有影响
测验焦虑
适度焦虑会使人兴奋性提高,注意力增强、反应速度提高,影响智力测验、成绩测验、能力测验的成绩。影响焦虑的5个因素
能力高者测验焦虑较低
抱负水平过高,测验焦虑较高
某些人格易产生测验焦虑
测验成绩与受测者关系重大,焦虑高
经常接受测验者焦虑低
控制方法
通过教学或辅导可以降低测验焦虑
三、反应定势
求“快”与求“精确”的反应定势
控制方法:除测反应速度外,应给充分的反应时间
喜好正面叙述
控制方法:编制是非题时,是否题大致相等或答否的题略多
喜好特殊位置
控制方法:正确答案在各位置出现的概率相等
喜好较长选项
控制方法:尽量保持选择长度一致
猜测
控制方法:尽量减少可供猜测的线索
第六单元 测验的评分
一、原始分数的获得
对于自由反应的题目,评分者之间很难取得完全一致,而选择题、是非题的评分较为客观。由选择题、是非题组成的测验称客观性测验。使评分尽可能客观的3点要求
1.及时清晰的记录答题反应情况
2.要有计分键。选择题的计分键包括每一道题的正确反应号码或字母;问答题的计分键包括一系列正确答案和允许的变化;论述题的计分键包括各种可接受的答案要点;投射题的计分键上指明是具有或缺少某种人格特征者的典型反应
3.将受测者的反应与计分键比较,对反应进行分类
二、原始分数的转换
要使测验分数具有意义,并且使不同的原始分数可以比较,就要对它们进行适当的转换处理,或者与参照标准加以对照。如转化为发展分数、百分位数、标准分数等导出分数
测验编制者提供的常模表,就是原始分数的转化表,是为使用者提供的方便易行的由原始分数向导出分数转化的方法
第七单元 测验结果的报告
一、测验分数的综合分析
根据心理测验特点进行分析,永远把测验分数视为一个范围而不是一个确定的点
不能把分数绝对化,更不能仅依据一次测验的结果轻易下结论
为了能对测验分数做出有意义的解释,必须将个人在测验前的经历考虑在内
要考虑测验情景的因素
为测验分数做出确切解释,只有常模资料是不够的,还必须有测验的信度与效度资料
对来自不同测验的分数不能直接进行简单的相加
二、报告分数的具体建议
告知对测验分数的解释,并非仅仅报告测验分数
避免使用专业术语
保障当事人知道这个测验测量或预测什么
要使当事人知道他是和什么团体在进行比较
要使当事人知道如何运用他的分数
要考虑测验分数将给当事人带来的心理影响
要让当事人积极参与测验分数的解释