导图社区 心理与教育测量
这是一篇关于心理与教育测量的思维导图,主要内容有心理与教育测量概论、心理与教育测量简史、经典测量理论的基本假设等。
编辑于2022-07-23 00:27:30心理与教育测量
心理与教育测量概论
测量的含义
一定的法则
量尺
事物的特征
定量描述
测量的精度
根据测量对象本身的性质分为
确定型
随机型
模糊型
测量的种类
物理测量
对事物物理特征的测量(长度,重量,面积,速度)
生理测量
对机体生理特征的测量(比如对动植物各种化学成分含量的测量)
社会测量
对社会现象的测量(如人口普查,经济统计,民意调查)
心理测量
对人的心理特征的测量(智力测量,人格测量,职业兴趣测量)
测量的2个基本要素
参照点
绝对参照点
以绝对零作为测量的起点,如长度
相对参照点
以人为确定的零点为测量的起点,如温度
单位
测量单位应有确定的意义,同一单位所有人的理解应是相同的
测量单位要有相等的价值,不同单位之间的距离应该是相等的
测量的量表
称名量表
顺序量表
等距量表
比率量表
心理与教育测量的理论基础
凡客观存在的事物都有其数量
凡有其数量的事物都可以测量
心理与教育测量的量表属于顺序量表
参照点为相对参照点
单位不完善,不等值
心理测验的四个基本条件
行为样本
标准化
测验内容
测验条件
相同的测验情境
相同的指导语
相同的测验时限
评分规则
测验常模
难度或应答率
信度和效度
心理与教育测验的种类
按测量对象分类
智力测验
能力倾向测验
成就测验
人格测验
按测量方式分类
个别测验
团体测验
按测验内容的形式分类
文字(纸笔)测验
非文字(操作)测验
按测验功能分类
成就测验与预测测验
难度测验与速度测验
描述测验与诊断测验
按评价所参照的标准分类
常模参照测验
目标参照测验
潜力参照测验
心理与教育测验的价值与作用
理论研究功能
收集研究资料
建立和假设理论假设
实验分组
实际应用功能
人才选拔
人员安置
心理诊断
描述评价
心理咨询
心理与教育测量简史
中国古代的心理与教育测量
能力测量
孔子,凭借自己的经验观察首先评定学生能力的个别差异,将人的智力人为三个等级(中上之人,中人,中下之人)
刘邵,《人物志》-研究能力(也包括性格)的专门著作
益智图(俗称七巧板),九连环可以认为是最早的智力和创造力测验
人格测量
孔子,提出性格类型的观点。把人分为三种(狂者,狷者,中行)
刘邵,根据五行和形体及其人的行为表现,把人的性格分成12种类型
教育测量
世界上最早的教育测量出现在中国西周奴隶制时期,《礼记·学记》
现代心理教育与测量的起源
促使产生心理与教育测量技术最重要的因素是社会发展的需要
1879年,德国心理学家冯特在莱比锡大学建立了世界上第一个心理实验室
1837年,法国医生沈干创办了第一所专门教育智力落后儿童的学校
19世纪,法国医生艾斯克罗尔首次对智力落后和精神病做了区分
心理与教育测量的早起探索者
高尔顿,出版《遗失的天才》,在伦敦国际博览会成立“人类测量实验室”
科特尔,在《心理》杂志发表《心理测验与测量》,首次提出了“心理测验”这个术语
比内与其助手西蒙合作完成了世界上第一个智力测验量表:比内-西蒙量表(该量表主要用来识别智力落后的儿童)
心理与教育测量运动的发展
推孟,修订理论斯坦福-比内量表,开始采用比率智商的概念来表示智力水平的高低;在修订比内-西蒙量表时将其改为“智商”
英国心理学家斯皮尔曼首先运用因素分析方法研究智力结构,提出智力结构的“二因素理论”
美国心理学家威克斯勒相继编制了“韦氏儿童智力量表”,“韦氏成人智力量表”,“韦氏幼儿智力量表”。他舍弃了比率智商,用离差智商代替
桑代克编制了第一个标准化的教育成就测验,被公推为教育测量的鼻祖
凯利,鲁奇和推孟合作编制了第一个成套成就测验:“斯坦福成就测验”
最早进行人格测量的是克雷培林,他最早用自由联想法诊断精神病人
经典测量理论的基本假设
测量误差的种类
随机误差
由与测量目的无关,偶然因素引起的而又不易控制的误差
系统误差
由与测量目的无关变化因素引起的一种恒定而有规律的误差
测量误差的来源
测量工具
测量对象
施测过程
真分数(T分数),观察分数
CTT的数学模型和基本假设
X=T+E
测量信度
信度概述
信度系数(信度系数,rxx);真分数变异(ST²);总变异数(实得变异数,Sx²)
信度类型及其含义
重测信度
副本信度
分半信度
同质性信度
评分者信度
影响测量信度的主要因素
被试
主试
施测情境
测量工具
两次施测的间隔时间
提高测量信度的常用方法
适当增加测验长度
使测验中所有试题难度接近正态分布,并控制在中等水平
努力提高测验试题的区分度
选取恰当的被试团体
主试严格执行实测流程
信度标准
标准化能力或学绩测验信度应在0.9以上
人格测验信度应在0.8以上
教师自编学绩测验的信度0.6以上
测量效度
效度概述
效度(r² xy);效度系数(rxy);效度系数是效度的平方根
信度与效度的关系
效度高信度必然高;信度高效度不一定高
心理效度的类型,含义及应用范围
内容效度
逻辑分析法
复本法
再测法
结构效度
实证效度
相关法
区分法
命中率
基础率,灵敏度,确认度
功利率
影响效度的因素
测验的构成
测验的实施过程
接受测验的被试
所选效标的性质
测量的信度
提高测量效度的方法
精心编制测验量表,避免出现较大的系统误差
妥善组织测验,控制随机误差
创设标准的应试情境,让每个被试都能发挥正常的水平
选好正确的校标,定好恰当的效标测量,正确地使用有关公式
测验的项目分析
难度的计算
二分法计分项目的难度
用通过率表示
P=R/N
极端分组法表示
P=(PH+PL)/2
非二分法项目计分的难度
P=X/Xmax
难度水平的确定
难度值应尽量接近0.5;范围应在0.3~0.7
难度的等距变换
Δ=13+4*Z
1≤Δ≤25;Δ值越大,难度越高
难度对测验的影响
难度普遍较大,测验分数集中在低分端,分数分布呈现正偏态
难度普遍较小,测验分数集中在高分端,分数分布呈现负偏态
分数分布范围较广,测验信度较高,反正信度值较低;项目难度集中在0.5左右最佳,集中在两极端最差
区分度
区分度D的取值范围介于-1到+1之间;正值为积极区分,负值为消极区分;0为无区分
区分度的计算
项目鉴别指数
D=PH-PL
D=0.4以上,很好
0.3-0.39,良好,修改会更好
0.2-0.29,尚可,仍需修改
0.2以下,差,必须淘汰
极端值的划分
n>100
取上下27%分别作为高分组和低分组
n<100
用50%作为分界点,把上下两半作为高分组和低分组
相关法
点二列相关
二列相关
φ相关
积差相关
区分度与难度的关系
难度越接近0.5时,项目潜在的区分度越大;而难度越接近1或0时,项目潜在的区分度越小;所以应使所有项目都保持在0.5的难度最为理想
区分度的相对性
不同的计算方法所得的区分度值不同
样本容量的大小影响区分度值的大小
分组标准影响鉴别指数值
被试样本的同质性程度影响区分度值的大小
猜测矫正公式
CP=KP-1/K-1
多个项目组成的测验分数矫正公式
S=R-W/K-1
心理与教育测验的编制与实施
心理与教育测验的编制
确定测验目的
明确测量对象
明确测量目标
明确测量用途
制定编题计划
全面而具有代表性的内容,不指示测题偏离应测的范围
对各个内容点的相对重视程度
编制测验项目
收集测验资料
资料要丰富,要有普遍性,有趣味性
选择项目形式
使受测者容易明了测验方法
使受测者在完成测验时不会因测验项目的形式不当而做错
测验过程省时
计分省时省力
经济
编写测验项目
测验项目的取样应当对预测心理品质具有代表性
测验项目的取材范围要同编题计划所列项目范围相一致
测验项目的难度应有一定的分布范围
编写测验项目的用于要力求精炼简短,浅显明了
初编题目数量要多于最终所需要的数量,以便筛选或编制复本
测验项目的说明必须简明
预测与项目分析
预测
项目分析
合成检验
测验项目的选择
测验的性质
项目的难度
项目的区分度
测验项目的编排
并列值进式
混合螺旋式
编制复本
测验标准化
测验内容
对受测者施测相同或等值的题目,测验内容不同,结果无法比较
施测过程
相同的测验情境
相同的指导语
相同的测验时限
测验评分
只有当评分是客观的时候才能将分数差异归于受测者本身的差异,不同评分者一致性达到90%便可认为是客观的
测验分数的解释
测验结果解释的标准化,如果对同一测验结果可作出不同的解释,那么测验便失去了客观性
测验结果只有与一定的参照标准相比较,才能显现出它所代表的意义
鉴定测验
信度
效度
测验量表与常模
编写测验说明书
本测验的目的用功用
本测验的理论依据
测验内容及实施方法
测验标准答案和评分方法
关于测验信度,效度资料的说明
常模表,即如何依据常模节省测验结果
心理与教育测量的实施
测验分数的实施过程
测试前的准备工作
指导语
测验情境
测验焦虑
与受测者建立良好的协调关系
评分技术
测验分数的解释
测验分数的意义
如何向受测者报告测验分数
常模参照测验
常模参照测验
常模参照测验是用常模来解释个人测验分数的一种测验,它是以团体的心理水平来衡量个体心理水平。常模参照测验的主要目的在于将受测者的表现与该团体中其他受测者相比较,从而区分不同的受测者,确定每个受测者的心理水平在总体中的相对位置。
标准参照测验
标准参照测验将被试与一绝对标准相比较,以评价被试有无达到该标准为目的。
常模
测验的常模是指一个具有代表性的样组在某种测验上的表现情况,或者说,是一个与被试同类的团体在相同测验上得分的分布状况与结构模式
常模团体
常模团体是具有某种共同特征的人所组成的一个群体,或是该群体的一个样本
确定常模团体的注意事项
群体构成的界限必须明确
常模团体必须是所测群体的一个代表性样本
取样的过程必须明确且有详尽的描述
样本大小要适当
常模团体必须是近时的
注意一般常模与特殊常模的结合
常模的编制步骤
确定测验将来所要应用的总体
根据测验群体,选定最基本的统计量,如平均数,标准差,百分等级等
决定抽样误差的允许界限,如平均数的抽样误差等
设计具体的抽样方法,估计出最小样本容量,对群体进行抽样,得到常模团体
对常模团体施测,获得团体成员的测验分数及分数分布,并计算样本统计量及其标准误等
确定常模分数类型,制作常模分数转换表,即常模量表
编写常模化过程和常模分数的书面指导材料。
分数转换
原始分数与导出分数
百分等级分数
标准分数
标准分数的变式
T分数
T=10Z+50
美国大学入学考试委员会使用的标准分数CEEB
CEEB=100Z+500
韦氏智力测验采用的离差智商
IQ=15Z+100
我国出国人员英语水平考试EPT
EPT=20Z+90
标准九分数
5+2Z(标准九分数以5为平均数,2为标准差)
分数合成
分数合成的种类
项目的组合
分测验和量表的组合
测验或预测源的组合
分数合成中的问题
采用什么方法合成分数
什么形式是最适当的分数组合
需要多少及何种测验分数作最适当的组合分数
分数合成的方法
临床诊断-直觉合成
加权求和合成
多重回归
多重划分
常模参照测验分数的解释与应用
发展量表
年龄常模
年级常模
商数
教育商数
EQ=教育年龄/实际年龄*100=EA/CA*100
成就商数
AQ=教育年龄/智力年龄*100=EQ/IQ*100
百分等级常模
简单转化表
复杂转化表
标准分数常模
剖析图
目标参照测验
1962年戈莱赛和克劳斯首先提出目标参照测验的概念
目标参照测验的应用
目标参照测验和常模参照测验的区别是:前者关心学生有没有达到预定的学习目标,后者着重于学生之间的比较。常模参照测验适用于选拔性考试和总结性评定;而目标参照测验适用于诊断和发现学生的不足,从而为改进教学提供反馈信息。
信度及其估计
分类一致性信度
考察被试在同一测验的两次施测中或两个副本的施测中是否被分在同一类中
方差分析方法--荷伊特信度
效度及其估计
内容效度
校标关联效度
测验项目的难度和区分度分析
测验的预测
前侧-后侧方法
已接受教学组-未接受教学组方法
对照组方法
测验项目的难度分析
通过率
测验项目的区分度分析
难度差值
掌握组-未掌握组鉴别指数D:K=PA-PB
个人获得指数DIG:采用前后侧方法,可获得在前侧中错误回答某项目而在后侧中能够正确回答的被试人数比例,即该项目的个人获得指数,其值在0~1之间变化
相关系数:项目得分和测验总分之间的一致性程度
分数分界点的制定
专家判定法
Nedelsky方法
Angoff方法
Bookmark方法
效标组预测法
临界组法
对照组法
测验等值
测验等值
从本质上来说,测验等值就是通过对 考核同一种心理品质的多个测验形式 做出测量分数系统的转换,进而使得这些不同测验形式的测验分数之间具有可比性
测验等值的条件
同质性
等信度
公平性
可递推性
对称性
样本不变性
测验等值的一些基本概念
经典理论等值与项目反应理论等值
测验分数等值与项目参数等值
水平等值与垂直等值
测验等值中的一些专用技术名词
测验等值设计
锚测验
数据平滑法
等值标准误差
等值偏差
测验等值结果的表示方法
表列法
公式法
图式法
测验等值的一般步骤
确定等值目标
进行等值设计
施测并采集测验数据
选择一个等值的操作性定义
选择一种等值关系计算方法进行等值计算,获取等值结果
评价等值结果
测验等值计算的基本方法
等百分位等值
两个分数在各自测验中的百分等级相等
线性等值
两个分数在各自测验中的标准分数相等
学籍测验
学籍测验的定义
“学籍”一次通常是指个体经过对某种知识或技术的学习或训练之后所取得的“成绩”,一般表现为个体心理品质在知识,技能或某种能力方面的增加和提高,是个体认知性心理品质的发展。学籍测验是对个体在一个阶段的学习或训练之后知识,技能的发展水平的测定
学籍测验与其他测验的区别
与一般心理测验的区别
与典型行为测验的区别
与能力测验的区别
与一般的性向测验的区别
学籍测验的作用
学籍测验的分类
按测验的编制方法分
教师自编课堂测验
标准化学籍测验
按测验内容分
语文测验,数学测验,生物测验等
按测验的用途分
考察性测验
诊断性测验
按测验评分系统的参照系分
常模参照性测验
目标参照性测验
按测验的题型分
定向反应型(客观型试题)
自由反应型(论文式试题)
标准化学籍测验
标准化学籍测验的基本要求
命题组卷标准化
施测标准化
评分标准化
测验分数解释标准化
能力测验(上)
智力的心理测量学理论
智力的心理测量学理论
智力二因素论
斯皮尔曼提出:G因素,特殊(S)因素
智力多因素论
瑟斯顿提出:7种最主要,最基本的心理能力:语文理解,言语流畅性,推理,空间表象,数字,记忆,知觉速度
智力层次理论
弗农提出:智力三层次模型:G因素处于智力结构的最高层,第二层是言语能力和操作能力两个因素,第三层是数学,语文,空间知觉等
智力的生物学理论
詹森的智力振荡理论
智力的认知心理学理论
斯坦伯格的智力理论
根据成分概况水平分类
一般成分
类成分
特殊成分
根据成分功能分类
操作成分
元成分
知识获得成分
PASS模型
计划-注意-同时性加工-继时性加工
传统智力测验的若干问题
传统智力测验的结构效度
传统智力测验的功能
传统智力测验的公平性
性别差异
职业差异
文化和教育差异
传统智力测验的预测效度
智力随年龄成熟而发展
智力随环境而变化
智力随个性特质的不同而产生不同变化
传统智力存在的合理性
个体智力测验
比内量表
比内-西蒙量表
比内和西蒙出于诊断异常儿童智力的需要,于1905年编制而成的世界上第一个智力量表
斯坦福-比内量表
1916年量表,首次引入比率智商的概念,开始以IQ作为个体智力水平的指标
1960年量表,舍弃比率智商,引入了离差智商概念,以平均数100,标准差为16的离差只是作为智力评估指标
2003年量表,平均数为100,标准差改为15
中国比内测验
陆志伟1916年最早对比内智力量表进行修订《中国比内西蒙智力测验》
韦克斯勒量表
韦氏成人智力量表
韦克斯勒-贝尔韦量表 W-B I
第一个成人智力测验,W-BI和W-BII主要用于测量10-60岁被试
韦氏成人智力量表WAIS-IV
增加了评估流体智力,工作记忆和加工速度的分测验。4个指数得分:言语理解指数(VCI),知觉推理指数(PRI),工作记忆指数(WMI),加工速度指数(PSI)
韦氏成人智力量表中国修订本
1982年龚耀主持修订WAIS的中国修订版本WAIS-RC
韦氏儿童智力量表
韦克斯勒在W-B I 的基础上修订而成,采用离差智商代理比率智商
韦氏儿童智力量表第四版(WISC-IV),以6岁正到16岁11月的人为对象。量表结果变为“四指数”结构:言语理解指数,知觉推理指数,工作记忆指数,加工速度指数
韦氏儿童智力量表中国修订本
WISC-R,1979年由林传鼎,张厚粲提出,1981年底初步完成修订工作
韦氏幼儿智力量表
WPPSI出版于1967年,适用于4~6岁的儿童
戴斯的认知测验
戴斯-纳格利尔里 认知评估系统(CAS),经常被用来分析阅读障碍儿童在认知历程中的个别差异及个体的内在差异
团体智力测验
陆军测验
瑞文推理测验
瑞文标准推理测验
适用于5.5岁及以上智力发展正常的人
瑞文彩图推理测验
适用于幼儿和智力低于平均水平的人
瑞文高级推理测验
适用于智力高于平均水平的人
瑞文标准推理测验中国修订版
1985年,张厚粲教授开始主持
认知能力测验
能力测验(下)
能力倾向测验
能力倾向测验,成就测验,智力测验之间的区别
具体能力倾向测验介绍
学术能力倾向测验(SAT)
分辨能力倾向测验(DAT)
一般能力倾向成套测验(GATB)
行政职业能力倾向测验(AAT)
特殊能力测验
音乐能力测验
美术能力测验
机械能力测验
创造力测验
发散思维与创造力测验
吉尔福特发散思维测验
托伦斯创造思维测验
创造力测验的局限性
人格测量
人格测量的信度和效度问题(真实性问题)
自陈量表的编制和特点
自陈量表
《明尼苏达多项人格调查表》(MMPI);宋维真 修订MMPI,可用于测量16岁以上具有初中文化程度的中国人;常模产用T分数 ;10个临床量表,4个效度量表:
说谎量表(L):分数高表示回答不真实
诈病量表(F):分数高表示诈病或确系严重偏执
校正量表(K):分数高表示一种自卫反应
疑问量表(Q):并非真正的量表,是指量表中无法回答的题目数,无法回答的项目超过一定的标准,则认为此答卷不可靠
《卡特尔16种人格因素量表》(16PF)
可测量初中以上文化程度的人,由戴忠恒,祝蓓里修订;常模产用标准10分制
《艾森克人格问卷》(EPQ);常模产用T分数
三个基本维度
精神质
外倾性
神经质
4个分量表
精神质(P)
外倾性(E)
神经质(N)
说谎量表(L)
投射测验
投射测验的特点
投射测验的理论基础
罗夏克墨迹测验
主题统觉测验(TAT)
内隐联想测验(LAT)
内隐联想测试(LAT)的概念
内隐联想测试的主要理论是双重态度理论
其他心理与教育测验
焦虑测验
显性焦虑量表(MAS),主要是为了研究焦虑对学习的动机或驱力作用
《状态-特质焦虑量表》(STAI),自陈形式,适用于个别或团体施测,无时间限制
测验焦虑量表
测验焦虑问卷(TAQ)
测验焦虑量表(TAI)
其他临床焦虑量表
《贝克焦虑量表》
《汗密顿焦虑量表》
兴趣测验
《斯特朗职业兴趣调查表》(SVIB)
《库德职业兴趣调查表》(KOIS)
自我指导问卷(SDS)
态度和品德测量
态度测量
《等距量表》法
《利克特量表》法
《哥特曼量表》法
品德测量
情境测验法
问卷测量法
测量应用实务
人事测评
胜任力模型
胜任力测评方法
经典心理测验
智力测验
个性测量
专业知识技能测验
多项能力倾向测验
常用的评价中心方法
无领导小组讨论
文件筐测验
案例分析
测验的滥用和误用
心理诊断
在职业生涯发展咨询中的应用
在神经症,人格障碍等咨询中的应用
心理测量在咨询中的滥用与误用
教育评价
在测量学生的学习与发展状况中的应用
测量在教师与管理者评价中的应用
心理测量在教育评价中的滥用与误用
测量理论与应用的新发展
项目反应理论(IRT)
经典测量理论的局限
项目反应理论的优良性质
项目反应理论的应用
概化理论(GT)
认知诊断