导图社区心理与教育测量

心理与教育测量

这是一篇关于心理与教育测量的思维导图，主要内容有心理与教育测量概论、心理与教育测量简史、经典测量理论的基本假设等。

编辑于2022-07-23 00:27:30

free

他的近期作品查看更多>>

心理与教育测量
这是一篇关于心理与教育测量的思维导图，主要内容有心理与教育测量概论、心理与教育测量简史、经典测量理论的基本假设等。

心理与教育测量

社区模板帮助中心，点此进入>>

free

他的近期作品查看更多>>

心理与教育测量
这是一篇关于心理与教育测量的思维导图，主要内容有心理与教育测量概论、心理与教育测量简史、经典测量理论的基本假设等。

相似推荐
大纲

妈妈必读：一张0-1岁孩子认知发展的精确时间表
- 11.7k
- 1.8k
- 412
- 39
- 0
Ethan
英语词性
- 64.3k
- 6.6k
- 2.4k
- 578
- 0
Ethan
法理
- 29.6k
- 67
- 376
- 49
- 1
Dasein
刑法总则
- 39.9k
- 148
- 966
- 156
- 0
Dasein
【华政插班生】文学常识-先秦
- 6.0k
- 4
- 70
- 2
- 0
Dasein
【华政插班生】文学常识-秦汉
- 3.6k
- 0
- 54
- 10
- 0
Dasein
文学常识：魏晋南北朝
- 4.5k
- 3
- 90
- 20
- 0
Dasein
【华政插班生】文学常识-隋唐五代
- 5.2k
- 8
- 98
- 6
- 0
Dasein
【华政插班生】文学常识-两宋
- 3.4k
- 5
- 70
- 8
- 0
Dasein
民法分论
- 9.9k
- 37
- 291
- 28
- 0
Dasein

心理与教育测量

心理与教育测量概论

测量的含义

一定的法则

量尺

事物的特征

定量描述

测量的精度

根据测量对象本身的性质分为

确定型

随机型

模糊型

测量的种类

物理测量

对事物物理特征的测量（长度，重量，面积，速度）

生理测量

对机体生理特征的测量（比如对动植物各种化学成分含量的测量）

社会测量

对社会现象的测量（如人口普查，经济统计，民意调查）

心理测量

对人的心理特征的测量（智力测量，人格测量，职业兴趣测量）

测量的2个基本要素

参照点

绝对参照点

以绝对零作为测量的起点，如长度

相对参照点

以人为确定的零点为测量的起点，如温度

单位

测量单位应有确定的意义，同一单位所有人的理解应是相同的

测量单位要有相等的价值，不同单位之间的距离应该是相等的

测量的量表

称名量表

顺序量表

等距量表

比率量表

心理与教育测量的理论基础

凡客观存在的事物都有其数量

凡有其数量的事物都可以测量

心理与教育测量的量表属于顺序量表

参照点为相对参照点

单位不完善，不等值

心理测验的四个基本条件

行为样本

标准化

测验内容

测验条件

相同的测验情境

相同的指导语

相同的测验时限

评分规则

测验常模

难度或应答率

信度和效度

心理与教育测验的种类

按测量对象分类

智力测验

能力倾向测验

成就测验

人格测验

按测量方式分类

个别测验

团体测验

按测验内容的形式分类

文字（纸笔）测验

非文字（操作）测验

按测验功能分类

成就测验与预测测验

难度测验与速度测验

描述测验与诊断测验

按评价所参照的标准分类

常模参照测验

目标参照测验

潜力参照测验

心理与教育测验的价值与作用

理论研究功能

收集研究资料

建立和假设理论假设

实验分组

实际应用功能

人才选拔

人员安置

心理诊断

描述评价

心理咨询

心理与教育测量简史

中国古代的心理与教育测量

能力测量

孔子，凭借自己的经验观察首先评定学生能力的个别差异，将人的智力人为三个等级（中上之人，中人，中下之人）

刘邵，《人物志》-研究能力（也包括性格）的专门著作

益智图（俗称七巧板），九连环可以认为是最早的智力和创造力测验

人格测量

孔子，提出性格类型的观点。把人分为三种（狂者，狷者，中行）

刘邵，根据五行和形体及其人的行为表现，把人的性格分成12种类型

教育测量

世界上最早的教育测量出现在中国西周奴隶制时期，《礼记·学记》

现代心理教育与测量的起源

促使产生心理与教育测量技术最重要的因素是社会发展的需要

1879年，德国心理学家冯特在莱比锡大学建立了世界上第一个心理实验室

1837年，法国医生沈干创办了第一所专门教育智力落后儿童的学校

19世纪，法国医生艾斯克罗尔首次对智力落后和精神病做了区分

心理与教育测量的早起探索者

高尔顿，出版《遗失的天才》，在伦敦国际博览会成立“人类测量实验室”

科特尔，在《心理》杂志发表《心理测验与测量》，首次提出了“心理测验”这个术语

比内与其助手西蒙合作完成了世界上第一个智力测验量表：比内-西蒙量表（该量表主要用来识别智力落后的儿童）

心理与教育测量运动的发展

推孟，修订理论斯坦福-比内量表，开始采用比率智商的概念来表示智力水平的高低；在修订比内-西蒙量表时将其改为“智商”

英国心理学家斯皮尔曼首先运用因素分析方法研究智力结构，提出智力结构的“二因素理论”

美国心理学家威克斯勒相继编制了“韦氏儿童智力量表”，“韦氏成人智力量表”，“韦氏幼儿智力量表”。他舍弃了比率智商，用离差智商代替

桑代克编制了第一个标准化的教育成就测验，被公推为教育测量的鼻祖

凯利，鲁奇和推孟合作编制了第一个成套成就测验：“斯坦福成就测验”

最早进行人格测量的是克雷培林，他最早用自由联想法诊断精神病人

经典测量理论的基本假设

测量误差的种类

随机误差

由与测量目的无关，偶然因素引起的而又不易控制的误差

系统误差

由与测量目的无关变化因素引起的一种恒定而有规律的误差

测量误差的来源

测量工具

测量对象

施测过程

真分数（T分数），观察分数

CTT的数学模型和基本假设

X=T+E

测量信度

信度概述

信度系数（信度系数，rxx）；真分数变异（ST²）；总变异数（实得变异数，Sx²）

信度类型及其含义

重测信度

副本信度

分半信度

同质性信度

评分者信度

影响测量信度的主要因素

被试

主试

施测情境

测量工具

两次施测的间隔时间

提高测量信度的常用方法

适当增加测验长度

使测验中所有试题难度接近正态分布，并控制在中等水平

努力提高测验试题的区分度

选取恰当的被试团体

主试严格执行实测流程

信度标准

标准化能力或学绩测验信度应在0.9以上

人格测验信度应在0.8以上

教师自编学绩测验的信度0.6以上

测量效度

效度概述

效度（r² xy）；效度系数（rxy）；效度系数是效度的平方根

信度与效度的关系

效度高信度必然高；信度高效度不一定高

心理效度的类型，含义及应用范围

内容效度

逻辑分析法

复本法

再测法

结构效度

实证效度

相关法

点二列相关

二列相关

φ相关

积差相关

区分度与难度的关系

难度越接近0.5时，项目潜在的区分度越大；而难度越接近1或0时，项目潜在的区分度越小；所以应使所有项目都保持在0.5的难度最为理想

区分度的相对性

不同的计算方法所得的区分度值不同

样本容量的大小影响区分度值的大小

分组标准影响鉴别指数值

被试样本的同质性程度影响区分度值的大小

猜测矫正公式

CP=KP-1/K-1

多个项目组成的测验分数矫正公式

S=R-W/K-1

心理与教育测验的编制与实施

心理与教育测验的编制

确定测验目的

明确测量对象

明确测量目标

明确测量用途

制定编题计划

全面而具有代表性的内容，不指示测题偏离应测的范围

对各个内容点的相对重视程度

编制测验项目

收集测验资料

资料要丰富，要有普遍性，有趣味性

选择项目形式

使受测者容易明了测验方法

使受测者在完成测验时不会因测验项目的形式不当而做错

测验过程省时

计分省时省力

经济

编写测验项目

测验项目的取样应当对预测心理品质具有代表性

测验项目的取材范围要同编题计划所列项目范围相一致

测验项目的难度应有一定的分布范围

编写测验项目的用于要力求精炼简短，浅显明了

初编题目数量要多于最终所需要的数量，以便筛选或编制复本

测验项目的说明必须简明

预测与项目分析

预测

项目分析

合成检验

测验项目的选择

测验的性质

项目的难度

项目的区分度

测验项目的编排

并列值进式

混合螺旋式

编制复本

测验标准化

测验内容

对受测者施测相同或等值的题目，测验内容不同，结果无法比较

施测过程

相同的测验情境

相同的指导语

相同的测验时限

测验评分

只有当评分是客观的时候才能将分数差异归于受测者本身的差异，不同评分者一致性达到90%便可认为是客观的

测验分数的解释

测验结果解释的标准化，如果对同一测验结果可作出不同的解释，那么测验便失去了客观性

测验结果只有与一定的参照标准相比较，才能显现出它所代表的意义

鉴定测验

信度

效度

测验量表与常模

编写测验说明书

本测验的目的用功用

本测验的理论依据

测验内容及实施方法

测验标准答案和评分方法

关于测验信度，效度资料的说明

常模表，即如何依据常模节省测验结果

心理与教育测量的实施

测验分数的实施过程

测试前的准备工作

指导语

测验情境

测验焦虑

与受测者建立良好的协调关系

评分技术

测验分数的解释

测验分数的意义

如何向受测者报告测验分数

常模参照测验

常模参照测验是用常模来解释个人测验分数的一种测验，它是以团体的心理水平来衡量个体心理水平。常模参照测验的主要目的在于将受测者的表现与该团体中其他受测者相比较，从而区分不同的受测者，确定每个受测者的心理水平在总体中的相对位置。

标准参照测验

标准参照测验将被试与一绝对标准相比较，以评价被试有无达到该标准为目的。

常模

测验的常模是指一个具有代表性的样组在某种测验上的表现情况，或者说，是一个与被试同类的团体在相同测验上得分的分布状况与结构模式

常模团体

常模团体是具有某种共同特征的人所组成的一个群体，或是该群体的一个样本

确定常模团体的注意事项

群体构成的界限必须明确

常模团体必须是所测群体的一个代表性样本

取样的过程必须明确且有详尽的描述

样本大小要适当

常模团体必须是近时的

注意一般常模与特殊常模的结合

常模的编制步骤

确定测验将来所要应用的总体

根据测验群体，选定最基本的统计量，如平均数，标准差，百分等级等

决定抽样误差的允许界限，如平均数的抽样误差等

设计具体的抽样方法，估计出最小样本容量，对群体进行抽样，得到常模团体

对常模团体施测，获得团体成员的测验分数及分数分布，并计算样本统计量及其标准误等

确定常模分数类型，制作常模分数转换表，即常模量表

编写常模化过程和常模分数的书面指导材料。

分数转换

原始分数与导出分数

百分等级分数

标准分数

标准分数的变式

T分数

T=10Z+50

美国大学入学考试委员会使用的标准分数CEEB

CEEB=100Z+500

韦氏智力测验采用的离差智商

IQ=15Z+100

我国出国人员英语水平考试EPT

EPT=20Z+90

标准九分数

5+2Z（标准九分数以5为平均数，2为标准差）

分数合成

分数合成的种类

项目的组合

分测验和量表的组合

测验或预测源的组合

分数合成中的问题

采用什么方法合成分数

什么形式是最适当的分数组合

需要多少及何种测验分数作最适当的组合分数

分数合成的方法

临床诊断-直觉合成

加权求和合成

多重回归

多重划分

常模参照测验分数的解释与应用

发展量表

年龄常模

年级常模

商数

教育商数

EQ=教育年龄/实际年龄*100=EA/CA*100

成就商数

AQ=教育年龄/智力年龄*100=EQ/IQ*100

百分等级常模

简单转化表

复杂转化表

标准分数常模

剖析图

目标参照测验

1962年戈莱赛和克劳斯首先提出目标参照测验的概念

目标参照测验的应用

目标参照测验和常模参照测验的区别是：前者关心学生有没有达到预定的学习目标，后者着重于学生之间的比较。常模参照测验适用于选拔性考试和总结性评定；而目标参照测验适用于诊断和发现学生的不足，从而为改进教学提供反馈信息。

信度及其估计

分类一致性信度

考察被试在同一测验的两次施测中或两个副本的施测中是否被分在同一类中

方差分析方法--荷伊特信度

效度及其估计

内容效度

校标关联效度

测验项目的难度和区分度分析

测验的预测

前侧-后侧方法

已接受教学组-未接受教学组方法

对照组方法

测验项目的难度分析

通过率

测验项目的区分度分析

难度差值

掌握组-未掌握组鉴别指数D：K=PA-PB

个人获得指数DIG：采用前后侧方法，可获得在前侧中错误回答某项目而在后侧中能够正确回答的被试人数比例，即该项目的个人获得指数，其值在0~1之间变化

相关系数：项目得分和测验总分之间的一致性程度

分数分界点的制定

专家判定法

Nedelsky方法

Angoff方法

Bookmark方法

效标组预测法

临界组法

对照组法

测验等值

从本质上来说，测验等值就是通过对考核同一种心理品质的多个测验形式做出测量分数系统的转换，进而使得这些不同测验形式的测验分数之间具有可比性

测验等值的条件

同质性

等信度

公平性

可递推性

对称性

样本不变性

测验等值的一些基本概念

经典理论等值与项目反应理论等值

测验分数等值与项目参数等值

水平等值与垂直等值

测验等值中的一些专用技术名词

测验等值设计

锚测验

数据平滑法

等值标准误差

等值偏差

测验等值结果的表示方法

表列法

公式法

图式法

测验等值的一般步骤

确定等值目标

进行等值设计

施测并采集测验数据

选择一个等值的操作性定义

选择一种等值关系计算方法进行等值计算，获取等值结果

评价等值结果

测验等值计算的基本方法

等百分位等值

两个分数在各自测验中的百分等级相等

线性等值

两个分数在各自测验中的标准分数相等

学籍测验

学籍测验的定义

“学籍”一次通常是指个体经过对某种知识或技术的学习或训练之后所取得的“成绩”，一般表现为个体心理品质在知识，技能或某种能力方面的增加和提高，是个体认知性心理品质的发展。学籍测验是对个体在一个阶段的学习或训练之后知识，技能的发展水平的测定

学籍测验与其他测验的区别

与一般心理测验的区别

与典型行为测验的区别

与能力测验的区别

与一般的性向测验的区别

学籍测验的作用

学籍测验的分类

按测验的编制方法分

教师自编课堂测验

标准化学籍测验

按测验内容分

语文测验，数学测验，生物测验等

按测验的用途分

考察性测验

诊断性测验

按测验评分系统的参照系分

常模参照性测验

目标参照性测验

按测验的题型分

定向反应型（客观型试题）

自由反应型（论文式试题）

标准化学籍测验

标准化学籍测验的基本要求

命题组卷标准化

施测标准化

评分标准化

测验分数解释标准化

能力测验（上）

智力的心理测量学理论

智力二因素论

斯皮尔曼提出：G因素，特殊（S）因素

智力多因素论

瑟斯顿提出：7种最主要，最基本的心理能力：语文理解，言语流畅性，推理，空间表象，数字，记忆，知觉速度

智力层次理论

弗农提出：智力三层次模型：G因素处于智力结构的最高层，第二层是言语能力和操作能力两个因素，第三层是数学，语文，空间知觉等

智力的生物学理论

詹森的智力振荡理论

智力的认知心理学理论

斯坦伯格的智力理论

根据成分概况水平分类

一般成分

类成分

特殊成分

根据成分功能分类

操作成分

元成分

知识获得成分

PASS模型

计划-注意-同时性加工-继时性加工

传统智力测验的若干问题

传统智力测验的结构效度

传统智力测验的功能

传统智力测验的公平性

性别差异

职业差异

文化和教育差异

传统智力测验的预测效度

智力随年龄成熟而发展

智力随环境而变化

智力随个性特质的不同而产生不同变化

传统智力存在的合理性

个体智力测验

比内量表

比内-西蒙量表

比内和西蒙出于诊断异常儿童智力的需要，于1905年编制而成的世界上第一个智力量表

斯坦福-比内量表

1916年量表，首次引入比率智商的概念，开始以IQ作为个体智力水平的指标

1960年量表，舍弃比率智商，引入了离差智商概念，以平均数100，标准差为16的离差只是作为智力评估指标

2003年量表，平均数为100，标准差改为15

中国比内测验

陆志伟1916年最早对比内智力量表进行修订《中国比内西蒙智力测验》

韦克斯勒量表

韦氏成人智力量表

韦克斯勒-贝尔韦量表 W-B I

第一个成人智力测验，W-BI和W-BII主要用于测量10-60岁被试

韦氏成人智力量表WAIS-IV

增加了评估流体智力，工作记忆和加工速度的分测验。4个指数得分：言语理解指数（VCI），知觉推理指数（PRI），工作记忆指数（WMI），加工速度指数（PSI）

韦氏成人智力量表中国修订本

1982年龚耀主持修订WAIS的中国修订版本WAIS-RC

韦氏儿童智力量表

韦克斯勒在W-B I 的基础上修订而成，采用离差智商代理比率智商

韦氏儿童智力量表第四版（WISC-IV），以6岁正到16岁11月的人为对象。量表结果变为“四指数”结构：言语理解指数，知觉推理指数，工作记忆指数，加工速度指数

韦氏儿童智力量表中国修订本

WISC-R，1979年由林传鼎，张厚粲提出，1981年底初步完成修订工作

韦氏幼儿智力量表

WPPSI出版于1967年，适用于4~6岁的儿童

戴斯的认知测验

戴斯-纳格利尔里认知评估系统（CAS），经常被用来分析阅读障碍儿童在认知历程中的个别差异及个体的内在差异

团体智力测验

陆军测验

瑞文推理测验

瑞文标准推理测验

适用于5.5岁及以上智力发展正常的人

瑞文彩图推理测验

适用于幼儿和智力低于平均水平的人

瑞文高级推理测验

适用于智力高于平均水平的人

瑞文标准推理测验中国修订版

1985年，张厚粲教授开始主持

认知能力测验

能力测验（下）

能力倾向测验

能力倾向测验，成就测验，智力测验之间的区别

具体能力倾向测验介绍

学术能力倾向测验（SAT）

分辨能力倾向测验（DAT）

一般能力倾向成套测验（GATB）

行政职业能力倾向测验（AAT）

特殊能力测验

音乐能力测验

美术能力测验

机械能力测验

创造力测验

发散思维与创造力测验

吉尔福特发散思维测验

托伦斯创造思维测验

创造力测验的局限性

人格测量

人格测量的信度和效度问题（真实性问题）

自陈量表的编制和特点

自陈量表

《明尼苏达多项人格调查表》（MMPI）；宋维真修订MMPI，可用于测量16岁以上具有初中文化程度的中国人；常模产用T分数；10个临床量表，4个效度量表：

说谎量表（L）：分数高表示回答不真实

诈病量表（F）：分数高表示诈病或确系严重偏执

校正量表（K）：分数高表示一种自卫反应

疑问量表（Q）：并非真正的量表，是指量表中无法回答的题目数，无法回答的项目超过一定的标准，则认为此答卷不可靠

《卡特尔16种人格因素量表》（16PF）

可测量初中以上文化程度的人，由戴忠恒，祝蓓里修订；常模产用标准10分制

《艾森克人格问卷》（EPQ）；常模产用T分数

三个基本维度

精神质

外倾性

神经质

4个分量表

精神质（P）

外倾性（E）

神经质（N）

说谎量表（L）

投射测验

投射测验的特点

投射测验的理论基础

罗夏克墨迹测验

主题统觉测验（TAT）

内隐联想测验（LAT）

内隐联想测试（LAT）的概念

内隐联想测试的主要理论是双重态度理论

其他心理与教育测验

焦虑测验

显性焦虑量表（MAS），主要是为了研究焦虑对学习的动机或驱力作用

《状态-特质焦虑量表》（STAI），自陈形式，适用于个别或团体施测，无时间限制

测验焦虑量表

测验焦虑问卷（TAQ）

测验焦虑量表（TAI）

其他临床焦虑量表

《贝克焦虑量表》

《汗密顿焦虑量表》

兴趣测验

《斯特朗职业兴趣调查表》（SVIB）

《库德职业兴趣调查表》（KOIS）

自我指导问卷（SDS）

态度和品德测量

态度测量

《等距量表》法

《利克特量表》法

《哥特曼量表》法

品德测量

情境测验法

问卷测量法

测量应用实务

人事测评

胜任力模型

胜任力测评方法

经典心理测验

智力测验

个性测量

专业知识技能测验

多项能力倾向测验

常用的评价中心方法

无领导小组讨论

文件筐测验

案例分析

测验的滥用和误用

心理诊断

在职业生涯发展咨询中的应用

在神经症，人格障碍等咨询中的应用

心理测量在咨询中的滥用与误用

教育评价

在测量学生的学习与发展状况中的应用

测量在教师与管理者评价中的应用

心理测量在教育评价中的滥用与误用

测量理论与应用的新发展

项目反应理论（IRT）

经典测量理论的局限

项目反应理论的优良性质

项目反应理论的应用

概化理论（GT）

认知诊断