导图社区 《现代心理与教育统计学》第五章相关关系
本思维导图的内容是《现代心理与教育统计学》第五章 相关关系 笔记,欢迎大家前来学习量数的相关关系。
编辑于2022-01-12 00:09:45相关量数
概述
相关的概念
相关量数用于描述双变量之间数据相互之间的关系
一般来说,事物之间有三种关系
因果关系,即一种现象是另一种现象的原因
共变关系,即表面上看起来有联系的两种事物都与第三种现象有关
相关关系,事物之间存在联系但又无法确定是因果关系或共变关系
相关的类别
按方向分
正相关,即两个变量变动方向相同
负相关,变量变动方向相反,一增一减或一减一增
零相关,即两个变量之间没有线性关系
相关程度
完全相关
A和B变化完全对应,表现为坐标上的一条直线
强相关
A变化时,B增大(或减少)的可能性非常大。表现为散点图较为集中在某条直线的周围
弱相关
A变化时,B增大(或减少)的可能性较少,表现为散点图较为分散的集中在某条直线的周围
零相关
A变化时,B或增大或减少,毫无规律
形状
直线相关
曲线相关
相关系数
相关系数的含义
相关系数时两个变量间相关关系强度的数量化指标,作为样本的统计量用r表示。
作为总体参数表示为
其取值范围是[-1,1],正负号表示方向,绝对值大小表示相关的程度
解释相关系数的注意事项
高相关不一定有因果关系
一般来说,相关系数的绝对值越大,表示相关程度越密切。但需要注意相关系数受样本容量n的影响,如果n很小,可能完全没有关系的两个事物之间也能计算出较大的相关系数(即伪相关或虚假相关),因此,一般来说在计算相关时要求样本容量n大于等于30
相关系数是顺序数据,只能比较大小,不能用倍数关系说明
计算相关系数时要求成对数据
没有线性相关(即零相关),不一定没有关系,可能时非线性相关
散点图
在直角坐标系里,以X、Y二列变量的一列变量为横坐标,以另一列变量为纵坐标,把每对数据当成一个平面上的点,一一描绘在该坐标系中,产生的图形就称为散点图。散点图通过点的散布形状和疏密程度来显示两个变量的相关趋势和相关程度,能够对原始数据间的关系做出值观而有效的预测和解释
若散点图呈左低右高的椭圆形表明两列变量呈正相关;若散点图呈左高右低的椭圆形表明两列变量呈负相关;若散点图的分布呈正圆形,则表明两列变量之间没有线性关系
积差相关
也就是Pearson相关、积矩相关
前提
数据要成对出现(N大于等于30),即若干个体中每个个体都有两种不同的观测值,并且每对数据与其它对数据相互独立
两列变量各自总体的分布都是正态的,至少接近正态
两个相关的变量是连续变量,也即两列数据都是测量数据
两列变量之间的关系应是线性的
计算公式
运用标准差与离均差的计算公式
其中,N为成对数据的数目,Sx为X变量标准差,Sy为Y变量的标准差
运用标准分数计算
Zx为X变量的标准分
Zy为Y变量的标准分
运用原始数据计算
计算积差相关系数的差法公式
减差法
加差法
相关系数的合并
“合并”是指计算相关系数的平均数,不是求和。合并的前提是各样本同质。相关系数合并的具体步骤如下
查费舍Z-r转换表,先将各样本的r转换成Z分数
求每一个样本的Z分数之和
使用下列公式求平均Z分数
ni为各样本的成对数目,Zi为经由Z-r转换表转化得到的各样本r对应的Z分数
平均Z分数经过费舍Z-r转换为相应的r值,即平均r
积差相关的应用
重测信度

实证效度
项目(非0、1计分)的区分度
等级相关
适用范围
当研究考查的变量不是等比或等距数据,而是顺序型数据时,也适用于称名数据
考查的变量是等比或等距数据,但是总体分布不是正态。等级相关对变量的总体分布不做要求,因此这种相关法为非参数的相关方法
斯皮尔曼等级相关
相关定义及条件
符号
根据两列变量的成对等级差数计算相关系数,又叫“等级差数法”
条件
成对
线性相关
无正态假设
无大样本限定
结论
比皮尔逊积差相关应用范围广
计算公式
基本计算公式
将原始数据转化为顺序型数据后,无相同等级时用
N为成对数据个数,D为成对数据的等级之差
直接运用等级计算
N为等级对数
为两列变量各自排列的等级序数
有相同等级时的校正计算公式
N为数据的对数;n为相同等级的数目
肯德尔W系数
定义
肯德尔W系数又称和谐系数,是表示多列等级变量相关程度的一种方法
适用范围
采用等级评定的方法手机等级数据,即让K个评委(被试)评定N件事物,或1个评委(被试)现后K次评定N间事物
每个评价者对N间事物排出一个等级顺序,最小的等级序数为1,最大的为N,若并列等级是,则平分共同应该占据的等级
计算公式
无重复等级
为第i个事物的等级之和
N:被评价的事物
K:评委数量
校正公式-重复等级
n为相同等级的数目
肯德尔U系数
适用资料
评价者采用对偶比较的方法,将N件事物两两配对,然后对每一对中两事物进行比较,择优选择,优者记1,非优者记0,最后整理成相对应的评价结果
计算公式
N:被评事物的数目,即等级数
K:评价者的数目
:对偶比较记录表格中的择优分数
注意
肯德尔U系数在评价者完全一致时,U=1;完全不一致时,U=-1/K(K为奇数)或U=-1/(K-1)(K为偶数)。
质量相关
当两列变量一列为等比或等距数据(量),一列是按性质划分的类别时(质),计算这两列数据的线性相关为质量相关,主要包括点二列相关、二列相关和多列相关
点二列相关
适用资料
适用于一列数据为正态等距或等比变量,另一列为离散型二分变量
计算公式
二列相关
适用资料
两列变量都是正态等距或等比变量,但其中一列变量被人为地分成两类
计算公式
y为标准正态曲线中p值对应的高度,查正态分布表能够得到
在测量中用于测验效度和试题区分度的分析
品质相关
用于表示R x C表的两个变量之间的关联程度的相关,主要包括四分相关、phi相关和列联表相关
相关
适用资料
适用于两列真正二分变量相关的计算
计算公式
四分相关
适用条件
四格表的二因素都是连续的正态变量,只是人为地将其按一定标准划分为两个不同的类别
计算公式