导图社区 心理学统计
主要根据《现代心理与教育统计学》第四版整理的笔记。第二节平均数的显著性检验:1.总体正态分布、总体方差已知;2.总体正态分布、总体方差未知。
编辑于2022-12-18 16:25:55 海南心理学统计
第一章 绪论
第一节 统计方法在心理和教育科学研究的作用
性质与定义
特点
研究数据与结果多用数字形式呈现
研究数据具有随机性和变异性
随机因素:指观测过程中一些偶然的不可控制的因素,是造成数据变异的原因
随机误差:随机因素使测量产生的误差
研究数据具有规律性
研究的目标是通过部分数据来推测总体特征
学习的注意事项
注重科研道德
正确选用统计方法
分析实验设计是否合理
分析实验数据的类型
不同类型的数据所使用的统计方法不同
分析数据的分布规律
第二节 心理与教育统计的内容
内容
根据功能分类
1. 描述性统计(descriptive statistics)
具体内容
1||| 数据如何分组,如何使用统计图表描述一组数据的分布情况
2||| 怎样计算一组数据的特征值
表示数据集中情况的特征值:
算数平均数、中数、众数、几何平均数、调和平均数等
表述数据分散情况的特征值
平均差、标准差、变异系数、标准分数
3||| 表示一事物属性间的相互关系的描述及相关系数的计算和应用
描述数据分布特征的峰度和偏度系数
统计图表
差异量数
集中量数
相关分析
2. 推论统计
具体内容
主要研究通过局部数据推论总体的情形
推论统计的理论和原理
抽样理论
主要讨论在什么情况下可以从样本的特性推论出总体的特性
最重要的条件:样本抽取的原则(抽样的随机性,使推论能有准确性)
估计理论
主要根据随机抽样的结果来估计总体分布的参数值
分为点估计和区间估计
统计检验原理
主要是根据实际的抽样结果来推论总体特征的假设是否与具体的随机抽样所提供的信息相一致
包括
1||| 对假设进行检验
大样本检验方法(Z检验)
小样本检验方法(t检验)
计数资料的检验方法(百分数检验、χ²检验)
变异系数分析的方法(F检验)
回归分析法
2||| 总体参数(特征)的估计方法
3||| 非参数的统计方法
统计估计
参数估计
点估计
区间估计
非参数估计
假设检验
参数检验
非参数检验
3. 实验设计
样本选择与分配
实验误差分析
方差分析
协方差分析
回归分析
因子分析
一、描述统计(descriptive statistics)
主要研究实验或调查得来的数据,描述数据全貌,表达性质
内容
数据分组
计算特征值
表示数据集中情况
算术平均数、中位数、众数、几何平均数、调和平均数
表示数据分散情况
平均差
标准差
变异系数
标准分数
属性间相互关系的描述及相关系数的计算和应用
二、推论统计(inferential statistics)
主要研究如何通过局部数据所提供的信息,推论总体的情形
统计方法
1. 如何对假设进行检验
大样本检验方法(Z检验)
小样本检验方法(t检验)
各种计数资料的检验方法(百分数检验、X²检验)
变异数分析方法(F检验)
回归分析方法
2. 总体参数的估计方法
3. 各种非参数的统计方法
推论统计的理论
抽样理论
在什么情况下可以从样本的特性,推论出总体的特性
重要原则
样本抽取的原则:随机性
估计理论
根据随机抽样的结果来估计总体分布的参数
分为
点估计
区间估计
统计理论
三、实验设计(experimental design)
主要目的在于研究如何科学经济有效地进行实验
研究内容(三个方面)
第三节 心理与教育统计的发展
发展历程
威廉·配第——统计学之父
英国书数学家
最有名的发明是复印机
最著名的著作是《政治算数》(统计学的相关作品)
政治算数即用数字表达国情事实
名言:“我们用长度和重量来反映一个国家的情况”
为近代统计学奠定了基础
统计学的理论基础——概率论与正态分布曲线的产生
16世纪,伽利略
提出概率论的基本理论
17世纪,法国数学家帕斯卡和费马
创立了概率论,奠定了统计学发展的重要理论基础
17世纪末-18世纪初,瑞士数学家贝努里定理
创立了贝努里定律,其为发现正态分布创造了条件
1733年,棣莫弗
提出正态分布概率和概率的乘法运算法则,推广贝弗里定律,推导出“正态曲线方程”
高斯
首次提出正态分布曲线
泊松
提出“大数定理”
这个时期的概率论成为古典概率论
数理统计的产生与发展——描述统计学与推论统计
比利时的统计学家凯特勒
首先提出一概率论为理论基础确立统计研究方法
德国的韦特斯坦
首次提出“数理统计”一词
数理统计的发展经历了两个阶段
描述统计学
产生于20世纪20年代之前
高尔顿
提出中位数、百分位数、四分差
皮尔逊
高尔顿的学生
提出相关和回归概念及其系数的计算
发表了频率曲线理论,提出直线相关系数的计算方法
为大样本定理奠定基础
推论统计学
格赛特
小样本理论(t分布)
是根据样本资料估计均数的检验方法
费舍
推论统计真正的创始人
对 t 分布给出理论论证,使之得以推广
提出F分布,使方差分析系统化
提出随机化概念,建立了点估计和区间估计理论
名著
《研究工作者用统计方法》
1956年《统计方法与科学推论》
第四节 心理与教育统计基础概念
一、 数据类型
按数据的观测方法和来源分
计数数据(count data)
指计算个数的数据
具有独立的分类单位
一般取整数形式
如人口数、学校数
测量数据(measurement data)
指借助于一定的测量工具或一定的测量标准获得的数据
如身高、体重、考试分数、智力测验分数、感觉阈值等
根据数据反映的测量水平分
称名数据
只说明事物间属性上的不同或类别上的差异
具有独立的分类单位
一般取整数形式
如性别、颜色类别、人口数、学校数,对某一事物的态度(支持、反对、无意见)
顺序数据
无相等单位,无绝对零
是按照事物某种属性的多少或大小,按次序排列后的数据
不能进行加减乘除运算
如学生的等级评定、喜爱程度、品质等级、能力等级、兴趣等
离散数据
等距数据
有相等单位,无绝对零
在某个区间内具有相等单位
如温度、各种能力分数、智商等
只能使用加减运算,不能乘除运算
比率数据(radio data)
有绝对零
既表明量的大小、也有相等的单位
如身高、体重、反应时、各种感觉阈值的物理量
连续数据
根据数据是否具有连续性分
离散数据(dicrete data)
又成为不连续数据
一般取整数
在任何两个数据点之间所取的数值的个数是有限的
如从事某一职业的人数、球赛比分、班级个数等
连续数据(continuous data)
指任意两个数据点之间的数值是无限的
如年龄、长度、重量、自信心分数
二、 变量、观测值、随机变量
变量(variables)
指实验、观察、调查中想要获得的数据
获得具体数值前用“X”表示
观测值(observation)
指变量已确定的值,即具体数据(data)
随机变量
指取值之前无法预料能取什么值的变量
用X或Y表示
常数(constant)
在一定范围内数值不会随意改变
取值
数值一般表示一段区间的中间点,年龄的数值则指开始点
三、 总体、样本与个体
个体(individual)
是构成总体的每个基本单元
总体(population)
指具有某种特征的一类事物的全体
总体中有限个体的数目用 N 表示
总体本身的大小,是有限还是无限,要依据研究问题的推论范围而定
样本(sample)
是从总体中抽取的一部分个体
有时个体也称为一个随机事件或样本点,总体被称为样本空间,样本就是样本点的某个集合
样本大小(sample size) 或样本容量(capacity of sample)
是实验中被试的数目,或一个观测重复的次数
一般用n表示
n>30为大样本
n<=30为小样本
n越大,对总体的代表性越强
四、 次数、比率、频率
随机事件
简称事件
次数或频数(frequency)
是某一事件在某一类别中出现的数目,用 f 表示
比率
是两个数的比
当分子表示分母所表示事物的一部分时又称为比例,百分数或百分率是比例的另一种表示形式
频率
又称相对次数,是某一事件发生的次数与总的事件数的比
用比例(proportion)或百分数(percent)表示
概率
又称几率或然率(probablity),用P 表示
指某一事件在无限的观测中所能预料的相对出现的次数
是反映事物出现可能性大小的量
五、 参数和统计量
参数(parameter)或总体参数
是描述一个总体的统计指标
指总体的特性
是一个常数
用希腊字母表示
如
总体平均数或期望:μ(mu) 总体标准差:σ(sigma) 总体方差:σ² 总体相关系数:ρ(rho) 总体回归系数:β
统计量(statistics)
样本的特征值,又称特征值
代表样本的特性,是一个变量,随样本的变化而变化
用英文字母表示
如
样本平均数:
样本标准差:s(或SD) 样本方差:s²
样本相关系数:r
样本回归系数:
关系
当总体大小一致并与实验观察的总次数相同时,二者在树枝上是统一统计指标
当总体无限时,统计量与总体参数不同,但前者可以在某种程度上作为后者的估计值
反映集中情况
总体平均数或期望:μ
样本平均数:
反应分散情况
总体标准差:σ 总体方差:σ²
样本标准差:s(或SD) 样本方差:s²
反映事物的两个特性的关系
总体相关系数:ρ
样本相关系数:r
表示两个特性之间的数量关系
总体回归系数:β
样本回归系数:
第二章 统计图表
统计图表
统计表的特点
简明、清晰、准确
统计图的特点
简明、有规律、具体形象
统计指标
指经过统计分类后的数量结果
在制作统计图表之前要进行数据整理,数据整理的基本方式:
排序
统计分组
第一节 数据的初步整理
一、 数据排序(sort或order)
是按照一定标准,对数据及进行排列
分为
升序
降序
二、 统计分组(grouping)
指根据被研究对象的特征划分数据
分组前
反复检查核对数据,在有证据的前提下删去因过失造成的误差
目的是尽量消除记录误差
在没有充足证据时,不要删去数据,若一定要删去,应遵循三个标准差准则 (简称3σ)
即该数据是否落在平均数加减三个标准差之外
分组应注意的问题
1. 分组应以研究对象的本质特性为基础
2. 分类标志要明确,要包括所有数据
分类标志,又称为分组标志,指对数据进行分组时所依据的特性
分类标志具有明确性和一致性
分组的标志
1. 性质类别
根据事物的属性划分
如男性和女性、成绩优良中劣
2. 数量类别
以数据的取值大小为分类标志
三、 统计表
组成要素
表号
表的序号
名称(标题)
简明准确
长度不宜超过表的宽度,超过应转行排列
标目
分类的项目
单位和%(百分号)写在标目里
数字
又称统计指标
数字应以个位数(或小数点)对准上下对齐
表中数字不带单位、%
表注
是对表的内容进行补充说明和解释
一般使用三线表
三线指顶线、底线和栏目线(在标目下)
四、 统计图
一般采用直角坐标系
横轴为分类轴,横坐标表示自变量X
纵轴为数值轴,纵坐标表示因变量Y
组成部分
图号及图题
图号是图的序号
图题是图的名称
具有说明性和专指性
位于图的正下方
图目
是横坐标上用的各种单位名称,也称刻度线标签
图尺
指横纵坐标上用一定距离表示的各种单位
分点要清楚,图尺大小要包括所有数据值
若数据值大小相差悬殊,则用断尺法或回尺法,减少图幅
图形
图例
图注
第二节 次数分布表
次数分布
主要表示数据在各个分组区间内的散布情况
依据所显示的次数如何产生
一、 简单次数分布表 (simple frequency table)
根据每一个分数值在一列数据中出现的次数或总计数资料编制而成的统计表
对应图:条形图、饼图
二、 分组次数分布表 (grouped frequency table)
当数据量很大时,先把所有数据划分分组区间,然后将数据按其数值大小规划到相应组别内,就是分组次数分布
编制步骤
1. 求全距(range)
是最大数与最小数之间的差距
2. 决定组距(interval)与组数
组数(K)
当数据个数在100个以上,分10~20组;数据个数较少时,分为7~9组
若数据点总体分布为正态,可用公式计算K
这样可使分组满足渐进最优关系
N为数据个数
K取近似整数
组数在10~15组为宜
组距(i)
取整数
是任一组的起点和终点之间的距离
3. 列出分组区间
也叫组限, 是一个组的起点值和终点值之间的距离
起点值为下限
终点值为上限
组限分为
表述组限
如10~19(组距为10)
在呈现表格时,可以使用表述组限,为了书写方便,只用整数写下限值(右边画横线):如10~,20~,30~(组距为10)
精确组限
如9.5~19.499(组距为10)
在等级次数时,一定要按精确组限归类
注意
最低组区间应包含最小数据,最高组区间应包含最大数据
最高或最低组的下限最好是组距 i 的整数倍
分组区间在纵坐标上按顺序排列
数值大的分组区间排在上面,小的在下面
4. 登记次数
之后制表时要取消
一般用画线计数(IIII)或写“正”字
分组次数表的登记表
5. 计算次数
计算各组次数的总和是总次数
制做分组次数表包括的栏目:
第一列:分组区间
第二列:分组区间的组中值
组中值每组是精确下限加上组距的二分之一
第三列:次数(f)
第四、五列为相对次数
根据需要是否列出
缺点
原始数据不再,只能看到分组的次数和组中值
存在归组误差
组距越大,分组数越少,误差越大
是由于用各组的组中值代表原始数据而产生的误差
对应图:直方图
三、 相对次数分布表
将次数分布表中各组的实际次数转化为相对次数, 即用频率比率或百分比来表示次数
频率比率:
百分比:
次数分布表中,加上第四或第五列的表就是相对次数分布表
四、 累计次数分布表
累加次数
是把各组的次数由下而上,或由上而下累加在一起
(最后一组的累加次数等于数据的总次数)
累加次数分布 (cumulative frequency distribution)
是用累加次数表示的次数分布
累加次数的方法
向上累加次数
从分布表的小数值端,逐区间进行次数累加
表示某一分布区间上限以下的次数是多少
下限是起点,上限是终点 
向下累加次数
从分布表的大数值端,逐区间进行次数累加
表示某一分布区间下限以上的次数是多少
常用
对感知阈限的测定、心理量表的编制
心理测验中的项目分析、教育管理及成绩比较(如百分位数与百分等级)
优点
快速看出某一区间以上或者一下的数据总数
对应图:累加次数分布图
五、 双列次数分布表
又称相关次数分布表,是对有联系的两列变量用同一个表 表示其次数分布
编制方法
首先,分别列出各变量的分组区间
将一列变量横列,小数端在左,大数端在右; 另一列变量竖列,小数端在下,大数端在上
对应图:散点图
六、 不等距次数分布表
第三节 次数分布图
反映变动趋势、差异细节,获得直观印象
常用的次数分布图
一、 直方图(histogram)
又称等距直方图,是以矩形的面积表示连续性随机变量次数分布的图形
纵轴表示数据的频数
通常从0开始
横轴表示数据的上下限,有时用组中值表示
可以从任何数字开始
制作方法
以组距为底边,分组区间的精确上下限为底边二端点,以次数为高画矩形
各矩形条之间没有空隙
一个矩形的面积大小与每组的频数分布大小等价
若总面积为1,则每个矩形的面积=分组区间内的次数/总次数
组织图
是直方图的另一种形式
条形图与直方图的区别
二、 次数多边形图(frequency polygon)
是一种表示连续性随机变量次数分布的线形图
绘制方法
横坐标是用各分组区间组中值表示的随机变量
纵坐标是数据的频数
为使计算面积与直方图相等,可将折现两端画至前一组和后一组的组中值,可连接为一个多边形
优点
对次数的轮廓显示更明晰,组间次数过渡连续而直接
若样本很大,可以据此找到次数分布的经验公式
可用于多个同质的次数分布的比较
三、 累加次数分布图
累加直方图
横坐标是分组区间,纵坐标是累加次数
优点
可以清楚看出精确上限一下的累加次数
若在累加直方图右侧自上而下地标出次数,就可以看到精确下限以上的累加次数
累加曲线
又称递加线
画法同多边形基本相同
不同在于
横坐标为每个分组区间的精确上限或下限
纵坐标是各分组区间的累加次数
分别标出各个交点,连接各焦点可画出累加曲线
若有累加直方图,联结矩形的有顶点可画累加曲线
特点
总是上升的
大约有三种形状
正偏态分布
说明大数端各组次数少,组数多
曲线的上支长于下支
负偏态分布
曲线的下支长于上支
正态分布
上支与下支基本相当
百分等级
相对位置
与百分位数相对应
百分位数
原始分数
第四节 其他类型的统计图表
一、 其他常用的统计表类型
简单表
是只列出名称、地点时序或统计指标名称的统计表
分组表
也称单向表(one-way-table)
只有一个分类标志的统计表
复合表
统计分组的标志有两个或两个以上的表
有两个分组指标的称为双向表,三个的称为三向表
三向表(three-way-table)
按形式可分为
定性式
统计式
简单表、分组表、复合表都属于这两种
函数式
在心理学实验中使用较多
特征是自变量X与因变量Y的各对应的数值要按自变量的大小排列出来
可作因变量随自变量变化的函数曲线,因此称为函数表
自变量可以等距,也可以不等距,根据实验而定
二、 其他常用的统计图的类别
条形图(bar chart)
用于表示计数资料(离散型数据资料)
以条形长短表示数量
三类条形图
条形图的特点
一条是分类轴(表示类别,描述计数数据); 一条是数量轴(表示大小多少,描述计量数据)
条形图与直方图的区别
圆形图(饼图)
用于描述间断性资料
显示各部分占总体的比重,便于比较各部分大小
绘制
以十二点整位置的半径为基线
每部分扇形的度数X:
注意
确定基线后,各部分按顺时针方向由大而小排列,或按相比较事物的固有顺序排列
各分区有明确界限,标有简要文字和百分比
比较两种性质类似的资料时,两个圆的直径和各部分的排列顺序要相同
图形中所有区域的度数加起来要等于360°
线形图
更多用于连续性资料
用于表示两个变量之间的函数关系
描述某种现象在时间上的发展趋势
表示一种现象随另一种现象变化的情形
两种线型图
折线图
是由条形图中每个条形顶部的中点连接而成
曲线图
是折线分布修匀后比较平滑的线形图
绘制要点
横轴表示时间或自变量;纵轴表示因变量
通常纵轴从零点(原点)开始
可用不同线形进行区别比较,一般比较的线不要超过5条
曲线上的点应画在对应组段的中点上
横轴和纵轴分别取对数单位的称为半对数曲线,同时取对数单位的称对数曲线
散点图(scatter plot)
又称点图、散布图
是用大小相同的圆点的多少或疏密表示统计资料数量大小及变化趋势的图
通常用于表示相关程度
茎叶图
观测值
整数
茎表示十位数值部分,叶表示个位数部分
小数
茎表示个位,叶表示分位数
分组数据
茎是分组区间
叶是各分组区间的每个数
绘制程序
将茎由小至大 从上往下 依序垂直排列在左侧
若每个数字只写一次,代表以10为组距,若写两次,表示以5为组距,以此类推
叶由小至大 从左往右排列在右侧
叶填写完之后,计算次数,记录在茎的左侧
优点
全部保留原始数据
呈现出直方图形式
兼具次数分配表和直方图的双重优点
缺点
之便于表示个位之间相差不大的数据
只方便记录最多两组数据
箱型图
由一组数据的最大值、最小值、中位数和两个四分位数 5个特征值绘制的一个箱子和两条线段
靠近最小值的是下四分位
靠近最大值的是上四分位
左边多,是左偏分布
右边多,是右偏分布
雷达图
由中心点画出线条代表分类项目的雷达状直线,以长度代表数量大小,也叫蜘蛛图
作用
可以观察单个项目各评价特性间的均衡性
比较多个项目评价特性之间的差异性
三、 计算机统计技巧提示:p51
第三章 集中量数
描述集中趋势
第一节 算术平均数(arithmetic average)
简称平均数(average)、均数、均值(means) 一般用字母M表示,若由变量X计算,则用X杠表示
一、 平均数的计算方法
(一)未分组数据计算平均数的方法
公式
N为分数的个数
(二)用估计平均数计算平均数
数据的数目或观测数据值都很大时,用估计平均数(an estimated mean)简化计算
具体方法
先设定一个估计平均数(AM)
可随意设置,越接近平均数越好
从每一个数据中减去AM,使数值变小,容易计算;
最后在计算结果加上这个AM
公式
AM是估计平均数
N是数据个数
使用次数分布表计算平均数
次数分布表已经没有原数据,只有组中值和组距
计算分组数据的公式
是各分组区间的组中值
f 为各组次数
可视为组中值的权重,因而公式也被称为平均数的加权公式
∑f 为数据的总次数(等于N)
N为分数的个数
分组数据的估计平均数算法
在每一区间的组中值减去一估计平均数,再将差数除以组距i(目的是将数字缩小),最后再总的乘以i
公式
AM是估计平均数
i是组距
称为组差数
二、 平均数的特点
(1) 一组数据中每个变量与平均数之差(离均差)的总和为0
(2) 一组数据中,每一个数都加上一个常数C,则所得的平均数为原来的平均数加常数C
估计平均数的公式据此而来
(3) 一组数据中,每一个数都乘以一个常数C,则所得的平均数为原来的平均数乘以常数C
三、 平均数的意义
算术平均数是应用最普遍的一种集中量数
是“真值”(true score)渐进、最佳的估计值
真值是总体平均数μ
当观测次数无限增加时,算术平均数趋近于真值 μ
是数据分布的中心,是一个平衡指点
四、 平均数的优缺点
优点
反应灵敏
计算严密
计算简单
简明易解
适合于进一步用代数方法演算
较少受抽样变动的影响
是最可靠、正确的量数
缺点
易受极端数据的影响
当数据分布呈偏态时,受极值(extreme value/score)的影响
可以通过修剪平均数(trimmed mean)来解决
修剪平均数也称截尾平均数,是从一组数据中去除一定百分比(如5%)的最大值或最小值数据后,再次计算的算术平均数
出现模糊不清的数据时,无法计算平均数
这种情况一般采用中数作为改组数据的代表值
使用注意
数据可靠且同质,需要每个数据都加入计算,且要做进一步代数运算时
在报告平均数时,要按指定单位表达
书写平均数时,习惯上保留的小数位数要比原来的测量数据多一位数字
五、 计算和应用平均数的原则
1. 同质性原则
不同质的数据不能计算平均数
同质数据是指使用同一个观测手段,采用相同的观测标准,能反映某一问题的同一方面特质的数据
2. 平均数与个体数值相结合的原则
运用平均数作统计分析时,还要结合个体数值参考
3. 平均数与标准差、方差相结合的原则
平均数和标准差是用来描述数据总体特征的一对相互联系的统计指标
标准差、方差越小(数据差异小),平均数越具有代表性; 差异为0时,平均数具有完全代表性
第二节 中数和众数
中数(median)
又称中点数、中位数、中值,符号为Md或Mdn
定义
中数是按一定顺序排列在一起的一组数据中居于中间位置的数
是一种位置量数
计算
未分组数据求中数的方法
首先将数据依大小排序
1. 一组数据中无重复数值时
数据个数为奇数,则中数为(N+1)/2 位置的数
当数据个数为偶数,中数为中间位置两个数的平均数
2. 一组数据中有重复数值的情况
当重复数值没有位于数列中间时
求法跟无重复数据时一样
当重复数值位于数列中间时
数据的个数为奇数时
一个数等价于一个区间
1||| 中数落在重复的3个13上,相当于12.5~13.5这个区间
2||| 区间(12.5~13.5)等分为3个小区间,每一个13占1/3的距离,用三个方块表示
3||| 第一个13落在12.5~12.83这个区间内,第二个13落在12.83~13.16这个区间,第三个13落在13.16~13.49这个区间
4||| 这一列数的中数为13,是连续三个13中的第一个,所以落在区间12.5~12.83这个区间,计算出这个区间的组中值,就是这组数据的中数
对于这组数据 11,11,11,11,13,13,13,17,17
5||| 12.5~12.83的组中值:
数据的个数为偶数时
与奇数时基本相同
中间位置的数是两个重复的数,则在以上规则的情况下,取两个重复数的区间的组中值表示中数
如:11,11,11,11,13,13,13,17,17,18这组数 中间位置的两个13,位于12.5~13.16这个区间 所以中数应为第一个13所在区间(12.5~12.83)的上限12.83
分组数据求中数的方法
跟重复数列的原理一样
取序列中将N平分为两半的那一点的值作为中数
公式
用精确下限来算
Lb为中数所在分组区间的精确下限
Fb为该组以下的各组次数的累加次数
i 为组距
fMd为中数所在分组区间的数据个数
用精确上限来算
La为中数所在分组区间的精确下限
Fa为该组以下的各组次数的累加次数
i 为组距
fMd为中数所在分组区间的数据个数
中数的优缺点
优点
克服了平均数的缺点,不受极端值的影响
较少受模糊数据的影响
如果数据呈偏态分布可以使用中数
缺点
大小不受制于全体数据(不是全体数据参与计算)
反应不灵敏
中数受抽样影响较大,不如平均数稳定
不能作进一步代数运算
使用情况
一组观测结果中出现两个极端数目时
当次数分布的数据模糊时
当需要快速估计一组数据的代表值时
众数(mode)
又称范数、密集数、通常数,符号为Mo
众数可能不止一个
定义
众数是指在次数分布中出现次数最多的那个数的数值
计算众数的方法
直接观察法
公式法
计算的众数只能作为近似值
皮尔逊经验法
只能在分布接近正态时使用
公式
平均数与中数的距离占平均数与众数距离的三分之一
导出
金氏(W.I.King)插补法
适合次数分布比较偏斜的情况,接近正态的分布也适用
公式
Lb为众数所在区间的精确下限
fa为高于众数所在组一个组距的分组区间的次数
fb为低于众数所在组一个组距的分组区间的次数
若fa=fb
则
即次数最多那一组区间的中值
意义与应用
缺点
不稳定,易受分组影响,易受样本变动影响
较少收极端数影响,反应不够灵敏
不能进一步代数运算
优点
众数可以快速计算
在不同质数据的情况下可以使用众数
可以判断数据的形态
应用
需快速粗略寻求一组数据的代表值时
数据不同质时,如工资收入、学生成绩
有极端数时
粗略估计次数分布的形态时
用平均数与众数的差,作为分布是否偏态的指标
计算
未分组数据
直接找次数最多的数据
分组次数分布表
次数最多一组的 组中值
平均数、中数、众数三者的关系
分布形态
正态分布中:M=Md=Mo
正偏态分布中:Mo<Md<M
平均数偏正轴方向
负偏态分布中:M<Md<Mo
平均数偏负轴方向
皮尔逊经验公式
Md一直在中间,M平均数永远在尾端
(平均数与中数的距离是平均数与中数距离的三分之一)
在偏态分布中,平均数永远位于尾端(小的一端), 中数位于面积分为两等份的点值上
中数距平均数较近,距中数较远
正偏态:众数小于平均数
负偏态:众数大于平均数
正小负大
平均数的“最小平方”原理
【每个数据与任一常数(包括中数和众数)之差的平方和】都大于【每个数据与平均数之差的平方和】
平均数与每个数据之差的总和为0
第三节 其他集中量数
一、 加权平均数(weighted mean)
若各数据的权重(weight)不相等时使用
是加权平均数
是权数
也可以运用于各小组的平均数计算总平均数
二、 几何平均数(geometric mean)
记作Mg(或GM)
基本公式
连乘的N次方根
对数公式
也称为对数平均数
应用
1. 直接应用基本公式
心理物理学的等距量表实验(只能用几何平均数)
例题
一组实验数据偏大或偏小,数据分布呈偏态
2. 应用几何平均数的变式计算
一组数据彼此间变异较大,几乎是按一定比例变化
如教育经费逐年增加数,学习、阅读的进步数,学生人数的增加数等
求平均增长率
用几何平均数计算平均变化比率
如
(1) 学习方面的进步率
例题
Mg为平均进步率,求进步的增长率还需用 Mg-基线(1.000)
(2) 学生或人口增加率的估计
Mg为毕业生的平均变化率,平均增长率为(Mg-1)
(3) 教育经费增加率
经费增长率为Mg,无需减去基线
三、 调和平均数(harmonic mean)
主要用于描述学习速度
表示符号为
又称倒数平均数,因为在计算中先将各个数据取倒数平均,然后再取倒数
公式
Xi为变量值
N为数据的个数
应用
在学习速度的研究实验中, 反应指标有两种形式:
1||| 工作量固定,记录各被试完成相同工作所需时间
这类问题可以直接用速度公式,因为符合速度概念 平均速度=总工作量/总时间
2||| 学习时间一定,记录一定时间内被试完成的工作量
这类问题不可以直接用速度公式,因为不符合速度概念
两种算法基本一致
在计算平均学习速度时
要先求出单位时间的工作量,以其为Xi代入公式计算
单位时间的工作量的倒数,就是单位工作量所需的时间
例题
计算机使用技巧p77
第四章 差异量数
也称为离散量数(measures of dispersion)
描述离中趋势,即数据的变异性
第一节 全距与百分位差
一、 全距(range)
又称两极差,用R表示
是说明数据离散程度最简单的统计量
公式
最大值减最小值
优点
计算简单
缺点
不能充分利用数据信息
不稳定、不可靠、不灵敏
只用到极值,不能反映中间的数据的变化
明显受取样变动的影响
二、 百分位差
百分位数(percentile)
指量尺上的一个点,再此点一下,包括数据分布中全部数据个数的一定百分比
第P百分位数(P-percentile)指在其值为P的数据以下,包括分布中全部数据的百分之p,其符号为Pp
百分位差
取消分布两端10%的数据,用P10和P90作为差异量数,即百分位差
公式
优点
较少受全距的极值的影响
局限
不能很好地反映中间数据的散布情况,因此只能作为主要差异量数的补助量数,在实际中很少应用
百分位数的计算
公式
Lb为百分位数所在分组的精确下限
Fb为该组以下的各组次数的累加次数
i 为组距
N为总次数
百分位数与百分等级
用累加次数分布曲线图求百分位数的估计值
如求P10的百分位数,先找到右边百分等级中标有10%的刻度,在刻度位画一条横线,与曲线交于一点,在这个点画一条垂线,垂线与横轴相交处的刻度就是P10的百分位数
百分等级(percentile rank)
符号为PR
是一种相对位置量数,是百分位数的逆运算
应用广泛
如某人考试成绩的百分等级PR为80,意味着他比79%的人成绩好,比20%的人差
计算公式
N为总次数
X为给定的原始分数(在具体的分组区间中)
f为原始分数所在组的频数
Lb为该组的精确下限
Fb为该组以下所有组的累加次数
i为组距
三、 四分位差(quartile deviation)
百分位差的一种
用Q表示
指在一个次数分配中,中间50%的次数的距离的一半
在一组数据中,它的值等于P25到P75距离的二分之一
优点
能够反映出数据分布中中间50%数据的散布情况
四分位数quartile(四分值)
第三四分位数:
第二四分位数:
也就是中数
第一四分位数:
因为其下占了总次数的四分之一
四分位差公式
求四分位差
未分组数据
Q1和Q3可按照未分组数据求中数的方法求得
分组数据
其实就是P25的值
四分位差与Q1、Q2、Q3之间的关系
优点
两极端数据不清楚时,可以计算四分位差
局限
没有考虑全部数据,稳定性差
不适合代数运算
反应不灵敏
第二节 平均差、方差与标准差
一、 动差体系
动差(moment)
是力学中测量力的旋转趋势的名称
动差=力*(力点与原点的距离)
统计学用此概念表示次数分布的离散情况
把各组次数作为“力”
用数值(或组中值)与原点之差的距离
二者相乘作为动差
中心动差
是以平均数为原点计算的动差
常见的中心动差:
一级动差
无法用于表示数据分布的差异度,因为离均差之和为0
在实际应用中,一般不取其代数和(Σfx),而是取绝对和(Σ | x | )作为分子
平均差
二级动差
表示离中趋势,即“方差”
其平方根为标准差,应用广泛
三级动差
表示分布的偏斜度或偏态性
四级动差
用于表示一个分布中峰态性
二、 平均差 (average deviation或mean deviation)
一般用A.D.或M.D.表示
定义
原始数据与平均数 绝对离差的平均值
公式
用原始数据计算
用归类分组数据计算
|x| 为各组中点值对平均数离差的绝对值
特点
根据每一个观测值计算,较好反映了数据分布的离散程度
平均差是绝对值,不利于进一步统计分析,使用受到限制
属于低效的差异量数,实践中不太常用
三、 方差与标准差
高效差异量
方差(variance)
也称变异数、均方
作为样本统计量用s²表示
作为总体统计量用σ²表示
是离均差的平方和的平均数
平均数代表正态分布的位置,方差代表正态分布的形状
方差越大,离中趋势大,形状越扁平(低阔)
方差越小,离中趋势小,形状越高狭
标准差(standard deviation)
是方差的平方根
样本标准差用s或SD表示
总体标准差用σ表示
计算公式
原始数据算样本方差
1|||
2||| 用原始分数计算
在公式①中,要先计算平均数,再计算离均差,最后算出方差。 若平均数无法除尽,就会引入计算误差,且计算冗杂,可直接用原始分数计算方差
ΣX²为原始数据的平方和
(ΣX)²为原始数据的和的平方
为数据的个数
原始数据算样本标准差
用原始分数计算
ΣX²为原始数据的平方和
(ΣX)²为原始数据的和的平方
为数据的个数
计算分组数据的标准差
1|||
Xc为组中值,代表原始数据
2||| 组距离差计算法
由于归组效应,计算出的标准差会有误差
总标准差的合成
跟总体标准差有所不同
即在已知各组方差或标准差的情况下,将其合成计算总的方差或标准差
注意:只有在应用同一种观测手段,测量同一个特质,只有样本不同时,才能应用
公式
总方差
sT²为总方差
Ni为各小组数据的总个数
si为各小组标准差
为各小组的平均数
总标准差
sT为总标准差
Ni为各小组数据的总个数
si为各小组标准差
为各小组的平均数
总体的方差和标准差
方差
标准差
样本方差和标准差
小样本时(<30)
有偏估计的样本方差
方差
标准差
小样本时的有偏估计不够准确,应该使用有偏估计
无偏估计的样本方差
方差
标准差
无偏估计的n-1是对小样本的矫正
大样本时用有偏估计的样本方差即可
四、 方差、标准差的性质和意义
性质
方差
可加性、可分解性
特性
每一个观测值都加一个相同的常数C之后,得到的方差等于原方差
即离散程度不变,只是数据分布在数轴上以常数为距离做整体平移
每个观测值乘一个常数C,新数据方差为原方差乘C的平方
标准差
不可以进行代数计算
特性
每一个观测值都加一个相同的常数C之后,计算得到的标准差等于原标准差
每一个观测值都乘以一个相同的常数C,则所得的标准差是原标准差乘以常数C
每一个观测值都乘以一个常数C,然后加上常数d,则所得的标准差是原标准差乘常数C
如
意义
是表示数据离散程度的最好指标
1. 表示了数据的离散程度
其值越大,离散程度越大,越分散
其值越小,离散程度越小,越集中
2. 充分
克服了平均差的缺点
具备一个良好的差异量数应具备的条件
反应灵敏
计算公式严密确定
容易计算
适合代数运算
受抽样变动影响小
简单明了
标准差具有数学优越性
切比雪夫大数定理
至少有1-1/h²的数据落在平均数h个标准差范围内(h是大于1的实数)
如在2个标准差范围内,至少有(1-0.25=0.75)个数据
例:一组数据的平均数为50,标准差为5
则至少有1-1/2²=75%的数据,落在50±(2×5)=40~60之间
则至少有1-1/3²=88.9%的数据,落在50±(3×5)=35~65之间
如果数据成正态分布,则数据将以更大的百分数落在平均数两侧,即落在上下两个标准差之内(94.45%),三个标准差之内(99.7%)
第三节 标准差的应用
标准差的单位与原数据相同,所以有时称其为绝对差异量
一、 差异系数(coefficient of vatriation)
也称为变异系数、相对标准差。用CV表示,是一种相对差异量
使用条件
样本间使用的观测工具不同,观测的特质不同
样本间的观测工具相同,所测特质相同,但样本间的水平差异大
通常,平均数的值较大,其标准差的值也较大; 平均数的值较小,标准差的值也较小
公式
s是标准差
应用
同一团体不同观测值离散程度比较
对于水平相差较大,但进行统一种观测的各种团体,进行观测值离散程度的比较
只能用于比率数据(等距,有绝对零)
二、 标准分数(standard score)
又称为基分数或Z分数(Z-score)
表示原始分数和均值之间 相差了几个标准差的位置
从两个方面表示原始分数的位置
分数对平均数的相对位置
该组分数的离中趋势
公式
无实际单位
Z分数可以表示原分数在该组数据分布中的位置,故称为相对位置量数
Z分数为正时,说明原始分数大于均值;Z分数为负时,说明原始分数小于均值
当Z分数的绝对值越大,说明原始分数离均值越远
Z分数表示其原分数在以平均值为中心的相对位置
标准分数的性质
1. Z分数无实际单位,是以平均数为参照点(0),以标准差为单位的一个相对量
2. Z分数可以为正或负
所有原始分数的Z分数之和为0,Z分数的平均数也为0
3. 一组原始数据中,各个Z分数的标准差为1
4. 若原始分数呈正态分布,则转换得到【所有Z分数值均值为0,标准差为1的】标准正态分布(standard normal distribution)
标准分数的优点
可比性
标准分数以团体平均数为比较的基准,以标准差为单位
可加性
明确性
稳定性
标准分数的应用
1. 用于表示几个分数性质不同的观测值在各自数据分布中相对位置的高低
得知Z分数,就可以差正态分布表得知原始分数的百分等级(表明在它之下的分数个数占全体分数个数的百分之几)
2. 计算不同质的观测值的总和或平均值,以表示在团体中的相对位置
例:
常用于比较总分数
3. 表示标准测验分数
为克服标准分数出现的小数、负数和不易为人们所接受等缺点,将其转换为正态标准分布
仍保持原始分数的分布形态,具有原标准分数的一切优点
转换公式:
Z'=aZ+b
Z'是转换后的标准正态分数
a,b为常数
Z是转换前的常模的标准分数
应用
韦克斯勒
在韦氏成人智力量表中使用离差智商这一概念表示一个人在同龄团体中的相对智力:IQ=15Z+100
100实际为总平均数,15为标准差
比奈-西蒙测验
使用了Z'=16Z+100公式
普通分类测验(AGCT)
Z'=10Z+100
标准分布(standardized distribution)
Z分布(z分数分布)
是将分布中所有原始分数转换为z分数,所得的新的分布
特点
形状
z分布与原分布的形状完全相同
所有分数的相对位置不变
均值
z分布的均值为0
标准差
z分布的标准差为1
性质
无实际单位,是以平均数为参照点,以标准差为单位的一个相对量
Z分数可以是正也可以是负,全部Z分数之和为0,均值为0
各个Z分数的标准差为1
所有z分数呈均值为0,标准差为1的标准正态分布
优点
可比性、可加性、明确性、稳定性
应用
用于比较几个性质不同的观测值在各自数据分布中相对位置的高低
用于比较不同质的观测值的总和或平均数,以表示在团体中的相对位置
表示标准测验分数
三、 相对量数
1. 百分等级
含义
指某个数据在整个数据中所处的百分位置
越大,排名越前
作用
表示任何一个分数在该团体中的相对位置
名次与百分等级的转换公式
百分等级的R为低于该等级的人数占R%
百分等级可以是小数,但不是百分数
百分等级有什么缺陷
优点
相对位置,可以比较大小
缺陷
没有相等单位
是一种顺序数据
不能进行加减法,不能代数运算
四、 异常值的取舍
数据个数较多时
舍弃落在平均数加减三个标准差之外的数
数据个数较少时
全距与标准差比率的一半,乘以标准差,再求与平均数的和、差,以这两个值为界取舍平均数
第四节 差异量数的选用
一、 优良差异量具备的标准
根据客观数据资料获得
根据全部观测值计算得出
简单明了、容易理解
计算便捷
具有样本稳定性,在反复取样过程中具有相对恒常性
应该能用代数方法计算
二、 各种差异量数优缺点比较
三、 各种差异量数之间的关系
当样本量相当大时(N≥500),全距约为标准差的6倍(R=6s)
在小样本中,全距与标准差的比率要小一些
N值相当大,分布形态呈正态分布时,各种差异量数存在固定的数量关系:
s=1.2533AD=1.4826Q
AD=0.7979s=1.1829Q
Q=0.6745s=0.8453AD
S>AD>Q
S标准差
AD平均差
Q四分位差
四、 如何选用差异量数
随机取样时,S最好,其次是Q,最后是R
简便快捷,R最好,Q,S依次繁杂
进一步代数运算,s最好
偏态分布中,Q比s更常用
截尾分布时,Q能正确指出分布的变异性
集中量数与差异量数相结合
集中量数描述次数分布的典型性,指量尺上的一个点值; 差异量数反映变异性,是量尺上的一段距离
差异量数越小,集中量数代表性越大;差异量数为0,表明集中量数彼此相等,等同于原数值
多数情况下,用平均数和标准差一起描述一组数据的全貌
当选用中数描述集中趋势时,差异量数应选用Q或其他百分位差
因为二者的计算原理相同,都是插值法求得
第五章 相关关系
第一节 相关、相关系数与散点图
一、 什么是相关
事物之间的相互关系
因果关系
一种现象是另一种现象的原因,另一种现象是结果
共变关系
表面看起来有联系的两种事物都与第三种现象有关
相关关系
两类事物在发展变化的方向与大小方面存在一定联系
相关的类别
两列变量变动的方向相同(正相关)
两列变量变动的方向相反(负相关)
两列变量变动关系无明显趋势(零相关)
二、 相关系数(coefficient of correlation)
是用来表示相关关系强度的指标
样本的相关系数用 r 表示;总体的相关系数用ρ表示(就线性相关而言)
是应用较广泛的有代表性的统计量
特点
相关系数的取值范围[-1.00,1.00]
是一个比率,常用小数表示
+号表示正相关
-号表示负相关
-1和+1都是完全相关,0是完全独立(零相关)
相关系数的绝对值表示相关强度,绝对值越大,相关程度越密切
判断相关程度是否密切时,要考虑样本量大小
若样本量较小,相关系数受取样偶然因素的影响较大
要经过统计检验方能确定变量之间是否存在显著的相关
若非线性相关关系,而用直线相关计算 r 值可能很小,但不能说明两变量关系不密切
是顺序数据
只能比较大小,不能运算
利用数据等级之间的一致性说明相关关系
五名儿童在ABCD测验中得到的分数如图,A测验的成绩按高到低排序,并列出相应的BCD测验的分数
然后,把BCD测验成绩也按高到低排序,用直线将每个学生的A与B、C、D的成绩分别相连
成对分数之间的连线越接近平行线,正相关程度越高(比较1)
成对分数之间的连线越能相交在一点,负相关值越大(比较2)
成对分数之间的连线交叉点越多,表明相关程度越接近0(比较3)
三、 散点图(相关图)
用于表示两个变量的关系
以二变量的原始数据为X、Y轴
完全相关
完全正相关
完全负相关
强相关
高正相关
高负相关
散点分布呈椭圆形,说明二变量之间呈线性关系
零相关(弱相关)
以二变量的Z分数为X、Y轴,相关趋势会更清晰
以标准分数为坐标的相关散布图,相当于把原坐标轴平移到X、Y的均值的位置
新坐标轴X'O'Y'的原点为(X杠,Y杠),X、Y轴的刻度分别为sX,sY
新坐标轴把散点分为四个部分
若散点接近相等地分布在四个象限中,则相关系数接近0
若Ⅰ、Ⅲ象限的散点明显多于Ⅱ、Ⅳ象限,则呈线性相关关系,为正相关
若Ⅱ、Ⅳ象限的散点明显多于Ⅰ、Ⅲ象限,则呈线性相关关系,为负相关
相关程度由Ⅰ、Ⅲ与Ⅱ、Ⅳ象限点的差数而定
差数越大,相关越高; 差数越小,相关越低
如图
图中直线称为拟合直线,代表数据点的相关趋势
每个点与这条直线的离差最小,所以称为最佳拟合直线
数据与最佳拟合直线离差越小,拟合直线对数据相关系数预测的可靠度和精确性越高
四、 相关分析
指用合理的统计指标对相关现象的观测值进行的统计分析
是多元分析的基础
第二节 积差相关 (product moment correlation)
皮尔逊最初研究父子身高的相关关系
一、 积差相关的概念和适用资料
定义
积差相关被称为皮尔逊相关 Pearson correlation
英国统计学家皮尔逊在20世纪初提出
又称为积矩相关 (product-moment coefficient of correlation)
离均差的乘积之和除以N为“矩”(moment)
把X的离均差与Y的离均差这二者的积的总和除以N, 用“积矩”概念表示:
是揭示两个变量线性相关方向和程度最常见和最基本的方法
共变程度:X和Y的协方差
即X和Y两个变量的离均差乘积的平均数
各自变异的程度
即两个变量各自的标准差的乘积
样本相关系数r,总体相关系数ρ
当样本足够大的时候,r就越能代表ρ
r的符号表示方向,大小表示程度
高相关≠因果关系
用于计算的数据资料应满足的条件
成对的数据
即每个个体都有两种不同的观测值
如每个学生的算数和语文成绩,每个学生的智力分数与学习成绩等
每对数据分数与其他子对相对独立
数据的对数≥30
数据对数小于30,则缺乏代表性
样本量越大,越稳定
两变量总体正态分布
若无资料查询,需取较大样本对两变量做正态性检验
只要求双变量总体为正态分布,对要计算相关系数的两样本的观测数据,不要求一定为正态分布
两变量是连续变量
即为测量数据
两变量是线性关系
用相关散布图做初步分析
积差相关的应用
表示一致性
重测信度
用于衡量两次测验的误差程度
相关度高则误差小
实证效度
一个学科的成绩对另一个学科的预测能力的有效性
非(0,1)计分项目的区分度
非(0,1)项目指主观题
二、 计算积差相关系数的基本公式
公式
1. 用标准差和离均差的计算公式
由sX、sY推导
2. 用标准分数计算相关系数的公式
被称为协方差(covariance)
协方差就是两个变量离均差乘积的平均数
两列变量离均差乘积xy 的大小, 能够反映两列变量的一致性
当x大,y也大时,xy也大
当x小,y也小时,xy也小
Σxy绝对值大,r的绝对值也大,表示x与y之间的线性关系越强
不能直接用协方差表示一致性
原因
有不同测量单位(x和y)
其值随X和Y应用的测量单位不同而变化,是很不稳定的量
为了克服协方差的缺点,分别用各变量的标准差去除各自的离均差,使其成为无实际测量单位的标准分数,然后求标准分数的协方差:
用标准分数计算相关系数
标准分数的协方差
在XOY平面上的点P(XV,YV),在X'O'Y'平面为
对于Ⅰ、Ⅲ象限的点
同号
ZXZY为正
对于Ⅱ、Ⅳ象限的点
异号
ZXZY为负
若Ⅰ、Ⅲ象限的点多于Ⅱ、Ⅳ象限的点,则ΣZXZY>0,则r>0,XY呈正相关; 若Ⅱ、Ⅳ象限的点多于Ⅰ、Ⅲ象限的点,则ΣZXZY<0,则r<0,XY呈负相关; 若Ⅱ、Ⅳ象限与Ⅰ、Ⅲ象限的点分布数目相同,则ΣZXZY=0,则r=0,XY呈零相关
差数越大(ΣZXZY的绝对值越大),相关程度越高
若ZX=ZY 则r=1,两列数据为完全正相关
若ZX=-ZY 则r=-1,两列数据为完全负相关
3. 原始观测值计算公式
计算公式
1. 定义公式
分子为正值时说明两列数据同增共减,负值时表示变化趋势相反
2. 导出公式
3. 原始分数计算公式
三、 计算积差相关系数的差法公式
利用离均差相加或相减求极差相关系数
减差法
即
s²X+Y是X+Y这一新变量的方差
加差法
即
s²X-Y是X-Y这一新变量的方差
分组数据计算相关系数的方法——相关表法
将两列数据整理成双列次数分布表后, 原始数据消失,用以下公式计算:
或
例:
四、 相关系数的合并
或称求平均的相关系数
相关系数不是等距的尺度,所以不能采用简单合成,要将其转换成等距的尺度(Z)后再求平均:
求平均的相关系数,用Z-r转换法
Z-r转换法的具体步骤:
公式
先将各样本的r转换成费舍Z分数,就是公式中的Zi
通过查表转换,再课本附表8
求平均Z分数
再查表,将平均Z分数转化成相应的r值,即平均的r
应用
用于汇总一个研究者先后多次的调研结果
用于总和不同研究者的研究结果
合成科研协作时不同地区取样信息
测验中对效度和信度的估计
要求各样本同质性
第三节 等级相关
使用条件: ①数据是具有等级顺序的测量数据, ②或总体分布不是正态的等距等比数据; 由于对变量总体分布不做要求,也被称为非参数的相关方法
一、 斯皮尔曼等级相关 (Spearman's rank correlation)
由斯皮尔曼提出(Charles Edward Spearman)
定义及适用资料
定义
根据两列变量的成对等级差数计算相关系数,又叫“等级差数法”
符号:
条件
成对;具有等级变量性质;线性相关;无正态假设;无大样本限定
主要用于解决称名数据和顺序数据的相关问题
优势
比皮尔逊积差相关应用范围广
对数据总体分布不作要求
N<30时,计算也比较简便
劣势
在降级过程中,计算精度变小
凡适用于计算积差相关的数据资料,不要用等级相关计算
计算公式
1. 等级差数法:
基本公式
可能考计算
N为数据的对数
D为成对的等级变量的等级差数
D=RX-RY
2. 等级序数法
RX、RY 分别为两列变量各自排列的等级系数
例
3. 有相同等级时计算等级相关的方法
相同等级的数目及其出现的次数对平方和ΣR²产生影响
相同等级数目增多,ΣR²有规律地减少
ΣR²随相同等级数目减少的数量的表达式:
C为矫正数(即减少的差数)
n为相同等级的数目
在一组数据中,有时不止出现一组相同等级, 此时要将各组相同等级所减少的差数相加:
n为相同等级的数目
出现相同等级时的计算公式
也称为矫正公式
n为相同等级的数目
例
二、 肯德尔等级相关
适用于3列及以上的数据系列
肯德尔W系数
1. 定义
肯德尔W系数,又称肯德尔和谐系数(Kendall coefficient of concordance),是表示多列等级变量相关程度的一种方法
评分者一致性
W达到0.9为公平
W是每一评价对象实际得到的等级总和的变异与被评价对象最大可能变化的等级总和的变异的比值
实际得到的等级总和的变异为s
最大可能变化的等级总和的变异为
2. 适用资料
采用等级评定的方法收集原始数据资料
即让K个评委(被试)评定N个事物
每个评价者对N件事物排出一个等级顺序,最小的等级序数为1,最大的为N,若并列等级时,则评分共同应该占据的等级
最满意的等级评定为1,最不满意的为N
1个评委(被试)先后K次评定N件事物
得到K列从1至N的等级变量资料
应用
考察几位老师对多篇作文的评分标准是否一致(又称为评分者信度)
W越大,越一致
优点
取值范围在0~1之间
3. 定义公式—无重复等级
等级和的最大变异即最大可能的s为
其中
s为等级和的变异:
评分者给予的等级越不同,则s越小,等级差异越大,一致性越低
Ri:为第i个事物的等级之和
N:被评价的事物的数量
K:评委数量
W介于0与1之间,计算值都为正值,若表示相关方向,可从实际资料中分析
若W=1,则K个评价者意见完全一致; 若W=0,则K个评价者意见完全不一致; 若0<W<1,则K个评价者意见存在一定联系
例
4. 修正公式—有重复等级时
其中
n为相同等级的数目
例:
肯德尔U系数
肯德尔U系数又称为一致性系数
适用于对K个评价者的一致性进行统计分析
适用资料
评价者采用对偶比较的方法,将N件事物两两配对,可配成N(N-1)/2对; 然后对每一对中两事物进行比较,择优选择——优者记1,非优者记0,最后整理成相对应的评价结果
计算公式
N为被评价事物的数目,即等级数
K为评价者的数目
rij为对偶比较记录表中i>j(或i<j)格中的择优分数
rij只取下三角
一致性系数U的取值
若完全一致,则U=1
若对角线上下格子中出现的择优分数相同, 则一致性最小,但其值不为0
如果K为奇数,每格的择优分数为K+1/2与K-1/2, 均匀分布在对角线上下,这时U=-1/K
如果K为偶数,则对角线上下的择优分数为K/2,这时U=-1/(K-1)
若红与橙比较,10人都喜欢红,则红行橙列的各自内择优分数为10,橙行红列的择优分数为0
若设某格的择优分数为rij,在对角线另一方相应的格内分数则为K-rij
若K个评价者完全一致
个格内的择优分数为K
个格内的择优分数为0
每一格内的择优分数有这么多种可能:
将各格的各种可能相加,与完全一致时的最大可能之和的比率定义为一致性系数U
肯德尔W系数与U系数的异同
相同点
意义相同
评分者信度
不同点
适用条件不同
W:等级评定
U:对偶比较
第四节 质与量相关
指所求相关的两列变量一列为等比或等距数据,另一列是按性质划分的类别
包括
一、 点二列相关(point-biserial correlation)
一列为连续变量(点数据),另一列为“二分”称名变量(二分型数据)
适用资料
二分变量
按事物的某一性质划分的只有两类结果的变量,称为二分变量
分为
真正的二分变量
也称为离散型二分变量
人为的二分变量
指该变量本身是一个连续型的测量数据,但被某种人为的规定标准划分为两个类别
有时一个变量是双峰分布,也可划分为二分称名变量
给二分变量的一系列观测值,即两种变化结果赋予对应的数字,如0,1,就能得到一个“二分”数列
点数据
连续变量(等距或等比测量变量)
要求总体呈正态分布
点二列相关法就是考察两列观测值,一列为连续变量(点数据),另一列为“二分”称名变量(二分型数据)之间相关程度的统计方法
应用
用于评价由是非类测验题目组成的测验的内部一致性等问题
每题只有两种结果:对、错
总分为连续变量
计算每题与总分的相关(称为每一题目的区分度),就用点二列相关法
计算公式
是与二分称名变量的一个值 对应的 连续变量的平均数
是与二分称名变量的另一个值 对应的 连续变量的平均数
p与q是二分称名变量两个值各自占的比率,p+q=1
st 是连续变量的标准差
rpb取值在[-1.1],绝对值越高,相关程度越高
二、 二列相关(biserial correlation)
两列数据均属于连续测量数据
适用资料
两列数据均属于正态分布
两列数据均属于连续测量数据
其中一列变量为等距或等比的测量数据
一列为人为划分的二分变量
公式及计算
两个公式等效
st 为连续变量的标准差
是与二分变量中某一分类对偶的连续变量的平均数
是与二分变量中另一分类对偶的连续变量的平均数
p为某一分类在所有二分变量中所占的比率
y为标准正态曲线中p值所对应的高度
查正态分布表可查到
为连续变量的平均数
二列相关系数的取值在-1.00~1.00之间,绝对值越接近1,其相关程度越高
点二列相关与二列相关的区别
二分变量是否为正态分布
若二分变量不确定为正态分布,则用点二列相关
若二分变量确定为正态分布,则用二列相关
实际研究中,二列相关较为少用
三、 多列相关(multiserial correlation)
两列连续变量(皆正态)
使用资料
处理两列正态变量资料(连续变量)
一列为等距或等比的测量数据
一列为被人为划分为多种类别,被称为名义变量
如果划分为三种类别,就称为三列相关;四种类别为四列相关
应用
用于一列连续变量与另一列正态的成名变量之间的一致性分析,测量中常用于效度检验
也可作双列次数分布表求相关系数的方法
公式及计算
由皮尔逊积差相关推导而来
pi是每系列的次数比率
yL 是每一名义变量下限的正态曲线高度,由pi查正态表得出
yH 是每一名义变量上限的正态曲线高度,由pi查正态表得出
为每一名义变量对偶的连续变量的平均数
st 为连续变量的标准差
多列相关系数介于-1.00~+1.00之间。
相关系数的绝对值越大,表示其相关程度越高
第五节 品质相关
适用资料
品质相关用于表示R×C(行×列)表的两个变量之间的关联程度
在编制心理测验、进行项目分析时,是常用的相关方法
处理的数据一般是计数数据
两个变量只划分为不同的品质类别
分为
四分相关 (tetrachoric correlation)
计算四分相关的资料会被整理成四格表
四格表是由两个因素,各有两项分类,做成的R×C表
适用资料
四格表的二因素都是连续的正态变量,如学习能力、身体状态; 只是人为地按一定标准划分为两个不同的类别,如“A”与非“A”
在四格表中,属于A、B项交叉格内的实际计数为a;非A非B的实际计数为d; 非A、B为b;A、非B为c;边缘次数分别为a+b、c+d、a+c,b+d,N=a+b+c+d
这类四格表大都用于同一个被试样本中,分别调查两个不同因素两项分类的情况
计算公式
皮尔逊余弦π法(近似及算法)
可以写成:
其中π为圆周率
Φ系数(phi coefficient)
是表示两因素两项分类资料相关程度最常用的相关系数
两个相互关联的变量分布都是真正的二分变量
指两个分布都只有两个点值或只表示某些质的属性, 如工作状态(有工作或无工作)、吸烟状况(吸烟者与非吸烟者)
可以运用列联表计算,因此又称为列联系数
适用资料
除 四分相关以外 的四格表(计数)资料
计算公式
Φ相关系数的大小,表示两因素之间的关联程度
Φ<0.3时,表示相关较弱
Φ>0.6时,表示相关较强
相关的方向,一般由表中ad、bc的大小来说明
在应用Φ相关时,一般不指出相关方向,只说明相关程度是否显著
完全正相关时,全体个案落于四格表中a、d两格中
完全负相关时,全体个案落于四格表中b、c两格中
零相关时,全体个案匀称地落于四格中
四格表(独立样本)相关程度的描述,除了常用的Φ相关以外,还有尤尔(Yule)的关联系数Q或归结系数γ(有时用W表示)
三个系数的相关程度尺度不同,计算出的数值可能不同
Q与γ存在数量关系:Q=2/(1+γ²)
列联表相关
又称为均方相依系数、接触系数等,一般用C表示
用于R×C表的计数资料
计算方法
皮尔逊定义的列联系数
当分组数目R≥5,C≥5,而且样本N较大时,列联表相关系数C与积差相关r很接近
当两个因素完全独立时,C为0; 反之,C小于1
Tschuprow的表示公式
在R不等于C时,T也达不到1
第六节 相关系数的选用与解释
一、 如何选用合适的相关系数
首先,考虑每种数据属于什么类别,测量被试的哪种心理属性
既要注意整个测量的总结果的数据类型,还要注意个别题目的测验结果的数据类型
其次,对第一种测量数据和第二种测量数据的类型依次做出判断
二分称名数据
给被试一个名称,并且该测量结果只把被试区分为两个类别
用质量相关法
数据类型及对应的相关系数类型
最后,确定哪一种相关系数
二、 相关系数值的解释
偏相关和半偏相关p149
偏相关表示两个变量间纯净的相关度
第六章 概率分布
统计推断:是从样本出发推断总体分布的过程; 使用推论统计的方法,推论统计的数学基础是概率论
第一节 概率的基本概念
一、 什么是概率
随机现象又称随机事件,或简称事件
随机指在一定条件下可能出现或可能不出现
概率
是表明随机事件可能性大小的客观指标
概率的定义
后验概率 (posterior probability)
也称为统计概率
当n无限增大,计算出的概率估计值越趋近真实的概率值
这种概率由事件A出现的次数决定,因此称为后验概率
当对随机事件进行n次观测,在n→∞时,其中事件A出现的次数m与观测次数n之间的比值稳定在常数P上,常数P称为概率
写作
先验概率 (prior probability)
也称为古典概率
在特殊情况下直接计算的比值,是真实的概率而不是估计值
特殊情况
实验的每一种可能结果(称为基本事件)是有限的
每一个基本事件出现的可能性相等
若基本事件的总数为n,事件A包括m个基本事件
则事件A的概率为:
二、 概率的基本性质
概率的公理系统
任何一个随机事件的概率都是非负的
必然事件的概率是1
逆定理不成立
(概率是1的事件,只能说明出现的可能性很大,不能说明它是必然事件)
不可能事件的概率是0
逆定理不成立
(概率是0的事件,只能说明出现的可能性很小,不能说明它是不可能事件)
概率值在0与1之间,可写作:0≤P(A)≤1
概率的加法定理(additive rule)
指两个互不相容事件之和的概率=这两个事件概率之和
互不相容事件指在一次实验或研究中,若事件A发生则事件B就一定不会发生; 反之为相容
写作:
P(A+B)=P(A)+P(B)
其总和的概率永远不会大于1
概率的乘法定理(product rule)
适用于几种事件同时发生的情况
两个独立事件同时出现的概率=该两事件概率的乘积
独立事件指一个事件的出现对另一个事件的出现不发生影响
相依事件或相关事件指两个事件其中一个的出现对另一个的出现发生影响
公式:
P(AB)=P(A)×P(B)
三、 概率分布类型
概率分布(probability distribution)是指对随机变量取值的概率分布情况用数学方法(函数)描述
类型
离散分布与连续分布
依随机变量是否具有连续性来划分
离散分布
是离散随机变量的概率分布
离散随机变量是只取孤立的数值的随机变量
常用分布
二项分布 泊松分布(Poisson distribution) 超几何分布(hypergeometric distribution)
连续分布
指连续随机变量的概率分布
即测量数据的概率分布
常用分布
正态分布、负指数分布、威布尔分布
经验分布与理论分布
依分布的来源划分
经验分布(empirical distribution)
指根据观察或实验所获得的数据而编制的次数分布或相对频率分布
是总体的一个样本,初步描述研究对象,作为推论总体的依据
理论分布(theoretical distribution)
两个含义
是随机变量概率分布的函数——数学模型
是按某种数学模型计算出的总体的次数分布
基本随机变量分布与抽样分布
是应用于统计学上的理论分布,是统计推论的依据
依概率分布所描述的数据特征而划分
基本随机变量分布
常用
二项分布、正态分布
抽样分布(sampling distribution)
是样本统计量的分布
样本统计量有:平均数、两平均数之差、方差、标准差、相关系数、回归系数、百分比率(或概率)等
统计量是基本随机变量的函数
意思是 统计量由基本随机变量计算而来
所以抽样分布又称随机变量函数的分布
第二节 正态分布(normal distribution)
也称常态分布或常态分配,是连续随机变量分布的一种
1733年棣·莫弗发现;拉普拉斯、高斯对正态分布研究也做出贡献,因此正态分布有时也称高斯分布
能力的高低、成绩的好坏、人们的社会态度、行为表现、身高体重等身体状态都属于正态分布
一、 正态分布特征
正态分布曲线函数
又称密度函数
一般方程:
π为圆周率3.1415926…
e是自然对数的底2.71828…
X是随机变量取值
-∞<X<+∞
μ为理论平均数(总体平均数)
σ²为理论方差(总体方差)
y为概率密度,即正态分布的纵坐标(高度)
当X=μ时
当X=μ,σ=1时
在中央点的y最高,即y的最大值为0.3989
正态分布的特征
1. 正态分布的形式是对称的
对称轴是经过平均数点的垂线
正态分布中
平均数、中数、众数三者相等,此点y最大,为0.3989
各相当间距面积相等,y值也相等
2. 正态分布的中央点最高,逐渐向两侧下降
曲线先内弯,后外弯,拐点位于正负1各标准差处
曲线两端向两边无限延伸,但不能与基线相交
3. 正态曲线下的面积为1
过平均数处的垂线将面积划分为相等的两部分,各为0.5
对应横坐标(即标准差)与平均数之间的面积可用积分公式计算:
由于每一横坐标所对应的面积与总面积(为1)之比的值等于该部分面积值,所以正态曲线下的面积可视为概率
4. 正态分布是一族分布
若平均数相同,标准差不同
标准差大的正态分布曲线形式低阔
标准差小的正态分布曲线形式高狭
可以通过Z分数公式转换为标准正态分布 (standard normal distribution)
标准正态分布写作N(0,1)正态分布
平均数为0,方差为1
密度函数
面积
5. 正态分布中各差异数值相互有固定比率
6. 正态分布曲线下,标准差与概率(面积)有一定的数量关系
在正负一个标准差之间(±1s),包括总面积的68.26%
在正负1.96个标准差之间(±1.96s),包括总面积的95%
在正负2.58个标准差之间(±2.58s),包括总面积的99%
在正负3个标准差之间(±3s),包括总面积的99.73%
在正负4个标准差之间(±4s),包括总面积的99.99%
二、 正态分布表的编制与使用
正态分布表的编制与结构
编制方法
从Z=-∞开始,Z逐渐增加。表中列出的是某Z分数以下的积累概率
从Z=0开始,逐渐变化Z分数,计算从Z=0至某一定值之间的概率
因为正态分布是对称分布,且对称轴为过μ=0,即Z=0,所以当Z<0时,其概率与Z>0时相应的Z分数下的概率值相等
正态分布表(附表1)
包括三栏
第一栏是Z分数单位
一般标为Z,或
在平均数这一点上Z=0,平均数以上(曲线右侧)为正值,平均数以下为负值
第二栏为密度函数或比率数值(y)
即Z分数某一点上的曲线纵坐标高度
标准正态分布曲线下,Z=0,y=0.3989
第三栏为概率值(p)
即不同Z分数点与平均数之间的面积与总面积之比
正态分布表的使用
1. 依据Z分数求概率(p),即已知标准分数求面积
有三种情况
1||| 求某Z分数值与平均数(Z=0)之间的概率
2||| 求某Z分数以下或以上的概率
3||| 求两个Z分数之间的概率
2. 从概率(p)求Z分数,即从面积求标准分数值
三种情况
1||| 已知从平均数开始的概率值求Z分数
直接按概率值查分布表
2||| 已知正态分布两端的概率值求该概率分界点的Z值
需先用0.5减去已知两端的概率再查表求Z
3||| 已知正态分布曲线下中央部分的概率
将中央部分的概率值除以2再查表
3. 已知概率或Z值,求概率密度y(即正态曲线的高)
三、 次数分布是否为正态的检验方法
拟合检验方法
χ²检验
第十章
简单方法
皮尔逊偏态量数法
在正偏态中Mo<Md<M
在负偏态中M<Md<Mo
正态分布中,M=Md=Mo
偏态量数公式
在偏态分布(skewed distribution)中,平均数距中数较近,距众数较远。 根据三者的距离,提出公式描述分布形态
s为标准差
SK为偏态量数
当SK=0时,分布对称
当SK>0时,为正偏态
当SK<0时,为负偏态
峰度、偏度检验法
需要观测数目足够大,才有意义
偏度系数 (coefficient of skewness)
观测数据N>200,才可靠
g1=0时,分布对称
g1>0时,分布为正偏态
g1<0时,分布为负偏态
峰度系数 (coefficient of kurtosis)
N>1000时,才可靠
g2=0时,正态分布的峰度
g2>0时,分布的峰度比正态分布的峰度低阔
g2<0时,分布的峰度比正态分布的峰度高狭
累加次数曲线法
将一般分布的累加概率与标准正态分布累加概率相比较
比较方法:
制作样本的累加次数分布表,列出累加比率和观测值相应的标准分数
制作样本的累加频率曲线图
纵坐标为次数比率0~1
横坐标为标准分数,一般为-3~+3
在统一坐标系中,制作累加正态分布概率曲线图
纵坐标为累加概率(同累加比率)
横坐标为标准分数值
画好图后,从图上直接比较两条曲线
若完全重合,说明样本分布呈正态
若样本的累加频率分布曲线同正态的偏离较大,则不符合正态
四、 正态分布理论在测验中的应用
化等级评定为测量数据(Z)
先判断是否为正态分布。是正态分布,可以转化为测量数据,即标准分数Z;若不是,则不能转化
具体步骤p168
1||| 根据各等级被评定者的数目求各等级的人数比率
2||| 求各等级比率的中间值,作为该等级的中点
3||| 求各等级中点以上(或以下)的累加比率
4||| 用累加比率查正态分布表求Z值
该Z分数为各等级代表性的测量值
5||| 求被评者所得评定等级的测量数据的算数平均数,即为每个被评定者的综合分数
确定测验题目的难易度
假定一个测验中不同难易题目的分布是正态的
具体步骤
1||| 计算各题目的通过率
即答对人数与参加测验人数的比例,在正态表中代表曲线下的面积
2||| 用0.5减去通过率,不计正负号,得出正态分布表中的概率值(p)
3||| 依照p值,查得相应的Z值,通过率大于50%的Z值计为负值,小于50%的为正值
4||| 查表所得Z分数加5(假定±5个标准差包括了全体),可得从0~10的十进制的难度分数值
在能力分组或等级评定时确定人数
假定能力是正态分布
具体方法
1||| 将6个标准差(假定6个标准差包括了全体)除以分组或等级数目,做到Z分数等距
如要分为5组,6σ÷5=1.2σ,每组要占1.2个标准差的距离
2||| 查正态分布表,从Z求p,即各等级或各组在等距的情况下应有的比率
3||| 将比率乘以欲分组的人数,得到各等级或分组该有的人数
最后所计算的各组人数分布,应与总数相等
有时因为计算误差,使结果不能与总数相等,则应将剧中的那一组做适当的增减
测验分数的正态化
次数分布的正态化
有样本原始分数分布转换成正态分布
前提:样本对应的总体呈正态分布,样本是由于抽样和误差导致的偏态;否则会歪曲现实
正态化步骤
原理:利用改变次数的方法,将原来偏态分布中众数所偏的一边拉长,使之称为正态,是一种非线性的转换
将原始分数的频数转化为相对累积频数(即百分等级),将其视为正态分布的概率
查正态分布表,找出对应概率的Z值
使其达到正态化的目的
T分数(T scores)
常用于建立常模
是从Z分数转化而来的一种正态化的标准分数
麦克尔创造的方法
公式
T=10Z+50
与之前的Z'=10Z+50的线性变换有所区别:
T分数是经过正态化的分数; Z'是否服从正态分布未可知,只是以原始分数的分布形态为转移
计算步骤
将原始分数正态化
若原始分数已经是正态,则可省略
将正态化后的Z值代入公式计算
优点
1||| 没有负数,若出现小数可四舍五入为整数,且误差不大
2||| 取值范围符合百分制计分习惯,易于接受
3||| 运用T分数可使由于抽样误差导致的偏态分布正态
具体步骤
1||| 将原始分数整理成次数分布表
2||| 计算个分组上限以下的累加次数cf
3||| 计算每组中点的累加次数分布
即该组以下的累加次数加上该组次数的一半
4||| 各组中点以下的累加次数除以总数求累积比率
5||| 将累积比率视为正态分布概率,查正态表,将其转化为Z值
6||| 将正态化的Z值代入T分数公式转换为T值
第三节 二项分布(binomi distribution)
贝努里创始,又称为贝努里分布
一、 二项试验与二项分布
二项试验
条件
1. 任何一次实验恰好有两个结果
A或非A
2. 共有n次试验,n必须是预先给定的任一整数
3. 每次试验相互独立
4. 某种结果出现的概率在任何一次试验中都是固定的
二项分布
指试验中仅有两种不同性质结果的概率分布
两个结果即观测值是对立的,因此二项分布可称为两个对立事件的概率分布
二项定理
与二项分布有密切联系
二项展开式的二项系数可用杨辉三角形表达
杨辉三角形中的每一行是展开式的各项系数
每行两端值都是1,中间部分的值是上一行相邻两个值的和
三角形每行的列数=所在行数=n+1
(x=0,1,…,n为正整数)
二项分布的具体定义
设有n次试验,每次试验是彼此独立的,每次试验某事件出现的概率是p,不出现的概率是q(q=1-p),对于某事件出现x次(x=0,1…,n)的概率分布为b(x,n,p)
公式
表示在n次试验中有x次成功,成功的概率为p
例p178
二、 二项分布的性质
二项分布是离散型分布,概率直方图是越阶式
因为X为不连续变量,用概率条形图表示更合适,用直方图表示只是为了更形象
当p=q时,图形是对称的
当p≠q时,直方图呈偏态
p>q与p<q的偏斜方向相反
若n很大,即使p≠q,偏态逐渐降低,最终呈正态分布
正态分布是二项分布的极限分布
在正态分布中,p=0.5而n为无限大
当p<q且np≥5,或p>q且nq≥5,此时二项分布可当作正态分布的近似形
二项分布的概率用正态分布的概率作为近似值
二项分布的平均数与标准差
若二项分布满足p<q且np≥5(或p>q且nq≥5),在二项分布接近正态分布
二项分布接近正态分布时, 变量X(即成功的次数)具有如下性质:
μ=np,σ²=npq
即X变量为μ=np,σ²=npq的正态分布
n为独立试验次数,p为成功事件的概率
三、 二项分布的应用
用于解决含有机遇性质的问题
区分由猜测造成的结果与真实结果之间的界限
p181例:
第四节 样本分布
指样本统计量的分布,是推论统计的重要依据
条件
首先应保证每个样本是独立的,各个样本都服从同样的分布
取样方法应用随机抽样的方法
正态分布及渐进正态分布
样本平均数的分布
是从总体中抽取的各样本的平均数的分布
1. 总体分布为正态,方差(σ²)已知,样本平均数的分布为正态分布
设母总体的参数为μ(平均数),σ²(方差)
样本平均数分布的平均数与方差(或标准差) 与母总体的平均数和方差有关系:
样本平均数的平均数与母总体平均数相同
标准误(standard error),或平均数的标准误,也用SE表示
样本平均数的标准误与母总体的标准误成正比,与样本容量n成反比
样本容量越大标准误越小
母总体与样本平均数分布的比较
横坐标用总体随机变量的测量单位表示
总体正态分布低阔,样本平均数的分布高狭
样本容量越大,标准误越小,样本分布越高狭
样本平均数的标准分数
2. 总体分布非正态,但σ²已知。 当样本足够大时(n>30),其样本平均数的分布为渐进正态分布
样本n越大,接近正态分布的程度越好,样本n与总体偏斜的程度越小
其样本分布的平均数与标准差,与总体的μ和σ之间,也有同上关系
样本方差和标准差的分布
当样本容量n足够大时(n>30),样本方差及标准差的分布,渐趋正态
其分布的平均数与标准差与母总体的σ²和σ的关系,可近似表示:
样本标准差的分布
样本标准差分布的平均数=母总体标准差
样本标准差分布的标准差,也称为标准误
变异误
样本方差的分布
样本方差分布的平均数=母总体方差
t分布(t distribution)
统计学家高赛特1908年以笔名“Student”发表的论文中推导的分布,因此t分布有时也称为学生式分布(Student's distribution)
t分布左右对称、峰态较高狭,是分布形状随样本容量n-1的变化而变化的一族分布
计算公式
t分布与自由度(n-1)有关
自由度(degrees of freedom)指任何变量中可以自由变化的数目
t分布的自由度用ν(读作nu)或df表示
一般为n-1,即样本容量减1
代表t分布中随机独立变量的数目,故曰自由度
t分布的特点
1. 平均值为0
2. 以平均值0左右对称,左侧为负值,右侧为正值
3. 变量取值在-∞ ~+∞之间
4. 样本容量在趋于∞时,t分布为正态分布,方差为1
当n-1>30时,t分布接近正态分布,方差大于1;随n-1的增大,方差逐渐趋于1
当n-1<30时,t分布与正态分布相差较大;随n-1减少,离散程度越大(方差越大)
t分布的使用
t分布表
由三方面数值构成: t值、自由度、显著性水平
表的左列为自由度
表的最上一行是不同自由度下t分布两尾端的概率,即p值
指某一t值时,t分布两尾端的概率之和,即双侧界限
双侧概率写作
表的最下一行是单侧界限
指某一t值时,t分布一侧尾端的概率
单侧概率写作
表内数值是不同的p值和df值对应的t值
在自由度确定时,t值越大,p值越小
样本平均数的分布
1. 总体分布为正态,方差(σ²)未知时,样本平均数的分布为t分布
样本平均数分布的平均数是总体平均数
平均数分布的标准差与样本本身的标准差有下述关系
标准误
s为样本本身的标准差
2. 总体分布为非正态,方差(σ²)未知时,样本平均数的分布近似为 t分布
因为方差未知,其标准误的计算,可用样本方差作为总体方差的估计值,公式同上
3. 方差未知时,两样本的平均数之差的分布、样本相关系数分布、回归系数分布在一定条件下也遵从t分布
χ²分布
χ²分布是应用较多的抽样分布,是刻画正态变量二次型的一种重要分布
从一个服从正态分布的总体中,随机抽取随机变量
计算随机变量的平方和:
计算其Z分数平方和:
这n个随机变量平方和或标准分数的平方和的分布,即为χ²分布
χ²可以写作:
当总体平均数已知

或
此时χ²分布的自由度为n
若正态总体的平均数未知,用样本平均数作为μ的估计值时:
此时χ²分布的自由度为df=n-1
χ²分布的特点
1. χ²分布是一个正偏态分布
n或n-1越小,分布越偏斜
当df→∞,χ²分布即为正态分布
2. χ²都是正值
3. χ²具有可加性
χ²分布的和也是χ²分布
Σχ²是一个遵从Σdfi 的χ²分布
Σdfi =df1+df2+……+dfi
4. 若df>2
这时χ²的平均数为:
方差为
5. χ²分布是连续型分布,但有些离散型分布也近似χ²分布
χ²分布表
根据χ²分布函数计算得出
表的结构
左列为自由度
最上一行是概率值
是自由度不同时,某χ²以上的概率
表中间所列数值为不同自由度及概率下的χ²值
书写方式
意为当自由度df=20时,χ²=10.9,其值以上的概率为0.95
查表(附表12)
F分布
F比率
无限多的F的分布就是F分布
设有两个正态分布的总体,其平均数和方差分别为:μ1,σ²1 及 μ2,σ²2
从两个总体中抽取容量为n1,n2的样本
算出每个样本的χ²值
每个χ²随机变量各除以对应的自由度df1与df2(df=n或n-1)之比,称为F比率
因为
所以
F比率为样本方差各除以其总体方差的比率
若令σ1²=σ2²,即从同一总体中抽样
则
从同一正态总体中抽取容量为n1、n2的两样本,其方差的比率的分布就是F分布
分子的自由度为n1-1,分母的自由度为n2-1
F分布
特点
1. F分布形态是一个正偏态分布
分子分母的自由度增加,分布曲线渐趋正态
2. F总为正值,因为F是两个方差的比率
3. 当分子的自由度为1,分母的自由度为任意值时,F值与分母自由度相同概率的t值(双侧概率)的平方相等
例如分子自由度为1,分母自由度为20,F0.05(1, 20)=4.35,查t值表df=20时,t0.05=2.086,(t0.05)²=4.35=F0.05(1, 20)
这说明当 组间自由度为1时(即分子的自由度为1),F检验与 t 检验的结果相同
F分布表
根据F函数计算得来(附表3和4)
附表4为例
左一列为分母的自由度
左二列为α概率:0.05与0.01即F曲线下某F值右侧的概率
最上行是分子的自由度
其他部分为F值
书写方式
意为当分子自由度df1=2,分母自由度df2=9时,样本F值比F=4.26大的概率为0.05
查表(附表4)
下标0.05为α概率
第七章 参数估计
从局部结果推论总体的情况,称为总体参数估计
第一节 点估计、区间估计与标准误
良好估计量的标准
1. 无偏性
无偏估计量(unbiased estimate)
用多个样本的统计量作为总体参数的估计量,其偏差的平均数为0
是总体μ的无偏估计
因为无限多个样本平均数与μ的偏差之和为0
σ² 的无偏估计量是
样本方差s²作为总体方差σ²的估计值是有偏的,一般偏小
sn-1²是无偏样本方差; s²是有偏样本方差
2. 有效性
无偏估计变异小者有效性高,变异大者有效性低
即方差越小越好
如作为μ的估计值MO、Md、M都是无偏估计,只有M的变异最小(方差最小),所以平均数是μ的估计值中最有效的
3. 一致性
是对于大样本提出的要求
当样本容量无限大时,估计值应逐渐趋于真值
4. 充分性
样本容量为n的统计量,能否充分反映全部n个数据所反映的总体的信息
参数估计分为
点估计(point estimation)
定义
是用样本统计量来估计总体参数
因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计
已知一个样本的观测值,就可得到总体参数的估计值
如用样本均值估计总体均值,样本方差估计总体方差
优点
能够提供总体参数的估计值
缺点
不能提供正确估计的概率
点估计只用估计量的一个具体数值作为带估参数的估计值,由于估计量是随机变量,所以点估计以随机变量中的某一个值做估计,会产生一定误差
区间估计(interval estimation)
区间估计在一定程度弥补了点估计的不足
区间估计的定义
是根据估计量以一定可靠程度推断总体参数所在的区间范围
用数轴上的一段距离表示未知参数可能落入的范围
优点
指出总体参数落入的范围
给出估计精度并说明估计结果的有把握的程度
置信区间和显著性水平
置信区间
也成为置信间距(confidence interval,CI)
指在某一置信度时,总体参数所在的区域距离或区域长度
置信界限(confidence limits)
是置信区间的上下二端点值
显著性水平(significance level)
是指估计总体参数落在某一区间时,可能犯错误的概率,用符号α表示
有时也称为意义阶段、信任系数等
在假设检验中,指拒绝虚无假设时可能出现的犯错误的概率水平
置信度或置信水平(confidence level)
1-α
即估计正确的概率
例如 0.95置信区间指总体参数落入该区域内,估计正确的概率为0.95,出现错误的概率为0.05(α=0.05),即: 0.95置信区间=0.05显著性水平的置信区间 0.99置信区间=0.01显著性水平的置信区间
区间估计的原理与标准误
原理
依据样本分布理论
样本分布可提供概率解释,标准误的大小决定区间估计的长度
计算置信区间和解释成功估计的概率(置信水平)
以μ的估计为例
根据平均数的样本分布及其标准误计算: 当总体方差已知时,样本平均数的分布为正态分布或渐进正态分布,由此可说——
所有平均数中,有68.62%的平均数落在μ上下一个标准误内→ 即有68.62%的机会μ被包含在任何一个平均数加减一个标准误内→ 或者,估计μ在平均数加减一个标准误之间正确的概率为68.62%
同理: μ在平均数±1.96标准误之间的正确概率为95%; μ在平均数±2.58标准误之间的正确概率为99%
置信水平为0.95或0.99为常用,因为其对应的显著性水平为0.05或0.01,0.05或0.01为小概率事件,因此犯错误的可能很小
其他总体参数的估计原理与平均数的估计原理相同,但所依据的样本分布及标准误不同
第二节 总体平均数的估计
因为样本平均数的平均数与母总体平均数相同,所以对平均数总体的平均数进行估计就是对母总体平均数的估计
一、 估计总体平均数的步骤
1. 根据实得样本的数据,计算样本的平均数与标准差
2. 计算标准误
两种情况
总体方差已知
总体方差未知
用样本的无偏估计量计算
用样本的有偏估计量计算
主要用于计算置信区间
3. 确定置信水平或显著性水平
一般确定置信水平为0.95(显著性水平为0.05),或置信水平为0.99(显著性水平为0.01),因为0.05或0.01为小概率事件,因此犯错误的可能很小(不超过5%或1%的概率)
4. 根据样本平均数的抽样分布,确定查何种概率表
确定α=0.05或0.01
当总体方差已知时,查正态分布表
当总体方差未知,查t值表(当n>30时,也可查正态表作近似估计)
确定
5. 计算置信区间
如果查正态分布表,置信区间写作:
这个Z是查概率值为(1-α)/2时的Z
或
如果查t值表,置信区间写作:
这个t是查概率值为(1-α)/2,与相应的只有都对应的t分数值
或
6. 解释总体平均数的置信区间
估计总体平均数落入该区间的正确可能性概率为1-α,犯错误的可能性概率为α
二、 总体方差σ²已知时,对总体平均数μ的估计
正态分布表
1. 当总体分布为正态时,不论样本n的大小,其标准误为σ/根号n
根据同一总体的两个两个样本进行估计时,样本大时估计的区间小,其样本平均值也更接近总体平均数。因此遇到多个样本的情况时,一般取样本大的平均数和标准误进行计算
2. 当总体分布为非正态分布时,只有当样本容量n>30以上,才能根据样本分布对总体平均数进行估计,否则不能估计
其标准误同上
三、 总体方差σ²未知,对总体平均数的估计
t分布表
总体分布为正态时,不论n的大小
当总体分布为非正态分布时,只有当样本容量n>30以上,才能根据样本分布对总体平均数进行估计,否则不能估计
第三节 标准差与方差的区间估计
一、 标准差的区间估计
正态分布表
当样本容量n>30时,样本标准分布渐进正态
标准差的平均数:
标准差分布的标准差:
总体σ未知,可用样本sn-1作为估计值计算标准误
置信区间一般为0.95或0.99,其Z值为1.96或2.58
置信区间可写作:
二、 方差的区间估计
卡方分布
自正态分布的总体中,随机抽取容量为n的样本,其样本方差与总体方差比值的分布为χ²分布
根据χ²分布
确定置信区间
查df=n-1的χ²表确定χ²值
α为显著性水平,1-α为置信区间
利用总体方差的置信区间计算总体标准差
当样本容量小于30,用这种方法计算标准差的置信区间更方便准确
估计σ²的置信区间不受样本容量的限制(利用χ²分布)
但对标准差总体的估计受到样本限制(n>30,渐进正态分布)
可以利用卡方分布,先对总体的方差进行估计,求得方差的置信区间后,再将所得值开平方,其正平方根就是标准差的相当于方差置信水平的置信区间
三、 二总体方差之比的区间估计
F分布
两总体方差不等
样本方差之比,服从 F分布( df1=n1-1,df2=n2-1)
样本方差之比多数围绕总体方差之比上下波动
总体方差之比:
如果两总体方差相等
即
其样本方差之比多数围绕1上下波动
反之,根据样本方差估计二总体方差之比在1的上下一定区间内,就可以推测两总体方差相等
根据F分布,可估计二总体方差之比的置信区间为:
因为F表是单侧概率(右侧尾部),如需另一侧概率,用1/Fα/2作为1-α的F1-α值
若二总体相等
第四节 相关系数的区间估计
一、 积差相关系数的抽样分布
当总体的相关系数ρ为负值时,样本 r 的分布呈不同程度的负偏态
当总体的相关系数ρ为正值时,样本 r 的分布呈不同程度的正偏态
当ρ≠0时,只有样本容量充分大(n≥500),才渐进正态分布
此时样本的标准误为
当总体相关系数ρ=0时,样本相关系数的分布服从自由度为df=n-2的t分布
标准误为
当总体相关系数ρ≠0时,样本相关系数的计算受到n的限制,费舍利用公式将r转换呈Z值,这些Z值渐进服从正态分布,即费舍Z分布。
将r转换为Z的公式:
可查rZ转换表
其标准误为:
n为成对数据的数目,即使n较小,也可以使用
二、 积差相关系数的区间估计
当总体相关系数为零时(ρ=0)
t分布
置信区间
其中t分布的自由度为df=n-2
标准误为
当不确定ρ是否为0时,可以假设为0,先用该公式计算,若计算的置信区间不包含0值在内,则说明假设有误,此时应使用Z分布
当总体相关系数不为零时(ρ≠0)
Z分布
1. 若n>500,则置信区间
限制较大,较少使用
标准误为
2. 利用费舍Z函数分布计算
不限n的大小,不论总体相关是否为0,都可使用
具体步骤
(1) 将样本相关系数转换成Z函数
两种方法:
公式计算:
查附表8(r-Zr转换表),由样本r值查Zr值
(2) 计算Zr的置信区间
为费舍Z分数
是正态表查到的Z分数
n为成对数据的数目,即使n较小,也可以使用
(3) 将Zr的置信区间转换为相关系数
两种方法:
公式计算:
查附表8,将Zr值转换成r值
三、 等级相关系数的区间估计
主要是斯皮尔曼等级相关系数
斯皮尔曼等级相关系数在9≤n≤10时
t分布
置信区间
df=n-2
若n>20
正态分布
在等级相关系数的分布近似正态分布
置信区间
标准误不变
第五节 比率及比率差异的区间估计
一、 比率的区间估计
比率的样本分布
二项分布
比率的分布为二项分布
从二项分布总体中每次取大小为n的样本(进行n次重复试验)
每次可计算实得的比率为
x为成功的次数
为样本分布的比率
也是总体比率p的点估计
当np≥5(nq≥5)
渐进正态分布
样本比率的分布服从渐进正态分布
平均数
标准误
二项分布用成功的次数表示为:μ=np,σ=根号npq 若用比率表示则都除以n
当总体p、q未知时,可用样本的比率代替
比率的区间估计
当
比率的置信区间:
当
此时二项分布不接近正态,直接查二项分布统计表(附表13)得置信界限
二、 比率差异区间估计
两样本比率差异的抽样分布
当n1p1≥5,n2p2≥5时
正态分布
均数为
标准误为
若p1=p2=p
则该两样本取自同一总体
标准误的计算用平均的比率(pe)
标准误
整理得
当总体比率p1=p2=p且未知时使用
比率差异的区间估计
当n1p1≥5,n2p2≥5时, 比率差异的置信区间可用正态分布概率计算
当p1≠p2时
置信区间为:
统计学上的相等,是指一个范围,即某值的置信区间
当p1=p2=p时
置信区间为:
p1 - p2=0
第八章 假设检验(hypothesis testing)
概念
定义
假设性检验是通过样本统计量得出的差异做出一般性结论,判断总体参数之间是否存在差异的过程
基本人物
事先对总体参数或总体分布形态做出一个假设,然后利用样本信息判断原假设是否合理,从而决定是否接受原假设
包括
参数检验(parametric test)
总体分布形态已知,对总体的未知参数进行假设检验
非参数检验(non-parametric test)
对总体分布形态知之甚少,需对未知分布函数的形态及其他特征进行假设检验
第一节 假设检验的原理
一、 假设与假设检验
假设
是根据已知事实和理论对研究对象所作的假定性说明
研究假设(科学假设)
是根据已有理论和经验事先对研究结果作出一种预想的希望证实的假设
记为
不能对H1的真实性直接检验,需要建立与之对立的假设,即虚无假设
因与H0对立,所也称对立假设或备择假设
意为一旦有充分理由否定虚无假设H0,则H1这个假设作为备选
虚无假设(null hypothesis)
也称为无差假设、零假设、原假设
记为
一般作为被直接检验的假设
假设检验
判断虚无假设H0是否正确,决定接受还是拒绝虚无假设; 若拒绝虚无假设,则接受备择假设H1
若证明H0为真,则H1为假
若证明H0为假,则H1为真
二者互斥,且只有一个正确
二、 假设检验中的小概率原理
假设检验的基本思想是概率性质的反证法
假设检验中的“反证法”思想
在虚无假设为真的前提下,如果有不合理现象出现,则表明“虚无假设为真”的假定是不正确的;若没有不合理现象出现,则认为该假定正确,要接受虚无假设
“不合理现象”指小概率事件在一次试验中发生了
小概率事件原理
认为“小概率事件在一次试验中几乎是不可能发生的”
将概率不超过0.05,0.01,0.001的事件当作“小概率事件”
三、 假设检验中的两类错误
假设检验的可能结果
Ⅰ型错误与Ⅱ型错误
Ⅰ型错误(type Ⅰ error)
虚无假设H0本来为真,但拒绝了H0,这类错误叫弃真错误
该类错误的概率用α表示,所以也称为α型错误
Ⅱ型错误(type Ⅱ error)
虚无假设H0本来不正确,但接受了H0,这类错误叫取伪错误
该类错误的概率用β表示,所以也称为β型错误
一个好的检验,应在样本容量一定的情况下,将两类错误的概率尽可能小; 但α不能过小,否则就会使β大为增加
显著性检验(significance test)
在实际问题中,一般控制犯Ⅰ型错误的概率α,这类统计检验假设问题就是显著性检验。将犯Ⅰ型错误的概率α称为假设性检验的显著性水平
差异显著(significance difference)
也可说差异具有统计学意义
意为所得差异超过了统计学规定的某一误差限度,则表明这个差异不属于抽样误差,而是总体上确实有差异
反之差异不显著
若样本统计值与相应总体参数差异显著,意味着该样本基本不属于已知总体
两类错误的关系
1. α+β不一定等于1
因为α和β是在两个不同前提下的概率
2. 在其他条件不变的情况下,α与β不可能同时减小或增大
当α减小时,β必定会增大
在规定α的同时尽量减小β的方法:
加大样本容量
3. 统计检验力
当H1为真,即μ1与μ0确实有差异时,μ1与μ0的距离即表示为二者的真是差异,能以1-β的概率接受之
1-β是统计检验力(power of test)
当H1为真,接受H1的概率(当H0为假,拒绝H0的概率)
因为1-β反映了正确辨认真实差异的能力
若真实差异很小时,某个检验仍能以较大把握接受它,就说这个检验的统计检验力较大
四、 单侧检验与双侧检验
双侧检验(two-sided test 或 two-tailed test)
是只强调差异,而不强调方向性的检验
如果显著性水平α定为0.05,则两端拒绝区的面积比率各为0.025
单侧检验(one-sided test 或 one-tailed test)
是强调某一方向的检验
通常适用于检验某一参数是否“大于”或“优于”、“快于”、“小于”、“劣于”另一参数等问题
H0的拒绝区只在一端,如果显著性水平α定为0.05,则拒绝区的面积比率0.05
如何选用
根据研究目的选用
若显著性水平α=0.05不变,双侧检验比单侧检验的临界点更远离μ0
由于临界点向原理μ0方向移动时,β错误将增大
因此
该用单侧检验的问题,若使用双侧检验,其结果一方面可能使结论由“显著”变为“不显著”;另一方面也增大了β错误
应当用双侧检验的问题若用单侧检验,虽减小了β错误,但使无方向性的问题人为的称为单方向的问题,有悖于研究目的
五、 假设检验的步骤
1. 根据问题要求,提出虚无假设和备择假设
以平均数显著性检验为例
假设检验有三种类型
双侧检验
H0:μ1=μ0,H1:μ1≠μ0
单侧(左侧)检验
H0:μ1≥μ0,H1:μ1<μ0
单侧(右侧)检验
H0:μ1≤μ0,H1:μ1>μ0
2. 选择适当的检验统计量
3. 规定显著性水平α
4. 计算检验统计量的值
5. 做出决策
第二节 平均数的显著性检验
1. 总体正态分布、总体方差已知
Z检验(大样本检验)
用样本分布的标准误按正态分布去计算临界比率,并从正态分布表中查出临界点的值
解题步骤
假设整体呈正态分布
提出假设检验
计算样本平均数分布的标准误
计算临界比率CR(critical ratio)
CR的意义与标准分数Z相似
在总体分布为正态、总体方差已知时
临界比率CR一般用Z表示
也有书写为
因此这种情况的检验方法又称Z检验或μ检验
确定显著性水平,并查表找出对应的Zα/2值进行比较
若实际算得的Z值(临界比率)超过Zα/2值时(落入拒绝域),拒绝H0所犯Ⅰ类错误的概率不足α,在统计学中认为此时的样本均值与μ0的差异在α水平上显著 (用p<α表示)
若实际算得的Z值(临界比率)未超过Zα/2值时(落入接受域),拒绝H0所犯Ⅰ类错误的概率大于α(用p>α表示),这时不能拒绝H0,在统计学中认为此时的样本均值与μ0的差异在α水平上不显著
2. 总体正态分布、总体方差未知
t检验
当n≥30时,可以近似使用Z检验,但n<30时,必须使用t检验,因此t检验也被称为小样本检验
步骤与上面基本一致
不同在于,计算标准误时,由于总体方差未知,要用无偏估计量代替总体方差
这时的临界比率的分布服从t分布,因而将方差未知时所及进行的检验称为t检验
df=n-1
3. 总体非正态分布
如果样本容量较大,可近似应用Z检验
中心极限定理:
从平均数μ0、标准差σ0的总体中随机抽样(无论是否正态),样本平均数的分布随着样本容量的增大而趋于正态分布
且
一般认为当n≥30(或n≥50)时,尽管总体分布非正态,对于平均数的显著性检验仍可以用Z检验(由于Z检验是近似的,所以用Z'表示)
当总体标准差未知时,由于样本容量较大,可以直接用样本标准差s代替σ0
样本容量较小时,n<30时,只能用非参数方法或对数据进行转换
对原始数据进行对数转换或其他转换,使非正态数据转化未正态形式,然后再做Z检验或t检验
第三节 平均数差异的显著性检验
目的在于由样本平均数之间的差异来检验各自代表的两个总体之间的差异
不同条件需用不同的公式
一、 两个总体都是正态分布、两个总体方差都已知
Z检验
两个样本平均数的差异为:
若两总体都是正态分布,则平均数差异的分布也是正态
则总体平均数差异为
对两个样本平均数差异的显著性检验实际上就是
不同条件下的标准误不同
独立样本的平均数差异检验
方差的性质
当两个变量相互独立时,其和或差的方差等于各自方差之和
当两样本平均数相互独立时
标准误为
临界比率为
相关样本的平均数差异检验
相关样本指两个样本的数据之间存在一一对应的关系
当两个变量之间相关系数为r时,两变量差的方差为:
变异误(方差)为
标准误为
Z检验
二、 两个总体都是正态分布、两个总体方差都未知
t检验
独立样本的平均数差异检验
1. 两个总体方差一致或相等,即
方差齐性
标准误
由于总体方差未知,使用其两个样本的无偏估计量的加权平均(联合方差)作为估计值:
由于
所以
标准误为:
t检验
当n1=n2时
标准误
t值
2. 两总体方差不齐性
用两个样本方差作为总体方差的无偏估计
使用柯克兰-柯克斯t检验(Cochran-Cox t-test)
t’的临界值计算
t1(α)为t分布中在α水平下与样本1的自由度df1=n1-1对应的临界值
t2(α)为t分布中在α水平下与样本2的自由度df2=n2-1对应的临界值
当n1=n2时
t’值
说明两总体正态分布,方差未知且不等时,当n1=n2时,仍可以近似使用方差相等条件下的t检验(只需将自由度从2n-2变为n-1)
这表明,当总体方差不一致时,安排n1=n2可以起到一定的矫正作用,所以研究时应充分重视n1=n2的优越性
相关样本的平均数差异检验
相关系数未知
t检验
用di表示每一对对应数据之差
X1i和X2i表示分别取自样本1和样本2的第i对数据
n和d值的平均为:
n个d的方差为
n→∞时,d值的分布是正态
这时d值的平均数可以被看作从d值总体中抽取的一个样本平均数,因而d的样本分布也是正态
总平均数:
标准误
相关系数已知
此时
标准误
t值
df=n-1
三、 两个总体非正态分布
当n≥30时,可进行Z'检验
独立样本的平均数差异检验
相关样本的平均数差异检验
第四节 方差的差异检验
一、 样本方差与总体方差的差异检验
卡方分布
从正态总体随机抽取容量为n的样本时,其样本方差与总体方差的比值为χ²分布
算出χ²值后,根据自由度df=n-1分别从χ²表中查到χ²(1-α)/2和χ²α/2
二、 两个样本方差之间的差异显著性检验
也被称为方差齐性检验
F分布
独立样本
F分布
如果这个比值过大或国小则意味着两总体方差相等的假设应当推翻
服从F分布
求F值时,将较大的样本方差放在分子,较小的样本方差放在分母
当n1与n2相差不大时,用s²代替无偏估计
相关样本
t检验
两样本相关时,方差的差异检验用t检验
df=n-2
第五节 相关系数的显著性检验
一、 积差相关系数的显著性检验
是样本相关系数与总体相关系数的差异检验
相关系数r的样本分布受ρ的影响很大
分为两种情况
ρ=0(无相关)
实际应用中,直接查附表7
此时r分布近似正态
t检验
df=n-2
概要
ρ≠0(相关)
了解r是否来自ρ为某一特定值的总体
此时r的样本分布不是正态,需要将r与ρ都转换成费舍Zr
Zr的分布可以认为是正态的
平均数
标准误
进行Z检验
二、 其他类型相关系数的显著性检验
点二列相关系数
点二列相关公式
若差异显著,说明相关系数显著
若差异不显著,说明相关系数不显著
若样本容量较大,可用近似方法:
认为rpb在0.05水平显著
认为rpb在0.01水平显著
二列相关系数
可用Z检验:
多列相关系数
先将相关系数进行处理:
再查按照积差相关的检验方法(查附表7)
四格相关
Z检验
检验公式
斯皮尔曼等级相关
计算出临界值后,直接查附表9
肯德尔W系数
当3≤N≤7时(注意N表示被评定者的数目)
查附表10
当N>7时,将所得W代入公式:
χ²=K(N-1)W
df=N-1
查χ²分布表,若所得χ²显著,则W也显著
三、 相关系数差异的显著性检验
r1和r2分别由两组彼此独立的被试得到
将两个r分别进行费舍Zr转换
由于Zr的分布近似正态,同样(Zr1-Zr2)的分布仍为正态
其分布的标准误为
进行Z检验
两个样本相关系数由同一组被试算得ρ12、ρ23、ρ13
两种情况:
检验ρ12与ρ13的差异
t检验
用(r12-r13)来检验(ρ12-ρ13)
先列出三列变量的两两相关系数r12、r13和r23
进行t检验
df=n-3
可用于新测验的效度是否显著提高的问题p253
检验ρ12与ρ34的差异
现实中少用
第六节 比率的显著性检验
一、 比率的显著性检验
指样本之总体p与已知的总体p0之间有无差异 (样本比率是否再总体比率p0的置信区间内)
标准误:
分布
当
正态分布概率计算临界值
当
此时二项分布不接近正态,直接查二项分布统计表(附表13)得置信界限
若样本p落在p0置信区间之内,则差异不显著
二、 二比率差异的显著性检验
指两个样本比率之各自总体p1与p2比率之间差异显著性问题
独立样本比率差异显著性检验
若统计假设为:
即事先假设二比率之总体相等
计算标准误:
临界比率CR为
若统计假设为:
即事先假设二比率之总体不相等
计算标准误:
临界比率CR为
np>5,用Z检验;np<5,用精确概率检验(查表)
相关样本比率差异显著性检验
指同一组被试在前后两个相同项目的结果中的样本比率的差异
第九章 方差分析
第一节 方差分析的基本原理及步骤
一、 方差分析的基本原理:综合的F检验
方差分析又称变异分析(analysis of variance,ANOVA)
斯内德克(George Waddel Snedecor)
主要功能在于分析实验数据中不同来源的变异对总变异的贡献大小,从而确定实验中的自变量是否对因变量有重要影响
综合虚无假设与部分虚无假设
方差分析主要处理多于两个以上的平均数之间的差异检验问题
综合虚无假设:
样本所归属的所有总体的平均数都相等
如
H0:μ1=μ2=μ3
检验综合虚无假设是方差分析的主要任务
部分虚无假设
是组间的虚无假设
方差的可分解性
方差分析依据的基本原理:
方差的可加性原则(可分解性原则)
k=3表示三种实验条件
n=4表示每种实验条件有4个被试
表示每种实验条件的平均数
表示总平均数
表示每个观测值
每个数据与总平均数的差异 等于它与本组平均数之差 加上小组平均数与总平均数之差
将第j组的n个数据的平方和相加:
由于平均数离差平方和=0,化简后得
将k组的以上关系相加
平方和定义公式
为总平方和(the sum of squares total)
表示实验中产生的总变异
为组间平方和(the sum of squares between groups)
表示由不同实验处理产生的变异
为组内平方和(the sum of squares within group)
表示由实验误差造成的变异
组间变异和组内变异相互独立,可以分解
则
平方和除以自由度所得的样本方差可作为其总体方差的无偏估计:
表示组间方差(组件均方)(mean squares between groups)
有些书用表示,指是实验处理(treat)的均方
表示组内方差(组内均方)(mean squares within group)
有的书用表示,指误差的均方
自由度
组间自由度
(有k组)
组内自由度
(每组有n个被试)
总自由度
比较组间均方和组内均方F检验
检验两个方差之间的差异用F检验
讨论方差齐性时,利用F检验比较两个样本方差的差异用双侧检验
在方差分析中关心的是组间均方有没有显著大于组内均方,若组间均方显著大于组内均方,就无需检验其是否小到显著水平
因此将组件均方放在分子位置,进行单侧检验
公式
F<1,说明数据的总变异中由分组不同所造成的变异只占很小的比例(实验处理基本无效)
F=1,说明实验处理之间差异不大
F>1且落入F分布的临界区域表明数据的总变异基本上由不同的实验处理所造成(不同实验处理之间存在显著差异)
二、 方差分析的基本过程与步骤
直接从原始数据求平方和
平方和公式:
nk是全部的被试个数
具体步骤
1. 求平方和
三种方法
用平方和定义公式
表示实验中产生的总变异
用原始数据
用样本统计量计算
2. 计算自由度
组间自由度
df=k-1
组内自由度
df=k(n-1)
总自由度
df=nk-1=N-1
3. 计算均方
MS=SS/df
4. 计算F值
F=MSB/MSW
5. 查F值表进行F检验并做出决断
查附表4
如
0.01表示显著水平
(2,9)中的2表示分子自由度,9表示分母自由度 (分子自由度,分母自由度)
6. 陈列方差分析表
组成要素:
变异来源
平方和
自由度
均方
F值
p值
三、 方差分析的基本假定
总体正态分布
当有证据表明总体分布不是正态时,可以将数据正态化,或采用非参数检验方法
变异的相互独立性
各实验处理内的方差要一致
要求各实验处理内的方差彼此无显著差异
四、 方差分析中的方差齐性检验
用于检验各实验处理内的方差是否一致的假定
哈特莱(Hartley)最大F比率法(maximum F-ritio)
具体实施的步骤:
先找出要比较的几个组内方差中的最大值和最小值
代入公式:
查Fmax表(附表5)
当算出的Fmax值小于查表的数值,说明方差齐性
当用于计算的两个方差所对应的自由度不同时,使用其中较大的一个作为查表所用的自由度
五、 与方差分析有关的实验设计问题
检验双组设计的平均数差异
方差分析和t检验会得到同样的结果
多组设计只能使用方差分析
组间设计(被试间设计)
通常把被试分作几组,每组分别接受一种实验处理
即不同被试接受自变量不同水平的实验处理
被试随机取样并随机分组到不同的实验处理中
又叫完全随机设计(complete randomlized design)
各实验组的被试之间相互独立,所以又被称为“独立组”设计
主要特点
实验处理前,各个组别各方面相同; 若实验结果中,组与组之间有显著差异,说明差异是由不同的实验处理造成的
劣势
在设计中,实验误差既包括实验本身的误差,又包括被试个别差异引起的误差,无法分离,因而效率受到一定限制
组内设计(被试内设计)
指每个被试都要接受所有自变量水平的实验处理
由于接受每种实验处理后都要进行测量,所以也被称为“重复测量设计”
组内设计中,当用被试样本组代替单个被试时,又称为“随机区组设计”
区组
指代替单个被试的被试样本组
同一个区组内应尽量同质,即在各方面都相似或相同
每个被试组都要接受所有实验处理,但组中的每个被试只随机接受一种实验处理
优点
将被试的个别差异从被试(组)内分离出来,提高了实验处理的效率
缺点
划分区组困难
如果不能保证同一区组内尽量同质,则有出现更大误差的可能
混合设计
涉及两个以上的自变量,每个自变量的实验设计各不相同
实际上是同时进行几个实验
第二节 完全随机设计的方差分析
完全随机设计的方差分析就是对单因素组间设计的方差分析(one-way between-subjects analysis of variance)
这种实验设计中,各种处理的分类仅以单个实验变量为基础
类型
一、 各实验处理组样本容量相同
由于各处理组样本容量相同,所以对于每一种实验处理而言,被重复的次数相同。 这种情况也被称为“等重复”
例题
步骤
设备择假设和虚无假设
H0:μ1=μ2=μ3 H1:μ1≠μ2≠μ3
方差分析
(1) 计算平方和SS
(2) 计算自由度df
(3) 计算均方MS
(4) 计算F值,进行F检验,并做出决断
(5) 列出方差分析表
单因素方差分析表
组间效应也被称为“因素效应”
组内效应也被称为“误差效应”
二、 各实验处理组样本容量不同
又称为“不等重复”
其他步骤基本相同,但是组间平方和的计算需要注意:
N=Σn
三、 利用样本统计量进行方差分析
利用定义公式进行平方和的计算,其余步骤与上面一致
平方和定义公式
例题
第三节 随机区组设计的方差分析
随机区组设计(randomized block design)
由于同一区组接受实验处理,使实验处理之间有相关,所以也称为相关组设计
根据被试的特点将被试划分为若干区组,再根据实验变量的水平数再每个区组内划分若干个小区
同一区组随机接受不同处理
设计原则
同一区组内的被试应尽量同质
每一区组内被试的人数分配情况
1||| 一个被试作为一个区组
这种区组设计也称为随机化完全区组设计
则每个被试都需要接受全部K种实验处理
每人接受K种实验处理的顺序不同而产生的误差,应该用一定的方法加以平衡
2||| 每一区组内被试的人数是实验处理数的整数倍
3||| 区组内的基本单位不是个别被试,而是以一个团体为单位
区组效应
由于被试之间性质不同导致产生的差异
总平方和被分解为三个部分:
被试间平方和(sum of square between subjects)
或sum of square across subjects
反映的是被试之间个别差异的影响效果
即组间平方和
区组平方和(sum of squares IV,IV是independent variable的缩写)
independent variable是自变量
反映的是自变量的作用
可以表示区组效应
k指对自变量进行k种实验处理
ΣR为一个区组内的数据之和
误差项平方和(sum of square error)
反映的是除被试间个别差异之外其他干扰因素的影响
SSW被分解为SSR和SSE
总变异(总平方和)为:
N=nk
总平方和=组间平方和+区组平方和+误差平方和
自由度
N为nk,总数据个数
n为区组个数
(如果是随机化完全区组设计,即一个被试一个区组,则n为被试个数)
F检验
用于检验自变量的实验处理是否有效
是方差分析的主要目的
F单侧检验,显著即有效,不显著为无效(实验处理对于结果基本没有影响)
用于检验区组设计是否有效(区组效应是否显著)
对于实验目的没有重要意义
区组变异和组件变异是彼此独立的
F单侧检验
区组效应显著,说明该实验设计采用随机区组设计是成功的
不显著为无效,或各区组被试基本同质,没必要进行区组设计
方差分析表
处理是实验处理,即组间效应
第四节 事后检验 (post hoc test)
事后检验
也称为事后多重比较
指虚无假设被拒绝以后,对个实验处理组的多对平均数进一步分析,做深入比较,从而判断是那一对或哪几对的差异显著,以说明哪种实验处理所造成的变异较多
为什么不用t检验对多个平均数差异进行比较?
同时比较的平均数越多,其中差异较大的一对所得t值超过原定临界值tα的概率就越大,这时α错误的概率明显增加
设需要进行两两比较的次数为N,则以t0.05/2为临界值的α错误率为:
当需要对3个以上的平均数的差异进行比较时,单纯使用多次t检验,错误率增大,不可靠
当需要对3个以上的平均数的差异进行比较时,应用多重比较的方法进行检验:
Scheffé检验法
最普遍,但是可能会引发更高的Ⅱ型错误
Newman-Keuls检验法
计算较为方便、统计效果更好
Duncan的多距检验法
Tukey的可靠显著差异法(honest significant difference,HSD)
费舍的最小显著差异法(least significant difference,LSD)
N-K检验法
由Newman和Keuls共同提出
也被称为q检验法
实施步骤
1. 将要比较的各个平均数从小到大作等级排列
2. 计算比较等级r,根据r和自由度dfE,查附表6种对应的q值(0.05或0.01)
比较等级r的计算:
r=ri-rj+1
两个比较的平均数所对应的等级之差加1
自由度dfE
是方差分析中的误差项自由度
在区组分析中dfE=(k-1)(n-1)
在完全随机设计中dfE=dfW=k(n-1)
3. 求样本平均数的标准误
一般公式:
MSE等于完全随机设计中的MSW
n是每组容量
如果完全随机设计中,各样本容量不同时:
na和nb分别是用于比较两个样本的容量
4. 计算临界值
用标准误乘以查表所得的q,是对应于某一个r值的两个平均数相比较时的临界值
如果比较的两个平均数的差异(之差)大于对应r计算的临界值,则认为二者在α水平上显著;小于则不显著
例题
多重分析一般用于方差分析之后,但只要多个平均数的两两比较,都可以使用时候检验
第十章 χ²检验
是非参数检验方法
第一节 χ²检验的原理
对计数数据总体的分布形态不作任何假设
对计数数据统计分析的根据是χ²分布,所以这类统计分析方法为χ²检验
也称为列联表分析或交叉表分析
因为技术数据可以用列联表(contingency table)或交叉表(cross tabulation)的单元格形式表示
也称百分比检验
因为使用的列联表的单元格里可以是次数或百分比
χ²检验能处理一个因素两项或多项分类的实际观察频数与理论频数分布是否差异显著
实际频数(actual frequencies)
指在实验或调查中得到的计数资料
简称实计数、实际数、观察频数
理论次数(theoretical frequencies)
指根据概率原理、某种理论、某种理论次数分布或经验分布计算出来的次数
又称期望次数(expected frequencies)
χ²检验的假设
分类相互排斥,互不包容
相互排斥
每个观测值就可以分到所属类别
互补包容
不会出现某一观测值同时划分到几种的类别当中的情况
观测值相互独立
是最基本的假定
独立性假定是指变量之间的相互独立
变量的独立性正在被检测,观测值的独立型是预先的一个假定
期望次数的大小
每个单元格中的期望次数应至少在5个以上(80%的单元格理论值大于5)
当自由度为1时,每个单元格的期望次数不应低于10
若自由度很大
一个简单的处理原则是使每一个类别的理论次数都不低于1
分类中不超过20%的类别的理论次数可以小于5
在理论次数较小的特殊四格表中,应运用精确的多项检验来避免使用χ²检验
χ²检验的类别
配合度检验
主要用来检验一个因素多项分布的实际观察数与某理论次数是否接近
也称无差假说检验
当对连续数据正态性进行检验时,这种检验又可称为正态吻合性检验
独立性检验
用于检验两个或两个以上因素各种分类之间是否有关联(或独立性)的问题
同质性检验
主要用于检定不同人群母总体在某一个变量的反映是否具有显著差异。如果两样本没有差异,则可以说母总体是同质的
χ²检验的基本公式
检验的是样本观测次数(或百分比)与理论或总体次数(或百分比)的差异
统计原理
比较观察值与理论值的差别
差别越小,检验的结果越不容易达到显著水平
差别越大,检验的结果越可能达到显著水平
基本公式:
f0是实际观察次数
fe是理论次数
当fe越大(fe≥5),该次数分布与χ²分布接近得越好
χ²值越大,代表统计量(f0)与理论值(fe)的差异越大;χ²值越小,代表差异越小
特点
表示统计量与理论值差异的程度
随自由度变化,自由度越大,χ²值越大
具有可加性
期望次数的计算
期望次数是虚无假设成立时的数值
在配合度检验时
期望值为总体的实际数值,或某一理论存在的数值
在独立型检验或同质性检验中
若两个变量或样本无关联时,期望值为列联表中各单元格的理论次数:
即各单元格(cell)对应的两个边缘次数的积除以总次数
如A1B1单元格,其边缘次数分别为NA1,NB1,单元格的理论次数就是NA1·NB1/Nt
小期望次数的连续性矫正
若单元格的理论值小于5,则会导致统计检验高估的情形
当单元的人数(理论值)过少时,处理方法有四种:
单元格合并法
增加样本数
去除样本法
若样本无法增加,次数偏低的类别不具有分析和研究价值时,可以将该类被试去除,但研究结论不可推论到这些被去除的母总体中
使用矫正公式
在2×2列联表中
若单元格的期望次数低于10,但高于5,可使用耶茨矫正(Yates' correction for continuity)
当期望次数低于5,或样本总人数低于20时,应使用费舍精确概率检验法(Fisher's exact probability test)
当单元格涉及到重复测量设计时(如前后测设计),则可以使用麦内玛检验(McNemar test)
应用χ²检验应注意取样设计
主要样本代表性问题,防止产生有偏样本,注意控制影响数据的因素
第二节 配合度检验(goodness of test)
检验单一变量的实际数与理论值的差别
只涉及一个因素多项分类的计数资料,故称单因素检验(one-way test)
一、 配合度检验的一般问题
统计假设
检验步骤
统计假设
运用基本公式计算χ²
查分布表
若计算的χ²值大于表中χ²0.05或χ²0.01,则拒绝零假设,推论f0与fe差异显著
需注意的是,χ²检验法查附表12得到的概率是双侧概率,因为χ²总为正值,实际上f0-fe有正有负。因此查表做出推论所得的错误率是指双侧概率
自由度的确定
自由度与两个因素有关:
实验或调查中分类的项数
计算理论次数时,所用观察数目的统计量的个数
自由度的计算
df=资料的分类或分组的数目,减去计算理论次数时所用统计量的个数
在通常情况下计算理论次数都要用到“总数”这一统计量,所以至少减1
配合度检验的自由度
df=分类的项数-1
正态拟合检验
用到三个统计量:总数、平均数、标准差
df=分组数目-3
理论次数的计算
按一定概率通过样本(实际观察次数)计算
此概率有经验概率、理论概率(二项分布、正态分布等)
二、 配合度检验的应用
检验无差假说
无差假说
指各项分类的实计数之间没有差异(机会相等或概率相等)
其各分类的实际数的概率p为1/分类项数
理论次数完全按概率相等的条件计算
检验假设分布的概率
假设某因素各项分类的次数分布为正态,检验实计数与理论上期望的结果之间是否有差异
理论次数的计算按正态分布概率
需分别计算各项分类的理论次数
具体方法:
按假定的分布理论计算各项分类应有的概率
再用所得概率乘以总数
例:假设为正态分布
按正态分布,±3σ可认为包括了总体,各等级所占横坐标应该相同 (6σ÷分类项数)
计算各分类对应p值
计算各分类对应的理论次数
统计假设:
计算χ²值和自由度
查表比较
若差异显著,则说不符合正态分布或与正态分布有显著差异
三、 连续变量分布的吻合性检验
分布拟合检验
也成为分布的拟合度检验(或吻合性检验)
指在给定的显著性水平下,对假设做显著性检验
对于连续性数据总体分布的检验的方法
一是将测量数据整理成次数分布表,画出次数分布曲线图,根据曲线图判断选择恰当的理论分布
二是选择一个分布函数,计算理论次数,然后代入χ²检验,判断是否显著;若显著,则说明选择的分布函数不是实际数据所对应的函数
四、 比率或百分数的配合度检验
基本检验方法与上面相同,但是最后计算出的χ²值要乘以N/100后再查χ²表
五、 二项分类的配合度检验与比率显著性检验的一致性
比率显著性检验的依据是二项分布
设p=q,实际数为X=f0,μ=fe
当np>5时
显著性检验的公式:
配合度检验的公式:
更简单(无需开方)
df=1
六、 χ²的连续性矫正
当期望次数小于5时,比例的显著性检验应该用二项分布的概率计算
若fe<5时用χ²检验,则所得概率(拒绝的犯错误率)偏小
为了矫正,耶茨(Yates)将实计数与理论次数之差的绝对值减去1/2,使χ²减少一点,这样所得概率就会增大一些
耶茨的矫正公式:
若三项或以上分类时,出现某一单元格内的理论次数小于5,一般不需要矫正公式计算,直接使用基本公式计算χ²值,也可以得到满意结果
第三节 独立性检验(test of independence)
χ²检验
独立型检验
主要用于两个或两个以上因素多项分类的计数资料分析,研究两类变量之间的关联性和依存性问题
必须同时处理双变量的总体特性,因此又可以称为双因子检验,或双母总体检验
判断一自变量A(因素)的不同分类(处理)在另一变量B的多项分类上是否有差异,用独立性检验:
如果二变量独立
则在分类上差异不显著(因为B因素的不同处理影响不了A)
如果二变量有关联
则在分类上的差异显著
又称列联表分析
因为独立检验一般多采用列联表的形式记录观察结果
列联表的形式
两个因素各有两项分类
称为2×2表或四格表
一个因素有R类,另一个因素有C类
这个表称之为R×C表
因素多于两个以上
这种表称为多维列联表(multiple contingency table analysis)
独立性检验的一般问题与步骤
统计假设
虚无假设:
二因素(或多因素)之间是独立的或无关联的(不显著)
备择假设:
二因素(或多因素)之间是有关联的或差异显著的
一般多用文字叙述
理论次数的计算
直接用列联表提供的数据推算出来
计算
每一分类的数目与总数(N)的比值,提供了样本比率
理论次数=样本比率×对应的因素的总数
公式
可允许出现小数
fx表示每一行的和
fy表示每一列的和
边缘次数
如男生参与体育活动的理论次数为 55×(27/97)=15.3
自由度的确定
与两因素各自的分类项数有关
设R为每一行的分类项数,C为每一列的分类项数
则自由度df=(R-1)(C-1)
意思是,在3×2=6的单元格内,只有两个单元格内的数目可以自由变动。 在六个单元格中,只要有两个单元格的数字确定,在边缘次数不变的情况下,其他各单元格的数字也随之确定
统计方法的选择
独立样本
χ²检验
要求实计数≥5
基本公式
缺点是需要计算理论次数
实计数公式
是每一格的实计数
是实计数所对应行的总数,即边缘次数
是实计数所对应列的总数,也称边缘次数
结果及解释
查自由度对应的χ²
计算的χ²值小于χ²0.05或χ²0.01时,接受原假设(虚无假设), 认为两个因素无关联=不显著=独立
一个因素的几项分类在另一个因素的吉祥分类上实际观察次数与理论次数差异不显著
计算的χ²值大于χ²0.05或χ²0.01时,拒绝虚无假设, 认为两个因素有关联=差异显著
四格表独立性检验
独立样本四格表χ²检验
相当于独立样本比率差异的显著性检验
当fe≥5时,可用χ²检验的基本公式
或用简捷公式
N是总实计数,分母是所有边缘次数的乘积
四格表自由度df=(2-1)(2-1)=1
相关样本四格表χ²检验
与相关样本比率差异显著性检验功能相同
检验公式
A和D是四格表中两次实验或调查中分类项目不同的那两个格的实计数
四格表χ²的近似矫正
当四格表任一格的理论次数小于5,要用Yates连续性矫正公式计算χ²值
独立的四格表χ²矫正公式
相关的四格表χ²矫正公式
四格表的Fisher精确概率检验方法
当期望次数或理论次数小于5时,可用费舍精确概率检验法,代替χ²检验法
在边缘次数固定时,观测数据的精确概率分布为超几何分布
任何一特定排列的概率p为
有几个排列看实计数最小的那格,从当前的实计数变化到实计数为0的情况(有几种排列就需要计算几个p)
步骤
计算出所有可能排列的概率p,然后与显著水平α比较,若p<α(拒绝原假设的错误率小于α,可以拒绝),则两样本独立的假设不成立(显著相关)
计算出的所有可能的p之和是单侧概率,需乘以2求双侧概率
R×C表独立性检验
允许有的格内的实计数为0,最小的理论次数为0.5
基本公式
其中
fx表示每一行的和
fy表示每一列的和
边缘次数
实计数公式
是每一格的实计数
是实计数所对应行的总数,即边缘次数
是实计数所对应列的总数,也称边缘次数
多重列联表分析
如三重列联表
可以将其中一个变量作为分层变量或控制变量,分别就控制变量每一水平下另两个变量所形成的列联表来进行分析
对于控制变量不同水平所进行的单个列联表分析,如果呈现一致性的结果
可将各水平下的χ²值相加,以推测列联表中两个变量总的χ²值,并进行关联性检定
G²统计法可以同时处理多个变量的关联分析
原理
以观察次数与期望次数比值的自然对数为基础,性质跟χ²值类似
第四节 同质性检验与数据的合并
χ²检验
一、 同质性检验的相关问题
分析几种因素之间是否真的有实质上的差异
判断几次重复实验的结果是否同质
几次或几组实验数据的合并问题
二、 计数资料的同质性检验与独立性检验的关系
检验方法基本相同
检验目的不同
独立性检验是对同一样本的若干变量关联情形的检验,目的在于判明数据资料是相互关联还是相互独立
同质性检验是对两个样本的同一个变量的分布状况的检验,目的在于对几个样本数据是否同质做出统计决断
统计原理不同
独立性检验的母总体是一个样本的两个变量的母总体
同质性检验的双总体指两个样本所代表的母总体
χ²值所检验的内容是两个样本(自变量)在另一变量(因变量)上的变动
自变量是研究者操纵的变量,又称为设计变量(design variable)
因变量是反应变量
二者之间形成了一种有特定先后关系的非对称性关系
三、 单因素分类数据的同质性检验
步骤
1||| 计算各个样本组的χ²值和自由度
2||| 累加各样本组χ²值,计算其总和以及自由度的总和
3||| 将各样本组原始数据按相应类别合并,产生一个总的数据表,计算这个总数据表的χ²值和自由度
4||| 计算各样本组的累计χ²值与总测试次数合并获得的χ²值之差,称此为异质性χ²值
异质性χ²值是各个样本组间不相一致的部分,其自由度为各样本组累计自由度与合并后的总数据的自由度之差
5||| 查χ²表,判断χ²值差是否显著
若显著,说明几个样本组之间异质
若不显著,表明同质
例题
每组儿童对三种颜色字母识记效果的理论比率各为1/3,可以计算理论次数
分别计算四组数据的χ²值和自由度
对于一组数据而言,计算理论次数时,只用了总人数这一个统计量,所以自由度df=3-1=2
计算四个组的累计χ²值(即四个组的χ²值之和)和累计自由度(各组自由度之和)
合并四组数据,计算其χ²值和自由度
计算异质性χ²值和自由度
异质性χ²值=累计χ²值-合并数据的χ²值
异质性自由度=累计自由度-合并数据的自由度
查χ²表,在0.05水平上显著,说明四组数据不同质,不能合并分析
四、 列联表形式的同质性检验
方法与前面相同
注意计算χ²值时可使用四格表简捷公式
例题
五、 计数数据的合并方法
若同质性检验的结果表明各类数据同质,就可以将它们合并处理
两格表及四格表数据的合并
1. 简单合并法
将所有数据合并到同一个两格表或四格表中,然后计算χ²量,并进行假设检验
应用条件
各分表某特征的相应比率接近
各分表(小样本)的χ²量都未达到显著水平,即分表小样本齐性
2. χ²相加法
将各分表的χ²值相加,查自由度为分表数目的χ²表,确定显著性水平
缺点
反应不灵敏,因为没有考虑到各表中的比率方向,所以对于有相同比率方向的各分表分辨力较差
3. χ值相加法
应用条件
各样本容量相差不超过2倍
表中各相应比率的取值在0.2~0.8之间
显著性检验公式
K为分表的数目
χ为各分表χ²值的开方
计算χ值时,需附以适当的符号,符号的确定根据各分表中相应项目的比率差异方向是否相同
差异方向相同,则χ值符号相同
差异方向不同,则χ值符号不同
+-号无关紧要,只要保证相同或不同
原理
假设各比率相等的条件下,任一χ值渐进服从(0,1)正态分布;k个χ值之和的分布服从平均数为0,标准差为根号K的正态分布
求出统计量Z后,查正态表确定其是否显著
4. 加权法
应用条件
多个四格表中各相应比率不在0.2~0.8之间
样本容量相差较大(超过2倍)
重视大样本的重要性
样本差异方向相同
显著性检验公式
di=pi1-pi2
为各样本加权数
ni1、ni2为行的两边缘数
原理
加权的差异(ωidi)服从平均数为0,方差为1的正态分布
加权的差异之和(Σωidi)服从平均数为0,方差为Σωipiqi的正态分布
5. 分表理论次数合并法
分别计算每个分表中各格的理论次数是,然后将每个分表各对应格的理论次数相加,作为简单合并表的理论次数,再据此计算χ²值
是没有更好方法可用时不得已的选择
缺点
不遵循df=1的χ²分布,但仍用χ²统计量,使问题复杂化
R×C表数据的合并
条件
实验或调查的控制要相同
表中各相应比率方向要相等
常用方法
1. 简单合并法
要求
各分表相应比率要接近且各样本齐性
比率计算:各格的实计数/边缘次数(横行)
步骤
计算出各分表的χ²值,看是否显著,不显著即为齐性
检验同质性
计算对应格比率,观察对应比率是否接近
对应格数据合并
合并前各小样本虽未达到显著水平,但差异方向相同(各格对应比率相同),主要由于样本不够大;合并后使样本增大,就使差异达显著水平了
2. 分表理论次数合并法
先计算每个分表中各格的理论次数
将各分表的实计数合并,作为总表的实计数
将各分表中各格的理论次数相加作为总表的理论次数
用χ²基本公式计算χ²值
查df=(R-1)(C-1)的χ²表,确定显著性水平
第五节 相关源的分析
通过对R×C表进行分割分析,离析出相关源
一、 2×C表的离析
1. 将2×C表分解为独立的2×2表进行分析
步骤
1||| 首先将2×C表分解为(C-1个四格表)
先直观分析,将估计关联不明显的四格表分解出来,并逐项进行χ²检验
若关联不显著,则合并
2||| 将分解的2×2表依下式计算χ²
一个表计算一个χ²
t=1,2,3,……,C
N为2×C总表中的总数
nx1,nx2是总表中的边缘次数(横行)
nyi是总表中的边缘次数(纵列)
aibi是总表中各格的实计数
3||| 计算总χ²
其值跟分解前的总χ²值相同
2. 将2×C表分解为非独立的2×2表进行分析
应用
几个实验组与一个对照组的比较
分解为2×2四格表后,各分解表的χ²值按照四格表的计算方法计算
各分解四格表的显著性水平α'计算
α'为各分组的显著性水平
α为规定的总的显著性水平
C为总表的项目数
二、 R×C表的离析
步骤
1. 直观分析,将可能差异不显著的两个项目分解出一个2×C表或2×R表
2. 进行χ²检验
此时,χ²值用基本公式计算
3. 若χ²值不显著,则将此表数据合并,再与另一项组成新的分解表
4. 再进行χ²检验,循环往复,直至新的分解表显著
5. 获得χ²显著的分解表后,再将该分解表,继续分解为(R-1)或(C-1)个2×2四格表进行分析
具体方法参照2×C表的分解方法
计算χ²值需注意,用对应公式
第十一章 非参数检验(non-parametric test)
适用资料或使用条件
对总体分布不做严格假定,又称任意分布检验
适用于计量信息较弱的资料
往往仅依靠数据的顺序、等级资料即可进行统计推断
第一节 非参数检验的基本概念与特点
一、 非参数概念
指非参数模型
参数模型
指总体或样本的分布能够由有限的几个参数来确定时,就是参数模型
即分布的“模式”(pattern)已知,而具体参数未知
非参数模型
缺乏关于总体分布模式的信息
非参数统计中面临的问题与参数统计中不同
一类是想要知道分布是否属于某一参数模型
如χ²拟合优度检验用于这类问题
这类问题本质是非参数的,但与参数模型有关
一类是与参数模型毫无关系
再非参数统计中使用的统计量与参数统计中使用的统计量也不同
假设样本是独立分布的,不存在比顺序统计量更小的充分统计量
二、 非参数检验的特点
优势
一般不需要严格的前提假设
最大优势
非参数检验特别适合于顺序资料(等级变量)
很适用于小样本,方法简单
不足
未能充分利用资料的全部信息
在符号检验法中只考虑数据的符号,忽视其大小
在秩和检验法和其他求等级和的方法中,虽然考虑到数据的大小,但在将原始数据转换成等级时,丢失了很多信息
对于符合参数检验的资料,非参数检验方法的效度低
非参数检验方法目前还不能处理“交互作用”
第二节 两个独立样本的非参数检验方法
秩和检验法
“秩和” (the sum of ranks)
指秩次之和或等级之和
发明
首先由维尔克松(Wilcoxon)提出,叫维尔克松两样本检验法
后来由曼-特尼(Mann-Whiney)将其应用到两样本容量不等的情况,因此又称作曼-特尼维尔克松秩和检验法,曼-特尼U检验
秩统计量(rank statistics)
如果将样本数据记为X1,……,Xn;相应的顺序统计量记为Xn1≤……≤Xnj;若Xi=Xnj,则称Ri=j为Xi在样本中的“秩”(rank)
注意在排序时,如果遇到“结”(tie),即两个数值相同时,可以把原来样本序号小的排在前面
j为从小到大排序后的顺序等级
Ri=j意为第i个样本从小到大排序后位于第j位
Ri,……,Rn就是秩统计量,又称为“秩次统计量”(rank order statistic)
性质
秩统计量具有分布无关性
秩统计量的取值是(1,……,n)的任意排列,共有n!个。 当样本独立同分布时,秩统计量取任一排列的概率是相等的,为1/n!
秩统计量具有不变性
在对样本作任一单调增的变换下,样本分量的大小顺序不会改变
适用资料
当总体正态要求不满足时,不可使用t检验,可以用秩和检验代替
当两个独立样本都为顺序变量时,需要用秩和法来进行差异检验
计算过程
当两个样本容量不等时,用“维尔克松W”表示两组中较大一组的秩和
当两个样本容量相等时,W值表示两个组中第二个组的等级和
具体步骤
1. 两样本容量均小于等于10时(n1≤10,n2≤10)
(1) 排等级
将两个样本数据混合由小到大作等级排列(最小为1等)
(2) 计算秩和T
设n1<n2,将容量较小的样本(n1)中各数据的等级相加,以T表示
(3) 查表比较
把T值于秩和检验表中的临界值比较(附表14)
查表需注意:表中为单侧检验,若显著性水平为0.05,则查表应对应0.025的值
若T≤T1,或T≥T2,则表明两样本差异显著(两侧显著)
若T1<T<T2,则表明两样本差异不显著(中间不显著)
2. 两样本容量均大于10(n1>10,n2>10)
当两个样本容量均大于10时,秩和T的分布接近正态分布
平均数和标准差公式:
其中n1≤n2
差异检验
双侧检验α=0.05,Z值落在-1.96~+1.96区间则表明差异无统计学意义(区域内面积为95%)
单侧检验α=0.05,Z值落在-1.65~+1.65区间则表明差异无统计学意义(区域内面积为90%)
当等秩的现象太多时,可用矫正公式:
tk表示第k个相同等级中相同值的个数
优势
比符号检验法对数据信息的利用率高,检验效能高
在偏态分布总体下,其检验效能比t检验高
中数检验法(median test)
适用资料
与秩和检验法适用资料相当
对应参数检验中,两独立样本平均数之差的t检验
中数检验法实际上是将中数作为集中趋势的量度
虚无假设(H0)为:两个单独样本是从具有相同中数的总体中抽取的,可以双侧也可以是单侧检验
双侧显著,表示两总体中数有差异
单侧显著,表示一个总体中数大于另一个总体中数
计算过程
(1) 将两个样本数据混合从小到大排列
(2) 求出混合排列的中数
(3) 分别找出每一样本中大于及小于混合中数的个数,列成四格表
(4) 对四格表进行χ²检验
若χ²检验结果显著,说明两样本中数(集中趋势)差异显著
局限
如果任何一个单元格中期望次数低于1,或者有超过20%的单元格中的期望次数低于5,就不能使用中数检验法
第三节 配对样本的非参数检验方法
符号检验法(sign test)
适用资料
以正负符号为资料
适用于检验两个配对样本分布的差异,与参数检验中配对样本差异显著性t检验相对应
将中数作为集中趋势的量度
虚无假设为:配对资料差值来自中位数为零的总体
将两样本每对数据之差(X-Y)用正负号表示,若两样本没有显著性差异,则正差值和负差值应大致各占一半
计算过程
1. 当对子数N≤25时
求出(X-Y)大于0的有多少,记为
求出(X-Y)小于0的对数,记为
检验
根据N和r,查附表15符号检验表
在某一显著性水平在,实得r值大于表中的r的临界值时,则说明不显著
这一点与其他的参数检验查临界值表时不同
2. 当样本容量N>25时
此时,一般使用正态近似法
n+,n-服从二项分布,当N>25时,可将二项分布近似看作正态分布
平均数
+、- 出现的概率各为0.5
标准差
Z值
应用中使用近似正态分布
符号等级检验法
适用资料
由维尔克松提出,又称符号秩和检验,或维尔克松检验法
与符号检验法相同,也适合配对比较,但精度更高,不仅考虑差值的符号还考虑大小
计算过程
1. 当N≤25时
1||| 把相关样本对应数据之差按绝对值从小到大作等级排列(差值为0时,不参与等级排列)
2||| 在各个等级前面添上原来的正负号
3||| 分别求出带正好的等级和(T+)和带负号的等级和(T-),取两者之中较小的为T
4||| 根据N查附表16,当T大于临界值时表明差异不显著,小于临界值表明显著
2. 当N>25时
认为T的分布接近正态分布
平均数
标准差
进行Z检验
当相同等级较多时,计算矫正统计量
矫正是使数值变大,如果未矫正已达显著,则无需再矫正
第四节 等级方差分析
一、 克-瓦式单向方差分析
适用资料
当实验按完全随机方式分组设计,且所得数据资料不符合参数方法中的方差分析所需假设条件时,可使用克-瓦单向方差分析
计算过程
1. 当K=3,且ni≤5时
先将各组数据混合,从小到大排出等级,再分别求各组数据的等级和Ri
代入公式
K为分组数,ni为每组被试数目
Ri是某一组的等级和
N为样本总量
查附表17,表中p为显著性水平
计算所得的H值大于临界值,则显著
2. 当K>3,或ni>5时
按照公式计算H值,查df=K-1的χ²值表,若H值大于χ²临界值,则表明差异显著
当出现相同等级时,使用校正公式(无论样本大小)
此矫正使H值增大,若未校正时H值已达显著,则无需再校正
二、 弗里德曼两因素等级方差分析(Friedman test)
适用资料
配对组(随机区组)设计的多个样本比较
计算过程
将每一区组的K个数据(K为实验处理数)从小到大排出等级
每种实验处理n个数据(n为区组数)等级和,以Ri表示
代入公式
n为区组数(行数)
K为实验处理数(列数)
Ri为第i种实验处理的等级和
查表检验(附表18)
若计算所得的χ²r值比临界值大,说明差异显著;比临界值小,说明差异不显著
附表18种只有K=3且n≤9和K=4且n≤4的情况,实际问题K或n比表中大,则可查df=K-1和χ²表
第十二章 线性回归
第一节 线性回归模型的建立方法
相关概念
回归分析
回归这个概念最先由高尔顿在研究身高与遗传问题时提出
是用一定模型来表述变量相关关系的方法
线性回归(linear regression)
是对线性关系(一次函数模型)的回归分析
简单线性回归(simple linear regression)
是只有一个自变量的线性回归
回归分析与相关分析的关系
相同点
二者均为研究及度量两个或两个以上变量之间关系的方法
区别
回归分析(analysis of regression)
是以数学方式表示变量间的关系
相关分析
检验和度量变量间关系密切的程度
二者相辅相成
回归模型与回归系数
回归模型
是用于表达变量之间规律的数学模型
分类
线性回归模型(直线模型)
非线性回归模型(曲线模型)
按回归分析涉及的相关变量的数目
简单回归模型
一个自变量,一个因变量
简单回归模型的标准形式:
Y=a+bX
多重回归模型
指两个以上的自变量
回归方程(linear equation)
代表X与Y的线性关系
X为自变量
表示对应于X的Y变量的估计值
常数a表示该直线在Y轴的截距
常数b表示该直线的斜率,也是Y^的变化率
表示当X变化一个单位时,Y^变化b个单位(增减看单位)
b称为回归系数
表示Y对X的回归系数
表示X对Y的回归系数
回归模型建立方法
建立步骤
根据数据资料作散点图,直观判断两变量之间是否存在线性关系
若假设为线性关系,可直接使用
设直线方程
若Y的估计值和实际值Y之间的误差,比其他估计值与实际值Y之间的误差小,则该表达式为最优拟合直线模型(linear model fit)
最优拟合直线模型是表示X与Y之间线性关系的最佳模型
选定某种方法,选用表达式中的a和b
将a,b值代入表达式,得到回归方程
平均数方法
设方程
将数据对按奇偶顺序分为两组,分别代入方程求和,得到两个方程,将两方程联立,形成一个二元一次方程组
解a和b,代入原方程,得到回归方程
最小二乘法(method of least squares)
可得到比较精确的回归方程
使误差的平方和最小,则这条直线在所有直线中代表性最好
步骤
每一点到直线沿Y轴方向的距离平方和(误差平方和)
计算回归方程即当距离平方和达到最小时,a和b的值
对上式a、b求偏导,并另其和为0:
整理得:
两边同时除以N
得出回归方程的a、b
回归系数与相关系数的关系
相关系数的基本公式
因为
所以
联立
关系
二者的不同
回归分析是单向地分析两变量的变化关系,是一种不对称设计
表示当X变化时Y的变化率(X→Y)
表示当Y变化时X的变化率(Y→X)
相关系数考虑的是两个变量的变化情况,表示两方面的平均关系,属于对称性设计
是双向的(X↔Y)
联系
从广义上而言,相关分析包括回归分析
两者的共同点是确定变量之间是否存在关系
在一元线性回归中,相关系数是两个回归系数的几何平均
简单回归和相关系数的基本计算原理相似
以两个连续变量的共变数为基础
区别
相关分析
用相关系数来度量变量间的密切程度
相关分析是双向的,不强调自变量和因变量
回归分析
旨在用数学模型来表示变量数量关系的可能形式
回归分析是单向的,要找出一个变量随另一个变量或多个变量的变化而变化的关系
线性回归的基本假设
1. 线性关系假设
X与Y在总体上有线性关系
2. 正态性假设
回归分析中的Y服从正态分布
Y的每一个子总体都服从正态分布
平均数
方差
各个子总体的方差都相等
误差项e也称正态分布
误差项e指
误差项e的平均数为0
3. 独立性假设
Yi之间相互独立
误差项独立彼此独立
误差项与自变量X相互独立
4. 误差等分散性假设
误差等分散性
X对应的误差,除称随机化的常态分布,其变异量也应相等
误差变异歧异性
误差变异歧异性,反应出不同水准的X与Y的关系不同,不能异单一的回归方式去预测Y,否则对参数的估计检验力不足
误差变异歧异性指不相等的误差变异量
第二节 回归模型的检验与估计
一、 回归模型的有效性检验(拟合优度检验)
F检验
就是对所求的回归方程进行显著性检验,看是否真实地反映了变量间的线性关系
相关推导公式
显著性检验有关公式
平方和
表示所有Y值的总平方和
表示由回归直线表现的线性关系解释的那部分离差平方和
表示偏离回归线的平方和,称为误差平方和或残差平方和
自由度
误差平方和中的Y^的计算不仅要用Y的均值还要用b,所以失去两个自由度
均方
运用F检验,进行显著性检验
判断MSR是否显著大于MSE(即单侧检验)
若MSR显著大于MSE,则回归方程显著(表明总变异中回归的贡献显著)
回归方程方差分析表
二、 回归系数的显著性检验
t检验
对回归系数b进行显著性检验,若b是显著的,则说明回归方程也是显著的
设总体回归系数为β
虚无假设:
同相关系数r的显著性检验类似
t检验
是回归系数的标准误
进行双侧检验
自由度为dfE=N-2
计算出的t值大于t的临界值,则说明回归系数b显著,因为回归方程是显著的
回归系数的检验与回归方程的方差分析等效
三、 决定系数(coefficient of determination)
回归平方和对总平方和贡献越大,说明回归方程越显著
用r²表示
相关系数的平方即决定系数
表示回归平方和与总平方和之比
取值范围
r²≤1
-1≤r≤1
决定系数表示X的变异与Y的变异共变(变异的一致性)的比例
相关系数显著不等于高相关
保证共变部分不少于80%是稳定性的基本要求
第三节 回归方程的应用
一、 用样本回归方程进行预测或估计
回归预测分为
点估计
将确定的自变量Xi值代入回归模型,得到相应的Yi值
步骤
计算出回归方程
将Xi代入方程,得到Y^
区间估计
以一定概率为保证,预测当自变量X取一定的值Xi时,因变量Yi的可能范围
由于线性回归的基本假设之一为总体分布正态,所以Y值的分布符合正态分布
区间估计按照正态分布计算
区间内包括全部数据的95.44%
不考虑自由度或样本很大时
Y值以Y^为中心的标准差为:
Y值以Y杠为中心的标准差为:
,说明在回归线上下波动比在平均线上下波动要小
相关系数与估计标准误的数量关系
估计标准误说明X与Y的离散程度
相关系数说明相关点X与Y的关系紧密程度
二、 真值的预测区间
误差的标准差
误差的变异是【Yp以Yp^为中心的变异】和【样本回归线本身的变异】的合成
是样本回归线本身的变异
是给定X值后Y的样本条件均值的变异性
误差的标准差:
是给定X对个体Y值预测误差的标准差
是真值
的自由度使用N-2
表示预测点值
表示具体用于预测的X值
t的自由度
由于用样本标准差代替了总体标准差,因为使用t分布
t的自由度为df=N-2
三、 回归分析与相关分析的综合运用
运用步骤:
将成对资料绘制散点图
建立回归模型
回归方程显著性检验
方差分析
F检验
回归系数检验
t检验
计算回归估计标准误差
是回归系数的标准误
根据建立的回归模型进行预测,估计真值预测区间
点估计、区间估计
注意事项
一种模型只能在抽取样本的同一范围内应用才有效
回归分析不能准确确定因果关系
若变量间不存在相关,不能运用回归分析和相关分析
第十三章 多变量统计分析简介
第一节 多因素方差分析
一、 基本概念
多因素方差分析的数据来源
来源于多因素实验设计 (factorial design)
在多因素实验设计中研究者同时选用好几种影响因素作为自变量,研究它们对某一因变量的影响
因素和水平
因素(factor)指实验中的自变量
一般两个以上自变量的实验设计统称为多因素实验,对应的方差分析程序称为多因素方差分析
用大写字母A、B、C、D……表示因素
一个因素的不同水平(level)
指一个因素的不同情况
表示某因素的各个水平
交互作用与主效应
2×2实验设计范式
交互作用
当两个因素彼此不影响时,称为没有交互作用
A因素从a1变化到a2时,无论在b1还是b2水平,a1和a2的差都相同,说明A因素的变化与b1或b2无关
当两个因素彼此影响时,称为有交互作用,用A×B表示
A因素从a1变化到a2时,在b1水平的差和b2水平不同,说明A因素的变化与B因素的不同水平有关
交互作用图
用于直观分析两个因素间是否有交互作用
主效应(main effect)
是某因素平均差数的差异
一般把A因素的平均差数的差异称为A的主效应(A main effect); B因素平均差数的差异称为B的主效应 (B main effect)
交互效应(interaction effect)
是两因素交互作用下的平均数差异
主效应和交互效应的显著性可用F检验来判定
A与B的主效应相互独立
分别代表A与B变量与因变量的关系,可视为两个独立的单因素方差检验
交互作用对因变量的影响分析:
分别检验在a1和a2两种条件下的B因素效应,称为B因素单纯主效应检验
分别检验在b1和b2两种条件下的A因素效应,称为A因素单纯主效应检验
二、 多因素方差分析的统计原理
是多总体平均数的假设检验
总平方和的分解
多因素与单因素的方差分析最大的区别在于
对总平方和进行分解时可多分析出一项交互作用的平方和
在两因素的完全随机设计中:
在两因素的随机区组设计中:
整体效应的检验与图示
在二因素设计中
影响均数的变异有三个主要来源:
A主效应
B主效应
A×B交互效应
对三个主要变异源的检验就是对整体效应的检验
整体效应显著后,才需要详细就各因素的不同水平的影响进行事后比较
整体效应的检验
计算个因素内不同水平的平均数离散量(组件均方和),除以误差离散量(MSw被试间组内均方和)得出F值
若F值达到显著水平,即表明该效果显著
主效应和交互效应的显著性还可以用图示法呈现
优点
易于理解
缺点
无法说明平均数差异的显著性
事后比较
前提
类别变量中有三个以上的水平
主效应的检验与单因素方差分析原理相同
注意
二因素方差分析主效应显著后,不一定要进行事后多重比较
类别变量中有三个以上的水平,才必须对多个平均数两两比较
若各变量仅包含两个水平,可直接报告两平均数并指出高低关系
多因素交互效应显著后,对主效应必须进行事后比较
交互效应显著,表明主效应是一个过度简化,没考虑到其他因素的检验
交互作用的事后比较包括两种
事后整体检验
限定条件的主效应整体比较
事后多重比较
达到显著水平后该限定条件的主效应的事后多重比较
三、 2×2设计的方差分析举例
2×2完全随机设计的方差分析计算步骤
1||| 平方和
a. 先看成4组,每组5人,按单因素完全随机设计求
b. 计算A因素的组间平方和
A因素的组间平方和是假定全体只根据A因素来分组,则分2组,每组10人
c. 计算B因素的组间平方和
B因素的组间平方和是假定全体只根据B因素来分组,则分2组,每组10人
d. 计算交互效应的平方和
2||| 自由度
a为A因素的处理水平数
b为B因素的处理水平数
3||| 均方
只需求A、B、A×B、组内均方
4||| F检验
对于A因素
对于B因素
对于A×B因素
5||| 方差分析表
如果两因素的交互作用显著,则表明两个因素对实验结果具有共同的重要性
若交互作用不显著,检验每个因素的主效应十分重要;若不显著,意义不大
事后检验
讨论B因素在A因素的哪个水平上差异显著
即用a1水平的两组数据计算平方和
即用a2水平的两组数据计算平方和
验算
讨论A因素在B因素的哪个水平上差异显著
即用b1水平的两组数据计算平方和
即用b2水平的两组数据计算平方和
验算
方差分析表
多因素的随机区组设计
2×2设计的步骤
按照单因素区组设计的方法求出区组平方和、组间平方和、误差平方和
其余步骤同完全随机2×2设计的方差分析基本相同
多因素实验设计与适合分析
用相关样本(随机区组)多因素方差分析程序
同一被试在某一个因素上重复,在不同组别出现
称为重复测量多因素方差分析
不同组别的被试之间在实验控制之外有其他配对关联
称为配对样本多因素方差分析
在多因素实验设计中,可能并非每一个因素都使用相关设计
当所有的因素都采用相关设计时,称为完全相关设计多因素方差分析
只是部分因素采用相关设计,称为多因素混合设计
第二节 多重线性回归(multiple linear regression)
是两个及以上的自变量对因变量的影响现象进行分析
多重回归可增强对因变量的分析估计的准确性
因为现实中,一种现象常与其他多种现象相联系,用多个自变量的最优组合来预测因变量,比只用一个自变量预测更有效,更符合实际
一、 多重线性回归模型的建立
回归方程的一般形式
表示X1与X2组合起来的共同估计值
常数a表示该直线在Y轴的截距
b1和b2称为Y对X1与X2的偏回归系数
偏回归系数表示其他自变量假设不变时,某一个自变量变化引起的因变量变化的比率
使用最小二乘法
偏离误差最小,即拟合最优
在上式中对b1,b2求偏导,使其偏导为0(此时上式最小)
即可求出a、b1、b2
得到
将a代入,整理得
正规方程组
用正规方程组解b1、b2、a可得回归方程
用标准回归方程比较两偏回归系数在估计Y时的贡献
标准回归方程
一般形式
β系数具有与相关系数相似的性质,介于-1到1之间, 其绝对值越大者,预测能力越强
注意统计控制的程序回对各项参数进行校正,系数有可能出现大于1的现象
表示因变量Y的标准分数的估计值
表示以标准分数出现的自变量
表示标准偏回归系数
正规方程组
标准偏回归系数与回归系数的关系
从标准回归方程还原成原始数据的回归方程
二、 多重线性回归方程的检验
方差分析
F检验
公式
平方和
自由度
k为自变量的个数
均方
F检验
方差分析表
决定系数
表示由全部自变量共同估计Y时,回归变异占总变异的百分比
决定系数R²开方后得到R
R是复相关系数
查附表11
表示因变量Y与k个自变量线性组合之间的相关
是Y的实测值与估计值之间的相关系数
R越大,说明实测值和估计值之间的相关度越高
可以通过复相关系数的显著性来检验回归方程
复相关系数显著,则回归方程也显著
偏回归系数的显著性检验
t检验
对每个偏回归系数的显著性检验
偏回归系数的标准误
是误差的标准差
注意回归方程显著,但回归方程中的每一个偏回归系数不一定都显著
多重线性回归中的预测区间
概念同简单回归相同
计算两个自变量的回归中误差标准误
三、 多重回归方程中自变量的选择
最优方程选择法
最优方程
是方程的显著性和偏回归系数显著性都高的方程
若有4个自变量
先分别用每个自变量与因变量Y建立简单回归方程,共有4个
再从中抽取两个自变量与因变量Y建立双自变量线性回归方程,共
再从中抽取三个自变量与因变量Y建立三自变量线性回归方程,共
最后将四个自变量一同与Y构建线性回归方程
共15个方程,分别进行方程显著性检验和偏回归系数显著性检验;选择方程和偏回归系数显著性都高的方程(最优方程)
同时多重回归法
是将所有预测变量同时纳入回归方程中估计因变量
分为
强制进入法
在某一显著水平下,不考虑预测变量间的关系,把对因变量具有解释力的所有预测变量纳入回归方程,计算所有变量的回归系数
强制淘汰法
在某一显著性水平下,不考虑预测变量间的关系,将对因变量没有解释力的所有预测变量排除在回归方程外,再计算保留在回归方程中所有预测变量的回归系数
逐步多重回归法(stepwise multiple regression)
根据预测变量解释力的大小,逐步检查每一个预测变量对因变量的影响
分为
向前法(forward)
又称顺向进入法
按照自变量预测力从大到小,优先选取其偏回归平方和最大的自变量
向后法(backward)
又称反向淘汰法
把所有预测变量纳入回归方程式中运算,然后将不显著的预测变量依次剔除(从最弱到次弱的顺序)
可以找到最有预测力的变量,同时可以避免共线性的影响,适合做探索性的研究使用
逐步法(stepwise)
交替使用向前回归法和向后回归法
层次多重回归法
实现对多个自变量进行分割排序
不同部分采用不同回归法
四、 多重线性回归的基本假设
线性、独立、等方差、正态性假设
避免严重的多重共线性
在多重回归分析中,若自变量存在相关性,称为多重共线性(multiple collinearnality)
回导致回归参数估计的标准误大大增加,导致置信区间扩大,Ⅰ型错误增大
当违背了独立基本假设时,使用自回归分析
第三节 因子分析(factor analysis)
可以从可观测变量中概括综合出少数几个因子,用较少的因子变量最大程度地概括和解释原有的观测信息,从而建立起间接的概念系统
一、 因子分析的类别
R型因子分析和Q型因子分析
R型因子分析
是通过对变量相关系数矩阵内部结构的研究,找出能够控制所有变量的少数几个随机变量区描述多个随机变量之间的相关关系
这少数几个随机变量不能直接观测,称为因子
Q型因子分析
从样品的相似系数矩阵出发
二者的结果都可以用来对样品分类
探索性因子分析与验证性因子分析
探索性因子分析 (exploratory factor analysis,简写EFA)
指传统的因子分析
事先对因子的抽取、数目、内容及变量分类没有预设假定
通过共变关系的分解,找出最低限度的主要成分或共同因子,然后进一步探讨这些主要成分或共同因子与个别变量的关系,找出观察变量与其相对应因子之间的强度,即所谓的因子负荷值(factor loading)
以说明因子与所属观察变量的关系,决定因子和内容和名字
验证性因子分析 (confirmative factor analysis,简写CFA)
要求研究者对于潜在变量的内容与性质,在测量之初就必须有非常明确的说明,或具体的理论基础,进行因子分析的目的是检验预设的因子结构的稳定性
二、 因子分析基本思想、模型与条件
因子与共变结构
因子分析的数学原理是共变(covariance)抽取
即受到同一个因子影响的测量分数,共同相关的部分就是因子所在的部分,可以用“因子”的共同相关部分的得来表示
因子分析的条件
因子分析以变量之间的共变关系为分析依据,凡影响共变的因子都需确认无误
因子分析的变量都必须是连续变量,符合线性关系假设
顺序与类别变量不能用因子分析简化结构
抽样过程必须随机,并具有一定规模
样本数最少为变量数的五倍,且大于100
变量之间要具有一定程度的相关,不能太高或太低
可通过球形检验和KMO检验来确定
相关太低难以抽取一组稳定的因子
相关的绝对值小于0.3不能进行因子分析
相关太高的变量,多重共线性明显,区分效度不够,获得的因子结构价值不高
三、 因子分析的数学原理与过程
计算相关矩阵
因子分析的基础是变量之间的相关
巴特莱特球形检验
用于检验这些相关系数是否不同且大于0
球形检验结果显著,表示相关系数可以用于因子分析抽取因子
偏相关矩阵(partial correlation)
若矩阵中,有多数系数偏高,应放弃使用因子分析;
对角线的系数除外,该系数称为取样适切性量数 (KMO;Kaiser-Meyer-Olkin measure of sampling adequacy)
代表与该变量有关的所有相关系数与净相关系数的比较值,该系数越大,代表相关情形良好
检查共同性指数(communality)
指某一变量与其他所有变量的复相关系数的平方
表示该变量的变异量被共同因子解释的比例,其计算方式为在一变量上各因子负荷平方值的总和
变量的共同性越高,因子分析的结果越理想
因子抽取的方法
因子抽取(factor extraction)
目的在于决定这些测量变量中存在多少个潜在成分(component)或因子(factor)
决定因子个数的具体方法
主成分法(principle component analysis)
以线性方程式将所有变量加以合并,计算所有变量共同解释的变异量,该线性组合称为主成分
研究如何用少数几个新变量来解释原来多个变量的内部结构
若两个变量相关过高,则它们从同一角度测量一个事物
若两个变量相关过低,则它们测量的使不同事物
若两个变量是中等程度相关,则认为两者从不同角度测量同一事物
主轴因子法(principle axis factor)
分析变量间的共同变量而非全体变量
最小平方法(least squares method)
未加权最小平方法
利用最小差距原理,针对特定个数的因子,计算出一个因子形态矩阵后,使原始相关矩阵与新的因子负荷量矩阵系数相减平方后的数值最小
表示所抽离的因子与原始相关模式最接近
加权最小平方法
相关系数事先乘以变量的残差,使残差大的变量(可解释变异量少者)比重降低,计算得到原始相关系数除以新因子负荷系数差异的最小平方距离,进行因子的确认
最大似然法
相关系数经变量的残差加权后,利用似然函数,估计出最可能出现的相关矩阵的方法
因子数目
因子个数的决定主要依据特征值的大小
特征值代表某一因子可解释的总变异量,特征值越大,代表因子的解释力越强 (特征值需至少大于1)
碎石检验(scree test)
又称陡坡检验
将每一个因子依其特征值排列,逐渐递减,当特征值曲线变陡时,就是决定因子之时
因子旋转
将前一步骤抽取的因子,经过数学转换,使因子或成份能够清楚区分,反映出特定的意义
因子旋转的目的在于在于理清因子与原始变量之间的关系,有助于使结果更易解释
方法
正交旋转
旋转过程中,因子的抽线夹角为90度,即因子之间的相关设定为0
如最大变异法、四次方最大值法、均等变异法
优点
能够使因子结构达到最明晰,制作区别不同因子的量表
斜交旋转
允许因子与因子之间有一定的相关性,旋转过程中同时对因子的关联情形进行估计
如最小斜交法、最大斜交法、四次方最小值法
优点
最贴近真实
四、 因子分析的功用与应用
在心理测量领域有重要作用
协助研究者进行测验效度的验证,建立量表的因子效度
协助研究者简化测量内容,选用最具有代表性的题目来测量特质,以最少的项目实施最合适的测量
用来协助测验编制,进行项目分析,检验项目优劣
应用
结构方程模型
以验证性因子分析为核心
第十四章 抽样原理及方法
第一节 抽样的意义和原则
一、 抽样调查研究的特点和作用
节省人力及费用
节省实践,提高调查研究的时效性
保证研究结果的准确性
以样本代表性为前提
二、 抽样的基本原则
随机化(randomization)是基本原则
指在进行抽样时,总体中每一个体是否被抽取,不由研究者主观决定,而是每一个体按照概率原理被抽取的可能性是相等的
可以保证样本代表总体
d为最大允许误差
是抽样误差,d是抽样误差的临界值
可以通过改变样本容量来控制d;n越大,d越小,精度越大
是评价抽样结果精确度的指标
d值大,离散程度大,样本均值估计总体均值μ的精度小;反之则大
第二节 几种重要的随机抽样方法
简单随机抽样(simple random sampling)
方法
抽签法
随机数字法
利用随机数字表进行抽样
标准误
应注意区分
有限总体
总体中包含个体的数量是有限的
无限总体
参数估计和假设检验,都假设无限总体
总体中个体的数量无限,N→∞
有时N虽然有限,但样本容量n比N小很多,也可以近似视为无限总体
平均数的标准误
当样本所属总体是无限总体时
当样本所属总体是有限总体时
当n与N相差悬殊时,根号下近似为1,所以可将此时的有限总体近似无限总体
比率的标准误
无限总体
有限总体
评价
优点
最符合随机原则,分析抽样误差比较简明
缺点
需要把总体每个个体编号
常忽略总体已有信息,降低了样本代表性
等距抽样(interval sampling)
也称为机械抽样或系统抽样(systematic sampling)
将已编号的个体拍成顺序,每隔若干个抽取一个
其间隔视总体大小和样本容量决定
缺点
若总体具有某一种周期性变化,则等距抽样的代表性远不如简单随机抽样
容易忽略总体已有信息,降低了样本代表性
分层随机抽样
方法
分层随机抽样简称分层抽样
按照总体已有的某些特征,将总体分成几个部分(每一部分叫做一个层),再分别在每一部分中随机抽样
要求
层间异质性高,层内异质性低
层间变异越大,分层效果越好
两种实施方法
按各层人数比例分配
使用情况
各层内的标准差未知
基本思想
人数多的层多分配,人数少的层少分配
任意一层应分配的人数为:
最佳分配
使用情况
各层内的标准差已知
基本思想
除了考虑人数外,还考虑标准差: 标准差大的层多分配,标准差小的层少分配
任意一层应分配的人数为:
若σi没有现成资料,可以从该层抽取一个小样本计算si直接代替
标准误
令
平均数的标准误
无限总体:
si为某一层的标准差
有限总体:
比率的标准误(样本容量n较大时)
无限总体
无限总体
评价
优点
充分利用了总体的已知信息,代表性及推论的精确性优于简单随机抽样
总体变异分为层间变异和层内变异,但分层抽样的标准误只与层内变异有关
为层内变异,是各层内部方差的加权平均
简单随机变量的标准误与总变异有关
由于
所以
在样本容量相同时,分层抽样误差小于简单随机抽样误差
两阶段随机抽样
方法
进行两阶段随机抽样时,首先将总体分成M个部分,每个部分叫做一个“集团”(或“群”)
第一步,从M个集团中随机抽取m个作为第一阶段样本
第二步,分别从所选取的m个集团中抽取个体(ni)构成第二阶段样本
标准误
两阶段抽样时大部分是有限总体
1. 平均数的标准误
(1) 各Ni不相等
为某一集团内的方差
(2) 若各集团大小(Ni)相同,则进行第二阶段抽样时,ni也应相同
2. 平比率的标准误(样本较大时)
各Ni不相等
若各集团大小(Ni)相同,则进行第二阶段抽样时,ni也应相同
评价
相对于简单随机抽样,标准误要稍大
优点
简单易行,节省经费
其他抽样方法
根据每次抽取的样本是否在下次抽取前放回总体分
有放回抽样
所得样本(理论值)被称为“简单样本”或“i.i.d样本”(independent identically distributed)
无放回抽样
当总体个数很多,可以近似看成有放回样本,即简单样本
第三节 样本容量的确定
基本问题
确定样本容量的意义
样本量与标准误的关系
其他条件不变,样本量较小时,样本量越大,标准误越小
确定样本容量时应该考虑的因子
参数估计
当α确定后,总体标准差σ和最大允许误差d是决定样本容量的两个因子
假设检验
当α和β确定后,总体标准差σ和所假设的误差了δ决定样本容量
确定样本容量的方法
用公式计算
平均数的估计或检验时样本容量的确定
平均数估计的样本容量确定
d为最大抽样误差
无限总体抽样时
总体标准差已知
总体标准差未知
有限总体抽样时
总体标准差已知
样本容量
总体标准差已知
总体标准差未知
其中t可以近似看作Z,或者使用接近法计算
接近法
先使用Z,计算出n后,df=n-1查表得出t值,计算n1,继续df=n1-1查表得出第二个t值,继续计算n,直至两次n值相同
假设检验的样本容量确定
δ为两样本总体差异
无限总体抽样时
有限总体抽样时
样本容量
总体标准差已知
比率的估计或检验时样本容量的确定
运用基本公式和标准误公式计算
查表确定样本容量
1. 有关平均数的抽样研究
由样本平均数估计总体平均数时的样本容量
查附表20
两个样本平均数进行差异显著性检验时的样本容量
查附表22
两个样本平均数进行差异显著性检验一般要求方差齐性
样本平均数与总体平均数差异显著性检验时的样本容量
查附表22
所得结果需除以2
2. 有关比率的抽样研究
由样本比率估计总体比率时的样本容量
附表21使用时仅供参考
两个样本比率进行显著性检验时的样本容量
n=n1=n2
先利用附表24分别对两个样本比率及逆行反正弦转换,求△
根据△和(1-β)及其他不同条件,查附表23
样本比率与总体比率进行显著性检验时的样本容量
先利用附表24分别对两个样本比率及逆行反正弦转换,求△
根据△和(1-β)及其他不同条件,查附表23,最后n值除以2
3. 相关系数的抽样研究
查附表25
注意想得到服从正态分布的研究结果,其样本容量N≥30为宜,若查表所得结果小于30,可以使用N=30
补充
效果量
反映了两个总体受某种事物影响后的差异程度,是实验处理效应大小的度量
效果量越大,说明两总体分布的重叠度越小,效果越明显;反之,则效应越小
效果量不依赖于样本的大小,能反映自变量和因变量的关联强度
效果量的指标很多,不同效果量可以提供不同信息
特质水平估计值的估计标准误
是某测验信息函数在某一特质水平上的值的平方根的倒数
主题