导图社区 人卫第8版《卫生统计学》——第十章《基于秩的非参数检验》
这是本书的第二个非参数检验方法,要注意区别参数检验哦!检验的是中位数而不是均数哦
编辑于2023-02-07 16:11:25 广东社区模板帮助中心,点此进入>>
第十章 基于秩的非参数检验
概述
前后联系
1、t检验、方差分析 →假设数据来自正态分布的总体→以特定的总体分布为前提
实际应用中该假设条件难以满足
2、参数检验 → 以特定的总体分布为前提
3、非参数检验 → 一种不依赖于总体分布类型也不对参数进行推断,而是对总体分布进行比较的一类假设检验方法
非参数检验的概念
本章将应用第二章秩的概念,介绍基于秩的非参数检验
本章逻辑
原始数据不满足正态分布或等级变量
使用秩代替原始数据
基于秩的非参数检验
配对样本
两组独立样本
多组独立样本
单样本数据的符号秩和检验 (wilcoxon符号秩和检验)
对应单样本t检验
适用:当数据不服从正态分布时(可以用拟合优度检验来判断),判断样本所对应总体的均数是否等于某给定值
基本思想
1、目的:推断观测值的总体中位数于某给定数值(如标准值、目标值等)是否相等
2、基本思想
(1)H0:假设样本所对应的中位数与给定的总体的中位数相同。计算样本中所有数值与给定中位数的差值,正差值表示样本中个体大于给定中位数,负差值则为样本中个体值小于给定中位数。进而根据所有差值的绝对值,将所有正差值的秩相加就能得到正差值的秩和R+,同理R-。
(2)假设H0成立,理论上R+与R-的总体均数应该相等,等于:
是样本秩和的均数
(3)R+与R-的总体标准差也应相等,等于:
适用于不存在等秩的情况
(3)若R+与R-相差悬殊,均远离μR,则有理由拒绝H0。具体通过R+或R-的抽样分布计算P值获得推断结论
3、注意
(1)Wilcoxon符合秩和检验的假设时针对总体的中位数而不是总体均数,因为均数μ是正态分布的参数之一。而任意一个分布都可以计算总体中位数,从而避免依赖某个具体分布的某个具体参数的限值
(2)实际上,Wilconxon符号秩和检验真正比较的是两个总体分布的形态,只有当两个总体分布的密度曲线除了左右两侧稍微有点不同而其余完全相同时,才能证实H0
检验步骤
(1)建立检验假设,确定检验水准 H0:样本所对应总体的中位数等于已知总体中位数、 H1: α
双侧检验
(2)求差值、编秩、求秩和
①差值为0时,弃去不计,n随之减少
②分别计算正负差值的秩和
③编秩是按绝对值的大小编秩的
(3)计算检验统计量W:R+与R-均可以作为符号秩和检验的检验统计量
(4)确定P值,作出判断
检验统计量所对应的P值可以通过软件直接获得
样本量较小(n≤50)时使用查表法:任取R+或R-作检验统计量,查表找到对应的P值
如果样本两较大(n>50),则检验统计量近似服从正态分布
W为Wilcoxon符号秩和检验统计量,可以用R+和R-作为W
0.5为连续性校正系数,因为Z值是连续的,而W却不连续
配对样本Wilcoxon符号秩和检验
对应配对样本t检验
背景
1、在配对设计数据比较中,一般先计算每对数值的差值,如果差值服从正态分布,可采用配对t检验分析两组均数是否相同
2、如果差值不服从正态分布,则可以采用Wilcoxon符号秩和检验
基本思想
配对数据符号秩和检验的基本思想与单样本符号秩和检验是一致的。不同之处在于,配对数据中每个配对数值的差值可以看作是一个单独的样本,给定的总体中位数为0,即推断差值的单样本是否来自给定中位数为0的总体。其余部分与单样本秩和检验无差别
检验步骤
(1)建立检验假设,确定检验水准 H0:差值的总体中位数等于0 H1: α
(2)求差值、编秩、求秩和
①计算每对数据的差值,并对差值的绝对值进行编秩
②分别计算正、负差值的秩和
(3)计算检验统计量W
同上
(4)确定P值,作出判断
同上
两独立样本Wilcoxon秩和检验
对应两组独立样本的t检验和方差分析
当两组独立样本不来自正态分布的总体时,可以采用Wilcoxon秩和检验,又称Mann-Whitney检验
两组定量数据的比较
基本思想
1、将两组独立样本数据放在一起进行编秩。这相当于对原始数据进行秩转换,就像求几何均数需要对原始数据进行对数转换一样,转换的目的是秩数据代替原始数据进行分析,从而不受原始数据需满足正态分布的条件限制
2、基本思想:分别抽取样本量为n1和n2两个样本,总例数为N=n1+n2.将全部数据统一编秩,取任意样本(如样本量n1的样本)的秩和作为Wilcoxon秩和检验的统计量W,假设两个总体分布相同(H0),则W的均数和标准差分别等于:
适用于不存在等秩的现象
3、当W远离μw时,有理由拒绝H0
检验步骤
(1)建立检验假设,确定检验水准 H0:两者的总体分布相同 H1: α
(2)编秩、求秩和
①正常排序、编秩
②有一些数据的测量结果是用一些离散的尺度表达的,如疼痛的评分,用此类数据进行秩和检验,常常会出现很多的相同秩,当数据包含相同秩时,秩和检验统计量W的精确分布会改变,同时,W的标准差必须进行以下调整
相同秩过多时要用该公式校正
其中j为出现相同秩的总次数,ti为第i次相同秩的个数。
(3)计算检验统计量
(4)确定P值,作出判断
为了确定P值,需要知道在H0成立下的W的抽样分布,而此分布依赖于两个样本的例数n1和n2
当两个样本例数较大时(n1>10,或n2-n1>10),秩和检验统计量W近似正态分布,可通过对W采取标准化变换获得Z值
两组等级变量的比较
1、参数检验是以来参数进行统计推断的,如两组独立样本t检验是依赖总体均数这个参数的假设检验,通过样本数据信息构造统计量,最后结论的专业解释或含义也常常通过样本均数的大小进行阐述
2、等级变量具有半定性半定量的属性,若把此类变量用参数检验处理,就需要把变量的不同属性编码为整数1~4,通过比较两组编码值的均数来进行统计推断,但是这些编码值的均数很难解释或无法指代具体含义
3、秩和检验是适用秩来代替原始数据,通过比较总体分布的形态来进行统计推断,避免了等级变量不同级别的均值无法解释的困境
检验步骤同“两组定量数据的比较”
多组独立样本的比较
对应多组独立样本的单因素方差分析(第八章)
多组独立样本比较的秩和检验=Kruskal-Wallis检验
当各样本不来自正态分布总体时
多组定量数据的比较
基本思想
1、用所有观测值的秩代表原始观测秩进行单因素方差分析。若所有观测值的总例数为N,秩只能是1到N之间的某个整数(假设没有相同的观测值出现),不管原始观测值是什么,秩的离均差平方和会是一个固定的数值,因此无需同时采取组间变异和组内变异,Kruskal-Wallis检验的检验统计量实质是用秩计算组间变异,当组间变异的数值较大时,有理由人为组间存在差异性
相当于只考虑了方差分析的分子部分
2、分别从k个独立总体随机抽取样本n1、n2、……、nk,总例数为N。将全部数据统一编秩,计算每个样本ni的秩和Ri,计算Kruskall-Wallis H检验统计量:
仅适用于没有相同秩的情况
存在相同秩时,要校正
3、为了确定P值,需要知道在H0成立下的H分布,而此分布依赖于每个样本的例数n1,n2,…,nk。
4、假设k个总体分布相同(H0)且样本例数ni不太小时,H值近似服从v=k-1的卡方分布,可通过卡方分布计算P值。当H值较大时,有理由拒绝H0
双侧检验、单侧界值
检验步骤
(1)建立检验假设,确定检验水准 H0:三组及以上的总体分布相同 H1: α
(2)编秩、求秩和
①将所有的观测值由小到大同一编秩
②将各组秩分别相加得每组秩和Ri
(3)计算检验统计量
(4)确定P值,作出判断
多组等级变量的比较
宜用Kruskal-Wallis检验
检验步骤
(1)建立检验假设,确定检验水准 H0:三组及以上的总体分布相同 H1: α
(2)编秩、求秩和
①将所有的观测值由小到大同一编秩
②将各组秩分别相加得每组秩和Ri
(3)计算检验统计量
若出现相同秩,需要用校正检验统计量Hc
(4)确定P值,作出判断
小结
参数检验是指总体分布满足一定条件时,根据样本数据对总体分布的统计参数(如均值、方差等)进行推断
参数检验需要满足独立、正态、方差齐
非参数检验是当总体分布形式未知的情况下,根据样本数据对总体分布形式或特征进行推断。这种方法不是对参数进行检验,而是检验总体分布位置是否相同,因为称为非参数检验
非参数检验不受总体分布的限制,适用范围广,但对服从参数检验条件的资料采用非参数检验方法,会降低检验效能,因为丧失了很多参数信息
基于秩的非参数检验 (使用秩代替原始数据)
配对样本:Wilcoxon符号秩和检验
样本中位数大小推断
两组独立样本:Wilcoxon秩和检验
两样本分布形态对比
多组独立样本:K-W检验
多样本分布形态;单因素方差分析
针对不同资料的参数检验和非参数检验
不同类型数据编秩方法
符号秩和检验和配对符号秩和检验
首先计算每组数据的差值,对差值的绝对值编秩
差值为0时,舍去不计,n相应减少
差值绝对值相等时
根据每对数据的差值正负编秩(×)→我们在编秩的时候是不分正负的
若符号相同,可顺次编秩,也可求平均秩次
若符号不同,求平均秩次
所有差值根据差值的符号,在秩前写上正负号
之后对正负秩分别求和
完全随机设计的Wilcoxon秩和检验 和多组独立样本的秩和检验
多组数据混合编秩
相同数据
在一组时可以顺次编秩,也可去平均秩次
不同组时取平均秩次
对每组秩分别求和