导图社区 SPSS
IV.成组两样本秩和检验(Wilcoxon Mann-Whitney秩和检验:1.建立检验假设,确定检验水准(同右);2.计算秩和和T值和检验统计量z值。
编辑于2023-01-09 20:11:26 广东统计分析策略
I. 前言
医学研究设计
实验性研究(干扰研究)
随机对照研究
完全随机对照研究 randomized controlled study (RTC)
最可靠!
施加干预、设施对照、随机化
随机分组
完全随机分组:抽签、随机数字表、电脑随机分配法
配对随机化分组:病情轻重相似、年龄、性别、生活条件等
自身配对(同一个人受两种处理)、异体配对(两个条件相似的个体分别受对照处理)
复杂随机对照
随机区组设计、群随机对照、实效性随机对照
非随机对照研究
无对照
观察性研究
不干预、设置对照、不需要随机化
观察对象
暴露因素Exposure(研究对象本身具有的属性、行为、处于的环境
因果关系
研究类型
横截面研究(Cross-sectional Study)/现况调查
time—now
病例对照研究(Case-Control Study)
now----past
队列研究(Cohort Study)/前瞻性研究/随访研究
now----future
文献研究(文献综述(定性)、文献计量分析(描述)、荟萃分析(Meta分析))
偏倚及其控制
误差
随机误差(不可控 )
系统误差(偏倚)可消除
选择偏倚
选择人群不代表总人群:就诊机会偏倚、失访率
信息偏倚
研究对象(说谎、无应答、回忆偏倚)、研究者本身(主观、测量偏倚)
混杂偏倚
分组不均衡导致(有存在潜在的暴露因素干扰)
可用统计学方法部分解决
II. 定量数据正态性判断
数据分布决定统计方法
正态分布数据:参数检验——t检验和F检验(方差分析)、均数、标准差描述
正态性检验
K-S法:Kolmogorov-Smirnov Test
S-W法:Shapiro-Wilk Test ——适合样本量2000以下
如何判断数据是否正态分布
单样本正态检验
多样本正态检验
“显著性”=P值(P>0.05 则数据正态分布;P<0.05 则数据偏态分布)
操作过程
直方图
QQ图
偏态分布数据:将数据转换成状态数据或采用非参数检验方法(秩和检验)、中位数、四分位数间距描述
III. 成组两样本t检验
要求:两组、独立、定量、正态、方差齐性相同的比较
独立性:各观察值之间相互独立,互不影响
正态性:各个样本均来自正态总体
方差齐性:各个样本的总体方差相等
假设过程
1. 建立假设,确定检验水准(H0:μ1=μ2,即两组的总体均数相同;H1:μ1≠μ2.即两组的总体均数不同 α=0.05)这里:即P值<α时,即为小概率事件=该事件发生率为5%
2. 技术检验统计量t值
3. 确定P值。做出推断结论
若P<α,拒绝H0,接受H1,差异有统计学意义“有差别”
分析计算结果
“显著性”即P值, 若本行P>0.05,则方差齐性,采用t检验方法,结果为表格第一行(Sig(双尾)即该样本的p值; 若本行p<0.05,采用t'检验方法,结果为表格第二行
规范报告:组1因变量(均数+-标准差)单位,组2因变量(均数+-标准差),两组总体因变量总体均数存在统计差异(t= ,P= )。
统计描述表格
1. 效应
随机对照研究的效应是干预措施的相对效果(实验组相对对照组的作用大小)
治疗后的观察指标并非效果指标
效应值是 :均差、率差、中位数差、OR、RR、HR、Cohen'd值、偏η^2值
2. 两组均数比较P值的理解:两组均数相等的概率。
正态性检验的P值:正态性成立的概率(P>0.05,为正态) 两样本的t检验p值:两组均数相等的概率(p<0.05,为不等)
3. 置信区间:总体效果(差值)最有可能存在的范围 。
作用:可靠性(越窄越可靠)、差别有多大
IV. 成组两样本秩和检验(Wilcoxon Mann-Whitney秩和检验
偏态数据“生存时间”
要求:两组、独立、严重偏态分布数据 秩次(rank):按顺序排列 秩和(rank sum)秩次之和
运用于:两组非正态定量数据比较 两组一端或二端存在不确定数值的数据(>X)比较 有序分类数据(等级数据)比较
检验步骤
1. 建立检验假设,确定检验水准(同右)
2. 计算秩和和T值和检验统计量z值
1).编秩:混合两组数据排序。 2)求秩和,确定统计量T:分别求两组秩次之和,若两组例数相等,任取一组的秩和为统计量;若两组例数不同,则以样本量较少组的秩和为统计量T。 3)计算秩和T值和检验统计量z值。 4)确定p值,做出推断结论。
1.
2.
3. 看报告
“渐进显著性”=P值(若P<α,即有统计学意义);"Z“有负号描述时去掉就OK
非参数检验求25-75%CI(Hodges-Lehmann 法)
V. 配对t检验
只有“配对随机化/平行配对设计(同一时间)”的配对设计才可以说明干预措施有效,只能说明有差异。
要求:两组数据互相有关联
差值符合正态性的条件:再同右求正态性
(若不符合,用配对秩和检验):
过程
”相关性“越接近1,相关相关性越强;越接近0,相关性越弱 Sig.(双尾)即该检验的p 值(若P<α,即具有统计学意义)
样本量较大时,P值(常P<0.05)不能反映数据的正态性;因此数据分为: 正态分布(P>0.05)、 近似正态分布(P<0.05 但变量总体符合正态分布,直方图显示近似正态可等同于正态分布进行统计分析)、 严重偏态分布数据(P<0.05 切实际数据分布严重偏态)