导图社区 医学统计学
医学统计学的思维导图期末作业,包含各种检验的定义,注意事项等内容,希望能帮到大家~
编辑于2022-11-27 17:30:45 云南医学统计学
统计描述
计量资料的统计描述
适用范围
变量的观测结果是数值型的,特点是能够用数值大小衡量观察单位不同特征水平的高低,一般有计量单位
描述指标
描述集中趋势与离散程度的指标
集中趋势
算数平均数,几何平均数,中位数
离散趋势
极差,方差,四分位数间距,标准差,变异系数
描述方法
可采用统计表、统计图及统计指标来进行描述
注意事项
区分资料类型
计数资料的统计描述
描述指标
相对数
相对数是两个有关联的绝对数之比,也可以是两个有关联的统计指标之比
率
率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比,通常以百分率、千分率、万分率或十万分率等表示
构成比
构成比表示在某事物内部各组成部分在整体中所占的比重,通常以百分数表示
相对比
相对比是指A和B两个有关联指标之比,用以描述两者的对比水平,说明A是B的若干倍,通常用倍数表示
标准化率
在比较两不同人群的患病率、发病率、死亡率等资料时,为消除其内部构成(如年龄、性别、工龄、病程长短、病情轻重等)对率的影响,可以使用标准化率
适用范围
死亡统计指标
死亡率
又称粗死亡率,表示某年某地每千人口中的死亡人数,反映当地居民总的死亡
年龄别死亡率
年龄别死亡率表示某年某地在各个年龄组中每千人口中的死亡数,它消除了人口年龄构成不同对死亡水平的影响
死因别死亡率
死因别死亡率表示某年某地每十万人中因某种原因死亡的人数,它反映各类病伤死亡对居民生命的危害程度,是死因分析的重要指标
死因构成
死因构成也称相对死亡,指全部死亡人数中,死于某死因者的人数占总死亡数的百分比,反映各种死因的相对重要性
疾病统计指标
发病率
发病率表示在一定期间内,一定人群中某病新发生的病例出现的频率,是反映疾病对人群健康影响和描述疾病分布状态的一项测量指标
患病率
患病率也称现患率,表示某一时点某人群中患某病的频率,通常用来表示病程较长的慢性病的发生或流行情况
病死率
病死率表示某期间,某病患者中因该病死亡的频率,表明该疾病的严重程度和医疗水平等,多用于急性传染病
治愈率
治愈率表示接受治疗的病人中治愈的频率
注意事项
不要把构成比与率相混
构成比只能说明某事物内部各组成部分的比重和分布,不能说明该事物部分发生的强度与频率
使用相对数时分母不宜过小
分母过小时相对数不稳
正确计算合计率
对观察单位数不等的几个率,其合计率的计算不能将各个率相加求平均值,而应该用各率的分子之和除以分母之和来计算
注意资料的可比性
在比较相对数时用以比较的资料应该是同质
样本率或构成比存在抽样误差
对样本率或构成比进行比较时,由于存在抽样误差,不能单凭数字表面相差大小下结论,而应对各组的样本率或构成比的差别作假设检验
统计推断
参数估计
点估计
总体均数估计
区间估计
t分布
正态近似法
假设检验
t检验
应用条件
资料类型—计量资料
比较指标—均数
小样本
正态性
方差齐
单样本t检验(样本均数t检验)
适用于来自正态分布的某个样本均数与已知总体均数的比较
比较目的——检验样本均数所代表的总体均数是否与已知总体均数有差别
配对样本均数t检验(非独 立两样本均数t检验)
适用于配对设计计量资料均数的比较,理论上假设配对差值服从正态分布
比较目的——检验两组相关样本均数所代表的未知总体均数是否有差别
配对设计
定义——将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理
两种情况
同源配对
同一受试对象或同一标本的两个部分,受两种处理
异源配对
为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理
两独立样本均数比较的t检 验(成组t检验)
适用于完全随机设计下两样本均数的比较
完全随机设计——将受试对象随机地分配到两组中,每组对象分别接受不同的处理,分析比较两组的处理效应
比较目的——检验两样本所来自总体的均数是否相等
应用条件
两样本所在总体服从正态分布
两总体方差相等(方差齐性)
方差分析
基本思想
将全部观测值的总变异按影响因素分解,计算假设检验F值,实现对总体均数是否有差异的统计推断
完全随机设计的方差分析
建立检验假设,确定检验水准
H0: μ 1= μ 2= μ 3
H1 : μ 1 μ 2 μ 3 不全相等
α =0.05
计算检验统计量
SS总=SS组内+SS组间 V总=V组内+V组间
MS=SS/V F=MS组间/MS组内
V组内=N-K V组间=k-1
确定P值,做出统计分析
随机区组设计的方差分析
建立检验假设,确定检验水准
H0: μ 1= μ 2= μ 3
H1 : μ 1 μ 2 μ 3 不全相等
α =0.05
计算检验统计量
SS总=SS处理+SS区组+SS误差; V总=V处理+V区 组+V误差
MS处理=SS处理/N处理; F处理=MS处理/MS误差
V总=n处理*n区组-1; V误差=V总-V处理-V区组
确定P值,做出统计分析
对于处理因素
对于区组因素
多个样本均数的两两比较
Dunnett-t检验实验前确定的多个试验组与一个对照组均数差别的比较
Tukey法任意两两组间均数均进行比较,要求各比较组样本含量相同
SNK-q检验实验后对任意两两组间均数均进行比较,各比较组样本含量可不相等
LSD-t检验多个组中,根据专业,仅对某一对或某几对在专业上有特殊探索价值的均数间进行的近似比较。理论上只适合两组比较
Scheffe法既可以进行因素水平的平均效应的比较,还可比较因素水平平均效应的线性组合,多用于对比组样本含量不等的资料
Sidak t检验两两比较时检验水准调整为x'(x'=1-V1- a,a为方差分析原检验水准,m为两两比较次数), 以使多次比较犯I类错误的概率控制在a以内
Bonferroni t检验将两两比较时检验水准调整为a'( a' =a/m),以使多次比较犯I类错误的概率控制在a 以内,是Sidak t检验的近似
χ2检验
定义
比较两个及两个以上样本率( 构成比)以及两个 分类变量的关联性分析。其根本思想就是在于比 较理论频数和实际频数的吻合程度或拟合优度问 题
用途
推断两个或两个以上总体率(或构成比)之间有 无差别
两变量间有无相关关系
检验频数分布的拟合优度
步骤
1、建立假设检验,确定检验水准
2、计算检验统计量
确定p值,作出推断结论
如果p值很小,说明观察值与理论值偏离程度太 大,应当拒绝无效假设,表示比较资料之间有显 著差异;否则就不能拒绝无效假设,尚不能认为 样本所代表的实际情况和理论假设有差别
分类
四格表资料的χ2检验
应用:用于进行两个率或两个构成比的比较
专用公式:n≥40且T≥5时使用
校正公式:n≥40且1≤T<5时使用
Fisher概率确切法:n<40或T<1时使用
配对四格表资料的χ2检验
应用:分析两个相关率的变化是否有统计学意义
注意:配对设计的四格表资料只能用配对χ2检验,而不能随意转化为两组独立样本的χ2检验
R×C列联表资料的x2检验
应用:用于检验R×C列联表的相关分析
注意事项
不允许有T<1, 或者1≤T<5的格子数不能超过总格 子数的1/5
若不满足上述条件,解决方法
增加样本含量以增大理论频数
删去理论频数太小的格子所在的行或列
改用R×C表的Fisher确切概率法
多个样表率比较,当拒绝H0,接受H1时,只说明 各总体率之间总的来说有差别,但并不能说明任 意两个总体率之间均有差别,若要看哪两组有差 异,需两两比较
R×C的x2检验与分类结果的排序无关
秩和检验
适用范围
(注:秩和检验属于非参数检验,非参数检验不受总体分布限制,适用范围广但第Ⅱ类错误概率大,故应首选参数检验,不符合条件时再选非参数检验)
未精确测量(包括等级资料)
偏态且无法转为正态
分布不清楚
步骤
建立检验假设,确定检验水准→求差值d→编秩→求秩和→确定统计量T、H或M值→确定P值,作出统计推断(查表法或正态近似法) (注意与参数检验的t区分)
分类
配对资料的秩和检验(Wilcoxon配对法)
适用于不满足t检验的配对计量资料、等级资料,其他不能精确测量的资料
目的:推断配对资料的差值是否来自中位数为0的总体
单样本资料的秩和检验
适用于不满足t检验的单样本计量资料,等级资料,不能精确测量的单样本资料
目的:推断与已知总体中位数的差值是否来自中位数为0的总体
完全随机两样本资料的秩和检验
适用于完全随机两样本比较,偏态或方差不齐的计量资料比较,单向有序资料或无法精确测量的资料
目的:推断两样本分别代表的总体发布是否不同
完全随机多样本资料的秩和检验(Kruskal-Wallis秩和检验又称K-W检验,H检验)
适用于方差不齐或不服从正态分布的多组资料的比较,多组有序分类资料或无法精确测量资料的比较
目的:推断多组样本分别代表的总体分布是否不同
随机区组资料资料的秩和检验(Friedman的M检验)
适用于随机区组设计的资料但不满足方差分析的条件,随机区组设计的等级资料
目的:推断个各处理组样本分别代表的总体分布是否不同
多样本间两两比较
当完全随机多样本的H检验和随机区组的M检验结论为拒绝H0时,不能判断各处理组间的差异有无统计学意义,应进行两两比较