导图社区 统计
医学统计中的数据类型一般分为两类:计量资料即定量数据,另一个为定型资料,此篇导图不仅适用于医学统计学当中而且也适用于理综范围
编辑于2022-07-02 00:01:54数据类型
计量资料 (定量数据)
统计描述
频数分布
频率分布直方图
频率分布表
集中趋势
算术均数X
常用方法
直接法
加权法
应用
主要适用于对称分布或偏度不大的资料,尤其适合正态分布资料
几何均数G
应用
观察值间按倍数关系变化的资料,或者呈偏态分别的资料经过对数变换后呈对称分布
举例
抗体滴度,细菌计数,血清凝集效价,某些物质浓度
中位数M和百分位数Px
中位数
当观察例数n为奇数时,中位数是按顺序排列在第(n+1)/2项的观察值
当观察例数为偶数时,则中位数是按顺序排列在第n/2项和第(n/2)+1项两个观察值的平均值
百分位数
百分位数Px指在一组数据中找到这样一个值,使得x%的数值小于或等于这个值, 其余(100-x)%的数据项大于或等于这个值。P50实际就是中位数M。
应用
中位数与均数、几何均数的作用相同,都能用来反映一组数据的集中趋势或平均水平。 在频数分布呈明显的偏态或频数分布的两端无确定数值时,使用中位数描述集中趋势或平均水平较为合理。
百分位数可以用来描述资料的观察值序列在某百分位置的水平,中位数是其中的一个特例。 百分位数可用于任何频数分布的资料,尤其是明显呈偏态分布的资料
变异程度
按间距计算
极差(全距)R
极差越大说明变异程度越大,反之说明变异程度小
缺点:没有利用全部观察值,随着观察例数的增多,极差可能会随之而变大
四分位数间距Q
把所有观察值排序后,分成四个相等的段落,去掉两端的25%,取中间50%观测值的数据范围即为四分位数间距
主要用于描述明显偏态分布资料的变异特征,并常常结合统计图应用
按平均差距计算
方差S²
n-1为自由度,表示在所有的n个离均差平方项中,由于样本均数的限制,只有n-1个离均差平方和是独立的
样本方差越大说明数据的变异越大
标准差S
在统计分析中通常将方差取算术平方根,还原成与原始观察值单位相同的变异量度
变异系数CV
对均数相差较大或单位不同的几组观察值的变异程度进行比较
统计图表
直方图
直条图面积为各组频率,各组距的高度为频率或频数,宽度为组距
主要用于表示连续变量频数分布情况
线图
通过线段的上升或下降来表示指标(变量)的连续变化过程
适用于描述一个变量随另一个变量变化的趋势和波动情况
绘制线图时横轴和纵轴的刻度都可以不从0开始
箱式图
用于比较两组或多组数据的平均水平和变异程度,主要适用于描述偏态分布的资料
❶中间的横线表示中位数;❷箱体长度表示四分位数间距,两端为P75和P25 ❸两端连线为最大值和最小值(或去除异常值后的,并对异常值进行标记)
误差条图
用于比较多组资料的均值和标准差(或标准误、可信区间)
线条的高度表示均值大小,可以用“工”表示可信区间,上下端“—”表示可信区间的上下限, 中间的竖线长度表示可信区间的长度
散点图
用点的密集程度和变化趋势表示两指标之间的直线或曲线关系
横轴和纵轴各代表一个变量,起点不一定从0开始
热图
通过不同颜色或深浅变化表示不同区域、数值大小的图
森林图
统计推断
t检验
单样本设计
使用条件
独立性,正态性
思维
μ=?μ0
不满足条件可采用的方法
秩和检验
配对设计
使用条件
独立性,正态性
思维
μd=?0
不满足条件可采用的方法
秩和检验
分类
同源配对,异源配对
成组设计
使用条件
独立性,正态性,方差齐性
思维
μ1=?μ2
不满足条件可采用的方法
t'检验,秩和检验,变量变换
分析思路
步骤
建立假设检验,确定检验水准
计算检验统计量
根据P值,作出推断结论
注意事项
假设检验结论正确的前提
检验方法的选用及其使用条件
双侧检验与单侧检验的选择
假设检验的结论不能绝对化
正确理解P值的统计意义
μ检验
秩和检验
Wilcoxon符号秩和检验
用于推断配对资料的差值是否来自中位数为零的总体
基本思想
假定两种处理效应相同,则差值的总体分布对称,总体中位数为0,即样本的正负秩和绝对数值相近
步骤
建立检验假设,确定检验水准
编秩次并求秩和统计量
确定p值,做出推断
若检验统计量T值在上下界值范围内,则p值大于表上方对应的概率值
Wilcoxon秩和检验
Kruskal-Wallis秩和检验 (又叫K-W检验或H检验)
方差分析(F检验)
使用条件
独立性,正态性,方差齐性
适用于多于两组样本均数的比较
定性资料
计数资料 (定性数据)
统计描述
相对数及其标准化
统计图表
直条图
分类
单式条图
复式条图
注意事项
横轴表示各分组,纵轴表示各分组对应的值
纵轴尺度必须从0开始,而且要等距
直条图的宽度必须相等,间隔等距
构成图
圆图
以圆形的360度为100%,将各构成比部分的构成比(%)乘以3.6°,即得各组成部分应占的圆心角度数
百分条图有矩形直条的长度表示100%,而用其中分割的各段表示各构成部分的百分比
统计推断
μ检验
χ²检验
完全随机设计四格表资料的χ²检验
一般形式
图形特征
当自由度ν确定后,χ²分布曲线下右侧尾部的面积为α时,横轴上相应的χ²值记作χ²α,ν,即χ²分布的上分位数
在自由度ν确定后,χ²值越大,P值越小
若检验水准为α,当χ²>χ²α,ν时,则P<α,拒绝H0,接受H1
基本公式
当总例数n≥40且所有格子的T≥5时,可用χ²检验的通用公式
专用公式
只适用于完全随机设计四格表资料
校正公式
当n≥40且1≤T<5时
Fisher确切概率法
当n<40或T<1时
配对设计四格表资料的χ²检验
常用于
两种检测方法,两种诊断方法或两种细菌培养方法
特点
对样本中各观察单位分别用两种方法检测或处理,然后按两分类变量计数结果
当两种处理方法无差别时,对总体有B=C,即两总体率相等π1=π2。 由于样本抽样误差不可避免,样本中b和c往往不等
R×C列联表资料的χ²检验
用于多个样本率或多个构成比的比较
图形特征
ν趋于无穷时,χ²分布趋于正态分布
注意事项
R×C列联表中各格子的理论频率不应小于1,并且1≤T<5的格子数不宜超过格子总数的1/5
多个样本率比较,当统计推断结果拒绝H0,接受H1时,只说明各总体率之间总的来说有差别,但并不能说明任意两个总体率之间均有差别
R×C列联表资料的χ²检验与分类结果的排序无关
对于按照两种标志(变量)交叉分组的数据,同样可以使用χ²检验方法检验两者是否存在一定的关联
秩和检验
等级资料 (有序数据/ 半定量数据)
统计描述
构成比
统计推断
非参数秩和检验
适用于
总体分布类型未知或非正态分布数据
有序或半定量资料
数据两端无确定的数值
Wilcoxon秩和检验
使用条件
完全随机设计两组计量资料比较(偏态或方差不齐)
完全随机设计两组等级资料比较
查表法
混合编秩次,分别求秩和
步骤
建立检验假设,确定检验水准
确定秩和检验统计量T
确定P值,做出推断结论
正态近似法
n1>10,n2-n1>10超出T界值表的范围,可按正态近似检验
Kruskal-Wallis秩和检验 (又叫K-W检验或H检验)
使用条件
多个独立样本计量资料(偏态或方差不齐)
多组有序资料
确定P值
当组数k=3且每组例数ni≤5时,可查H界值表得到p值
当k>3或k=3且最小样本例数n1>5时,H近似地服从自由度为ν=k-1的χ²分布,可查χ²界值表得到p值
注意事项
如果满足参数检验的条件却使用非参数检验方法会降低检验效能
对于两组或多组独立样本,如果各组总体方差不同,同样不适合做非参数检验