导图社区统计

统计

医学统计中的数据类型一般分为两类：计量资料即定量数据，另一个为定型资料，此篇导图不仅适用于医学统计学当中而且也适用于理综范围

编辑于2022-07-02 00:01:54

数据类型

赵星

他的近期作品查看更多>>

统计

社区模板帮助中心，点此进入>>

赵星

他的近期作品查看更多>>

相似推荐
大纲

小儿常见病的辩证与护理
- 12.9k
- 6
- 72
- 6
- 0
中医名家
蛋白质
- 10.0k
- 410
- 150
- 33
- 0
little V
均衡饮食一周计划
- 4.2k
- 24
- 89
- 11
- 0
一岁一枯荣🍂
消化系统常见病
- 13.0k
- 8
- 174
- 27
- 0
18660137725
耳鼻喉解剖与生理
- 4.6k
- 111
- 95
- 18
- 0
经维
糖尿病知识总结
- 8.3k
- 447
- 429
- 75
- 0
北北让特哦耶好好学习
细胞的基本功能
- 7.2k
- 263
- 257
- 75
- 0
ice breakers
体格检查：一般检查
- 7.0k
- 194
- 117
- 12
- 0
孑孑
心裕济川传承谱
- 3.0k
- 1
- 3
- 1
- 0
~空白~
解热镇痛抗炎药
- 4.9k
- 12
- 134
- 12
- 0
芝芝

数据类型

计量资料（定量数据）

统计描述

频数分布

频率分布直方图

频率分布表

集中趋势

算术均数X

常用方法

直接法

加权法

应用

主要适用于对称分布或偏度不大的资料，尤其适合正态分布资料

几何均数G

应用

观察值间按倍数关系变化的资料，或者呈偏态分别的资料经过对数变换后呈对称分布

举例

抗体滴度，细菌计数，血清凝集效价，某些物质浓度

中位数M和百分位数Px

中位数

当观察例数n为奇数时，中位数是按顺序排列在第（n+1）/2项的观察值

当观察例数为偶数时，则中位数是按顺序排列在第n/2项和第（n/2）+1项两个观察值的平均值

百分位数

百分位数Px指在一组数据中找到这样一个值，使得x%的数值小于或等于这个值，其余（100-x）%的数据项大于或等于这个值。P50实际就是中位数M。

应用

中位数与均数、几何均数的作用相同，都能用来反映一组数据的集中趋势或平均水平。在频数分布呈明显的偏态或频数分布的两端无确定数值时，使用中位数描述集中趋势或平均水平较为合理。

百分位数可以用来描述资料的观察值序列在某百分位置的水平，中位数是其中的一个特例。百分位数可用于任何频数分布的资料，尤其是明显呈偏态分布的资料

变异程度

按间距计算

极差（全距）R

极差越大说明变异程度越大，反之说明变异程度小

缺点:没有利用全部观察值，随着观察例数的增多，极差可能会随之而变大

四分位数间距Q

把所有观察值排序后，分成四个相等的段落，去掉两端的25%，取中间50%观测值的数据范围即为四分位数间距

主要用于描述明显偏态分布资料的变异特征，并常常结合统计图应用

按平均差距计算

方差S²

n-1为自由度，表示在所有的n个离均差平方项中，由于样本均数的限制，只有n-1个离均差平方和是独立的

样本方差越大说明数据的变异越大

标准差S

在统计分析中通常将方差取算术平方根，还原成与原始观察值单位相同的变异量度

变异系数CV

对均数相差较大或单位不同的几组观察值的变异程度进行比较

统计图表

直方图

直条图面积为各组频率，各组距的高度为频率或频数，宽度为组距

主要用于表示连续变量频数分布情况

线图

通过线段的上升或下降来表示指标（变量）的连续变化过程

适用于描述一个变量随另一个变量变化的趋势和波动情况

绘制线图时横轴和纵轴的刻度都可以不从0开始

箱式图

用于比较两组或多组数据的平均水平和变异程度，主要适用于描述偏态分布的资料

❶中间的横线表示中位数；❷箱体长度表示四分位数间距，两端为P75和P25 ❸两端连线为最大值和最小值（或去除异常值后的，并对异常值进行标记）

误差条图

用于比较多组资料的均值和标准差（或标准误、可信区间）

线条的高度表示均值大小，可以用“工”表示可信区间，上下端“—”表示可信区间的上下限，中间的竖线长度表示可信区间的长度

散点图

用点的密集程度和变化趋势表示两指标之间的直线或曲线关系

横轴和纵轴各代表一个变量，起点不一定从0开始

热图

通过不同颜色或深浅变化表示不同区域、数值大小的图

森林图

统计推断

t检验

单样本设计

使用条件

独立性，正态性

思维

μ=？μ0

不满足条件可采用的方法

秩和检验

配对设计

使用条件

独立性，正态性

思维

μd=？0

不满足条件可采用的方法

秩和检验

分类

同源配对，异源配对

成组设计

使用条件

独立性，正态性，方差齐性

思维

μ1=？μ2

不满足条件可采用的方法

t'检验，秩和检验，变量变换

分析思路

步骤

建立假设检验，确定检验水准

计算检验统计量

根据P值，作出推断结论

注意事项

假设检验结论正确的前提

检验方法的选用及其使用条件

双侧检验与单侧检验的选择

假设检验的结论不能绝对化

正确理解P值的统计意义

μ检验

秩和检验

Wilcoxon符号秩和检验

用于推断配对资料的差值是否来自中位数为零的总体

基本思想

假定两种处理效应相同，则差值的总体分布对称，总体中位数为0，即样本的正负秩和绝对数值相近

步骤

建立检验假设，确定检验水准

编秩次并求秩和统计量

确定p值，做出推断

若检验统计量T值在上下界值范围内，则p值大于表上方对应的概率值

Wilcoxon秩和检验

Kruskal-Wallis秩和检验（又叫K-W检验或H检验）

方差分析（F检验）

使用条件

独立性，正态性，方差齐性

适用于多于两组样本均数的比较

定性资料

计数资料（定性数据）

统计描述

相对数及其标准化

统计图表

直条图

分类

单式条图

复式条图

注意事项

横轴表示各分组，纵轴表示各分组对应的值

纵轴尺度必须从0开始，而且要等距

直条图的宽度必须相等，间隔等距

构成图

圆图

以圆形的360度为100%，将各构成比部分的构成比（%）乘以3.6°，即得各组成部分应占的圆心角度数

百分条图有矩形直条的长度表示100%，而用其中分割的各段表示各构成部分的百分比

统计推断

μ检验

χ²检验

完全随机设计四格表资料的χ²检验

一般形式

图形特征

当自由度ν确定后，χ²分布曲线下右侧尾部的面积为α时，横轴上相应的χ²值记作χ²α，ν，即χ²分布的上分位数

在自由度ν确定后，χ²值越大，P值越小

若检验水准为α，当χ²＞χ²α，ν时，则P＜α，拒绝H0，接受H1

基本公式

当总例数n≥40且所有格子的T≥5时，可用χ²检验的通用公式

专用公式

只适用于完全随机设计四格表资料

校正公式

当n≥40且1≤T＜5时

Fisher确切概率法

当n＜40或T＜1时

配对设计四格表资料的χ²检验

常用于

两种检测方法，两种诊断方法或两种细菌培养方法

特点

对样本中各观察单位分别用两种方法检测或处理，然后按两分类变量计数结果

当两种处理方法无差别时，对总体有B=C,即两总体率相等π1=π2。由于样本抽样误差不可避免，样本中b和c往往不等

R×C列联表资料的χ²检验

用于多个样本率或多个构成比的比较

图形特征

ν趋于无穷时，χ²分布趋于正态分布

注意事项

R×C列联表中各格子的理论频率不应小于1，并且1≤T＜5的格子数不宜超过格子总数的1/5

多个样本率比较，当统计推断结果拒绝H0，接受H1时，只说明各总体率之间总的来说有差别，但并不能说明任意两个总体率之间均有差别

R×C列联表资料的χ²检验与分类结果的排序无关

对于按照两种标志（变量）交叉分组的数据，同样可以使用χ²检验方法检验两者是否存在一定的关联

秩和检验

等级资料（有序数据/ 半定量数据）

统计描述

构成比

统计推断

非参数秩和检验

适用于

总体分布类型未知或非正态分布数据

有序或半定量资料

数据两端无确定的数值

Wilcoxon秩和检验

使用条件

完全随机设计两组计量资料比较（偏态或方差不齐）

完全随机设计两组等级资料比较

查表法

混合编秩次，分别求秩和

步骤

建立检验假设，确定检验水准

确定秩和检验统计量T

确定P值，做出推断结论

正态近似法

n1＞10，n2-n1＞10超出T界值表的范围，可按正态近似检验

Kruskal-Wallis秩和检验（又叫K-W检验或H检验）

使用条件

多个独立样本计量资料（偏态或方差不齐）

多组有序资料

确定P值

当组数k=3且每组例数ni≤5时，可查H界值表得到p值

当k＞3或k=3且最小样本例数n1＞5时，H近似地服从自由度为ν=k-1的χ²分布，可查χ²界值表得到p值

注意事项

如果满足参数检验的条件却使用非参数检验方法会降低检验效能

对于两组或多组独立样本，如果各组总体方差不同，同样不适合做非参数检验