导图社区 医学统计学
医学统计学大纲,包括它的基本概念、基本运算法则、统计描述、参数估计与假设检验、卡方检验、秩和检验等等。
编辑于2022-11-27 23:54:48 河南医学统计学
绪论
医学统计学
概念
基本内容
统计设计
数据整理与核查
统计描述
统计推断
基本概念
同质与变异
变量与数据类型
定量数据
定性数据
有序数据
总体与样本
误差
系统误差
随机误差
抽样误差
概率与概率分布
小概率事件
基本运算法则
乘法法则
加法法则
条件概率
统计描述
频数分布表和频数分布图
频数表作用:简化数据,方便阅读,显示数据的分布规律
绘制频数表:计算极差——定组距——写组段——列表整理资料
直方图
描述性统计指标
定量变量的统计描述
描述集中趋势的统计指标
算术均数(呈正态或近似正态分布)
直接法
加权法
几何均数(对数正态分布)
直接法
加权法
中位数(偏态分布)
中位数:不受极端值影响,适用于偏态分布或两端无确定数值时
百分位数:任何频数分布,尤其是明显偏态分布的资料
描述离散趋势的统计指标
极差/全距
四分位数间距
明显偏态分布
方差
标准差
还原与原始数据相同的计量单位
变异系数
相差较大或单位不同
正态分布及其应用
概念:正态分布是描述连续变量最重要的分布,也是自然界最常见的分布之一。若随机变量X服从一个数学期望值为μ,方差为σ²的正态分布,记作N(μ,σ²)
频率密度曲线:中间高,两边低,左右对称,横轴上的曲线下面积恒为1。
应用
概率计算
确定医学参考值范围
概念:医学参考值范围是指特定的“正常”人群(排除了对所研究指标有影响的疾病和有关因素的特定人群)的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在的范围。通常习惯用该人群95%的个体某项医学指标的取值范围作为该指标的医学参考值范围。
步骤:首先要确定一批样本含量足够大的“正常人”进行样本相关指标测量,整理数据,进行资料分布类型的诊断以不同的方法计算参考值范围:百分位数法、正态分布法
质量控制图
判断异常的8种情况
有1个点距中心线的距离超过3个标准差
在中心线的一侧连续有9个点
连续6个点稳定地增加或减少
连续14个点交替上下
连续3个点中有2个点在警戒线外
连续5个点中有4个点距中心线距离超过1个标准差
中心线一侧或两侧连续15个点距中心线距离都在1个标准差以内
中心线一侧或两侧连续8个点距中心线距离都超出1个标准差范围
定性变量的统计描述
常用相对数指标
频率型指标
频率型指标是相对数最常见的一种,它表示某事件发生的频率,常见的如:死亡的频率,阳性的频率以及患病的频率
频率=(发生某现象的观察单位数/可能发生某现象的观察单位总数)´K
强度性指标
强度性指标是描述单位时间内某事件发生的频率
强度={发生某事件的观察单位数/S(可能发生某事件的单位数´观察时长)}´K
相对性指标
想对比型指标是指两个有关联的指标A与B之比,在实际应用中简称比
相对比=(A/B)´100%
A>B,用倍数表示;A<B,用百分数表示
条件
A和B是绝对数,也可以是相对数、平均数
A和B可以是同性质的指标,也可以是不同性质的指标
A和B之间应满足互不包含
相对数应用注意事项
理解相对数的含义不可望文生义
计算相对数时分母应有足够数量
正确计算合计频率
注意资料的可比性
样本相对数的统计推断
粗率的标准化法
标准化的意义和基本思想
标准化率的计算:直接标准化法、间接标准化法
统计表与统计图
统计表
结构:表序、标题、横标目名称、横标目、纵标目、表注
种类:简单表、复合表
统计图
结构:标题、标目、刻度、图域、图例
直方图:主要用于描述连续性定量变量的频数分布
直条图:常用于描述离散型定量变量和定性变量的频数分布
箱式图:可综合描述定量变量的平均水平和变异程度,还可显示数据中的离群值或极端值
百分条图:可用于表示事物内部各部分的比重或所占比例
圆图:可用于表示事物内部各部分的比重或所占比例
线图:适用于连续型变量和分类变量
散点图:反映两变量间的相关关系,主要用于相关回归分析
参数估计与假设检验
参数估计
抽样分布和抽样误差
样本均数的标准差通常称为均数的标准误,可用于反映均数抽样误差的大小
抽样误差:由于个体存在差异,因此通过随机抽样得到的样本在推论总体是会存在一定的误差
t分布
t分布:对样本均数的正态分布进行标准化
总体均数及总体概率的估计
参数估计:用样本统计量估计总体参数,包括点估计和区间估计(考虑了抽样误差,将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为总体参数的置信区间。置信区间的估计方法分为t分布法和正态近似法)
总体概率的估计:点估计和区间估计(查表法和正态近似法)
假设检验
步骤:建立检验假设,确定检验水准计算检验统计量确定P值,作出推断(P≤α,按照检验水准α,拒绝Hο,接受H₁,差异有统计学意义,可以认为总体间有差别;P>α,按照检验水准,不拒绝Hο,差异无统计学意义,尚不能认为总体间有差别)
假设检验与区间估计的关系
假设检验与置信区间的联系:对于同一份数据,二者的结果是一致的。即置信区间也具备假设检验的主要功能。
假设检验与置信区间的区别:置信区间可以提供假设检验所没有提供的信息,假设检验也会提供置信区间所未提供的信息
两类错误和检验功效
Ⅰ类错误——弃真;Ⅱ类错误——存伪
检验功效:即拒绝原本不成立的Hο的概率称为检验功效,也称之为把握度或检验效能。影响因素:总体参数、个体差异、样本含量、检验水准
应用假设检验注意事项:①必须符合其使用条件②单侧检验与双侧检验选择③灵活确定检验水准α④正确理解统计推断的意义⑤正确理解P值的意义
t检验
正态性检验和方差齐性检验
图示法(P-P图,Q-Q图,茎叶图)
非参数检验方法:①建立检验假设,确定检验水准②选择适宜检验方法,计算检验统计量③根据P值,作出推论
方差齐性检验:F检验,Bartlett检验,Levene检验,残差图
单样本资料的t检验
两独立样本资料的t检验
配对设计资料的t检验
注意事项:不能把配对设计资料错当成两组完全随机设计资料进行统计分析,即将成对数据分开;同单样本t检验一样,需要先对差值数据进行正态性检验
方差分析
完全随机设计资料的方差分析
①建立检验假设,确定检验水准②计算检验统计量③确定P值,作出推断
随机区组设计资料的方差分析
①建立检验假设,确定检验水准②计算检验统计量(计算离均差平方和,计算自由度,计算均方,计算F值)③确定P值,作出推断
多个样本均数的两两比较
SNK-q检验
Dunnett-t检验
Bonferroni法
LSD-t检验
卡方检验
独立样本四格表资料的X²检验
R×C列联表资料的X²检验
适用条件:PearsonX²法、R×C列联表的Fisher确切概率法
注意事项
配对设计资料的X²检验
配对2×2列联表资料的X²检验
配对R×R列联表资料的X²检验
秩和检验
秩和检验
概念:将资料数据从小到大依次排队并统一编秩,分组求出秩和,然后用秩和作为统计量进行假设检验的方法。
参数检验:依赖于特定分布类型,比较的是参数
非参数检验:不受总体参数的影响,比较的是分布或分布位置,适用范围广,可用于任何类型资料
配对设计资料的符号秩和检验
配对设计定量变量的正态性检验
常见错误:①样本量较小时,不论配对差值是否满足正态分布而直接用配对设计的t检验②零假设和备择假设的建立③“当样本量较大时,可用正态近似法对秩和进行Z检验”,往往错误地认为此时的检验方法为参数检验方法
单样本资料的符号秩和检验
两独立样本比较的秩和检验
两组连续型变量资料的秩和检验:通过数据变换使其满足正态性和方差齐性;使用Wilcoxon秩和检验的方法
两组有序分类变量资料的秩和检验
多个独立样本比较的秩和检验
多组定量资料的秩和检验
多组等级资料的秩和检验
随机区组设计资料比较的秩和检验
多个样本间的多重比较
完全随机设计资料多个样本的多重比较:扩展的t检验法;基于调整α水准的方法(精确法、正态近似法)
随机区组设计资料多个样本多重比较:基于调整α水准的方法(精确法、正态近似法)
双变量相关与回归
线性相关
又称简单相关,是研究两个随机定量变量间是否有线性相关关系、关系的密切程度、相关关系方向的一种统计分析方法
散点图:是否具有相关性及方向性、相关的形式、线性相关性的强弱
线性相关系数:r为正——正相关;r为负——负相关
线性相关分析步骤:绘制散点图、适用条件、计算相关系数r、相关系数的假设检验(查表法、回归系数t检验)
秩相关
秩相关,也称等级相关,是一种非参数统计方法
适用条件
不服从二元正态分布而不宜作线性相关
总体分布类型未知
“开口型”或“半开口型”的资料
原始数据是用等级表示
Spearman秩相关系数
简单线性回归分析
回归分析是研究一个变量如何随着另一个变量变化的常用方法
线性回归的两个变量:因变量和自变量
线性回归的分类:Ⅰ型回归、Ⅱ型回归
回归参数的估计:最小二乘法原则
线性回归分析的前提条件:线性、独立性、正态性、等方差性
线性回归分析步骤:①绘制散点图②计算回归系数,建立线性回归方程③绘制回归直线