导图社区 【全书重点总结】人卫第8版《卫生统计学》
整本书的重点知识点总结来啦!非常非常干货,很适合已经学过一遍卫生统计学的小伙伴进行知识的梳理,全是考试重点哦!!!
编辑于2023-03-10 11:52:19 广东社区模板帮助中心,点此进入>>
卫生统计学串讲
卫生统计学的逻辑框架
卫生统计学
比较:变异→不确定性
研究设计
调查设计——不干预随机抽样
实验设计——干预随机分组
三原则
对照
重复
随机化
收集资料
变量(离散/连续)
资料(定量/半定量/定性)
整理资料
净化数据(查漏补缺)
分析数据
描述
指标、统计表、统计图
推断
样本推断总体
医学统计工作的基本步骤
1、研究设计
2、收集资料
3、整理资料
4、分析资料
结果解释
“1+2”的分析模式
“1”个设计
科研结果的好坏取决于研究设计的好坏,研究设计是统计工作的基础和关键,决定着整个统计工作的成败
“2”个内容
统计描述
对已知的样本(或总体)的分布情况或特征值进行分类表述
描述数据:资料类型不同,与之对应的统计指标、统计表、统计图也不同
统计推断
根据已知的样本信息来推断未知的总体
推断数据
参数估计
假设检验
按分析视角差异
从检验方法视角出发(横向)
从资料类型视角出发(纵向)
逻辑起点
资料类型
统计描述
定量资料的统计描述
数据指标
集中趋势
离散趋势
统计表与统计图
直方图
箱式图
定性资料的统计描述
数据指标
相对数
统计表与统计图
直条图
饼图
……
统计推断
详见卫统计算题总结
定量资料的统计推断
参数检验
t检验
Z检验
F检验
非参数检验
定性资料的统计推断
卡方检验
……
非常重要的概念
样本和总体
概述
总体:是根据研究目的所确定的所有同质个体某指标实际值的集合
eg.“该地所有30~49岁健康男子的血清白蛋白值”
样本:观测或调查的一部分个体
eg.“随机抽取的132名男子的血清白蛋白值”
样本容量:样本中个体的多少较样本容量
观察单位:被观察或测量对象的最基本单位
eg.“该地每个30~49岁健康男子”
参数:是有总体中全部观察值计算出来的特征值,用于刻画总体的数据特征
统计量:用来描述样本特征的数值
刻画总体和样本发生可能性
概率与频率
总体和样本统计学指标
统计量和参数
总体和统计量的离散程度
总体标准差和标准误
总体和统计量的统计分布
抽样分布
统计量的抽样分布
抽样误差
何谓抽样误差?
由抽样造成的样本统计量之间,样本统计量与总体数间的差异
为什么说抽样误差在抽样研究中是不可避免的?
因为个体差异客观存在,研究对象又是总体的一部分,因此这部分的结果与总体的结果存在差异是不可避免的
决定均数的抽样误差大小的因素有哪些?
决定均数抽样误差大小的因素主要为样本含量和标准差
抽样方法不同也会影响到抽样误差的大小
抽样研究中如何才能控制或减小抽样误差?
①使用合理的抽样设计
②增大样本含量
概率分布
二项分布
Poisson分布
正态分布
总体分布和抽样分布的应用
参考值范围和置信区间
概要
样本
样本1
统计量1
样本2
统计量2
抽样分布
置信区间
假设检验
样本……
统计量……
总体
总体分布
参考值范围
参数
统计描述指标法
前提:数据类型
从资料性质角度分
人卫版
定量变量 (数值变量) (计量变量)
连续型定量变量
eg.身高(cm)、体重(kg)
离散型定量变量
eg.家庭人口数(个)
连续or离散
区间内是否可以任意取值
定性变量 (分类变量)
分类变量有一个前提:有分类的过程
有序分类变量 (等级资料) (半定量资料)
eg.学历分类(文盲、小学、初中、高中、大专及以上)
无序分类变量 (名义变量)
二分类变量
eg.性别(男、女)
多分类变量
eg.血型(A、B、O、AB)
有序or无序
从取值是否有顺序或等级
从资料收集角度分
南京医科大陆曾版本
计量资料
测定每个观察单位某指标量的大小
eg.身高、体重
计数资料
将观测单位按某种属性或类别分组计数,得到各观察组单位数
eg.血型
等级资料
将观测单位按某种属性的不同程度分组计数,得到各组观察单位数
eg.治疗后的疗效分类(治愈、显效、好转、无效、死亡)
从数据取值的角度分
赵耐青版本
连续型变量
计量资料
定量资料(数值变量)(计量变量)
离散型变量
不具有分类的资料(离散型定量资料)
分类资料
有序分类资料(等级资料)(半定量资料)
无序分类资料(名义变量)
实际上也是分了三类
定量资料的统计指标
强调是客观测量与计算
集中趋势指标
算术均数
几何均数
中位数
总结
众数(少用)
离散趋势指标
方差/标准差
极差(全距)
四分位数间距/范围
变异系数
总结
应试技巧
联合集中和离散趋势
表格总结
常考点
中位数也是第50百分位数(√)
一端或两端无确切数值的资料不适合计算均数,适合中位数(√)
中位数适用于数据中含有不确定值的(√)
各观察值都乘(或除以)同一个常数a(a≠0且a≠1),中位数、均数、标准差变为原来的a倍,变异系数不变(√)
定性资料的统计指标
强调人为构建与计算
不同教材对于相对数指标的分类
尤其注意频率指标
人卫版
频率型指标
频率
可能发生且已经发生/(可能发生且已经发生+可能发生但未发生)
含义:某事件发生的频率
频率是绝对数指标,是各类结果的合计频数,反映总量和规模
频率指标描述某事件在某时期内累计出现的频率
构成比
含义:各类别可能发生的频率分布
构成比用来说明各构成部分在总体中所占的比重
强度型指标
速率
含义:单位时间内某事件发生的频率
相对比
相对比
含义:两个有关联的指标A与B之比
其他教材
比例
构成比
表示事物内部某一部分的个体数与该事物各部分个体数的总和之比
率
率用于说明在某一时段内某现象发生的频率或强度
频率型指标
描述某事件在某时期内累计出现频率
强度型指标/速率
单位时间内某事件发生的频率
相对比
两个有关联的指标之比
应试技巧
相对数的“0~1”分类法
相对数应用的注意事项
不要“以比代率”
eg.不能用构成比来反映病人的病死严重情况
相对数指标的使用和解释要紧扣总体与属性
eg.从2021年5月1截止2021年6月15日,某省新冠确诊病例数2人,1人死亡,这个时候绝对数更适合
计算相对数时分母要有足够数量
eg.手术实施5例,只要出现1人成功,则手术成功率将波动20%
正确计算合计频率➡️分子分母要分别相加
特别注意:分组资料计算合并率时,不能简单把各个率相加求平均,应该分子分母分别合计再计算
注意资料可比性
格外强调的注意事项
原因:因为相对数是不同绝对数之间、相对数之间的相比得出的结果,是人为构建和决定的过程,研究者目的不同,指标的选择、解读也会有差异,如“辛普森悖论”
消除这个因素的影响,才能够真实揭示分组因素对研究指标的影响或作用
率的标准化
引例:引发大家对辛普森悖论的思考
辛普森悖论
从组别率来看,A疗法更好
从合计率来看,B疗法更好
从数学上看,计算没有问题,问题在于:统计方法过于简单,没有考虑实际情况,比如“可比性”
没有可比性的原因:两个疗法的大结石和小结石的构成比不同
率的标准化
标准化法实质是在控制两组或多组分布不均衡的混杂因素的影响后,再对感兴趣的指标进行比较
作用:消除不同组别之间因内部结构不同对总体评价产生的影响
思路
首先,将不同组的内部结构标准化,转为同一标准构成
然后,在标准化的基础上,对整体结构进行计算比较
本质:将两组资料放在一个共同的“平台”或“起跑线”上,然后再进行比较
悖论纠正:举例说明两种率的标准化计算方法
直接和间接的标准不一样,结果会有细微的差别,但是不影响整体评价
直接法
前提
1、内部结构已知
2、各内部的例数/率已知
已知条件
计算示例
标化的是人数,是绝对数
标化后的两个发病率1.5%和1.8%不是实际情况,是我们假设出来的,只做比较用
间接法
甲乙两地均以各自人口构成,求得标准化死亡率,未消除人口构成的影响,用于被标准化人群与标准组做比较
计算步骤
标准人群的年龄别死亡率(和标准人群总死亡率)
实际人群的年龄别人口数(=实际的人口构成比)
得到——预期死亡数
实际死亡总数/预期死亡数
标准化死亡比SMR
间接法标准化率=SMR×标准人群总死亡率
例子
如:已知甲地总死亡数为845人,乙地总死亡人数为679人,以及各年龄组的人口数,求两地标准化死亡比(SMR)及标准化死亡率
标化的是相对数,需要查阅标准组人群的各年龄组的死亡率和标准组的总死亡率(总死亡率属于合计频率,并不是简单的各个组的率相加求平均值)
SMR
甲=845/929=0.91
乙=679/613=1.11
标准化死亡率
15.42是标准人群总死亡率
甲地=0.91×15.42(1/10万)=14.03/10万
乙地=1.11×15.42(1/10万)=17.12/10万
应试技巧
应用标准化率的注意事项
标准化率仅适用于相互间的比较,实际水平应采用未标准化值反映
注意标准化率两种方法的选择
标准化率仍然存在抽样误差,对总体进行推断时需要做假设检验
标准化仅仅用于解决内部构成差异造成的不可比问题
在需要的时候,可以同时对两个因素(如年龄和性别)作标准化,以作比较
总结
选择标准
直接法
各年龄组标准人口构成比【或】各年龄组标准人口数
当已知所比较资料各组率Pi(死亡率),用标准人口数或标准人口构成对率进行标准化
间接法
各年龄组标准死亡率
当已知所比较的资料各自某现象总发生数r及各分组观察单位数时
进行不同地区死亡率比较时,计算标准化死亡率的目的是?
不同年龄或性别在地区占比不同,会影响最终该地区的总合计死亡率,掩盖某个年龄或性别真实的死亡情况。所以率的标准化是为了消除组间构成(年龄,性别)不同对总体的合计率的影响
标准化可以控制混杂偏倚
统计描述图表法
频数分布图表
频数图表的制作
计算全距
确定组距
组段数取决于资料性质、样本量、分析目的
一般取8~12组,组距相等
确定组段的上下限
为半闭半开区间,[ , )
下限为闭区间,上限为开区间
最后一组的组段要求写出上限
列表整理
优缺点
优点:可以让原本杂乱无章的数据变得井井有条
缺点:仅仅依靠频数分布表展示数据,仍然不够直观
对策:将频数表与频数图结合起来,能够清晰地展示出数据的特点
比较不同资料类型频数图的区别与联系
定量资料
连续型定量变量
直方图
离散型定量变量
直条图
子主题
定性资料
二分类定性资料
多分类定性资料
等级资料频数分布图表
区别与联系
联系:不同资料类型,均可以通过频数图、表来展示
区别:无论是定量数据(离散、连续)还是定性数据(等级、二分类、多分类),从它们呈现在图或表中的形式来看,区别只体现在数据连续or离散
统计表概述
基本知识
概念:以表格的形式,表达被研究对象的特征、内部构成及项目分组之间的数量关系
“5”要素:标题、标目、线条、数字和备注
标题:高度概括(时间+地点+研究内容),序号,正上方
标目:横标目(对象)+纵标目(指标),意义明确
线条:多采用三线表
数字:阿拉伯数字表示,注意特殊符号的使用(“——”、“……”、“0”、“*”)
“3”基本:顶线、底线、纵标目分隔线
分类:简单表、组合表
编制原则:重点突出、层次清楚、简单明了
统计表的制作规范
统计图概述
统计图
概念:用点的位置、线的升降、面的大小来表示统计资料数量关系的一种形式
原则:根据资料性质和分析目的选择合适的统计图,除圆图外,一般用直角坐标系的第一象限或长方形框架展示
统计图的基本结构
图形:根据资料性质和分析目的合理选择
标题:在图的下方,说明图的内容,必要时包括时间、地点等研究信息
标目:纵横轴应注明单位,纵横轴之比以5:7为宜
图例:在图内的的右上角或标题之上
常见统计图
直条图
概念:用等宽直条的长短表示各个互相独立统计量的大小和对比关系的图形
适用:相互独立的资料→分组明确、不连续
条图只能用于几者之间的比较,无法描述随时间变化的情况
分类:单式→一组、复式→多组
单式绘制要点:
横纵分别为“分组因素+比较指标”横竖皆可
比较指标所在的轴须从”0“开始,等距划分
各个直条宽度相等,注意间隔
注意排列顺序
复式绘制要点
同一分组因素的直条,应颜色区分,附图例
有隶属关系的多个事物,用直条全长表示事物全部,内部则分颜色表示包含关系
直方图
概念:以各直方的面积来代表各组段频数的多少
适用:连续型变量的频数分布
圆图
概念:以一个圆的面积为100%,用圆内部各个扇形的面积所占的百分比来表示各部分所占的构成比
适用:构成比资料
绘制要点
圆周角360度,分成100等份
以时钟12点的位置为起点,顺时针方向绘制
不同扇形用颜色加以区分,并附图例
百分条图
概念:以长条面积为100%,用长条内部各个段的面积所占的百分比来表示各部分所占构成比
适用:构成比资料
类型:单式、复式
线图
概念:以线段的升降表示事物在时间上的发展变化或一种现象随另一种现象变迁的情况
适用:连续型资料
类别
普通线图
概念:横轴、纵轴均为算术尺度,反映事物数量变化的绝对差别,用来描述事物的变化趋势
适用:单纯比较变化幅度,绝对量相差不悬殊
适用:描述某统计量随时间的绝对变化趋势
线图适用于连续型资料或动态资料,用线段的升降表示某事物在时间上的变化趋势,或某现象随着另一现象变化的情况。描述的是绝对变化趋势
eg.比较两种死亡率的变化趋势
半对数线图
概念:横轴为算术尺度,纵轴为对数尺度的线图,反映事物数量变化的相对差别,描述事物的变化速度
适用:绝对量相差悬殊事物的比较
适用:描述某统计量随时间的相对变化趋势(即变化速度)
eg.反映2012-2019年农村和城市恶性肿瘤病死率的相对变化趋势
半对数线图用线段的升降表示事物的相对变化速度而非变化趋势
散点图
概念:以点的密切程度和趋势来表示两种现象的相关关系
适用:双变量资料
箱式图
结构:5个统计量反映原始数据的分布特征
箱子的两端:P75和P25
中间横线为:M(中位数)
两端连线是:除去异常值外的最大值和最小值
适用:适合多组数据的比较
应用
箱式图的5个统计量反映原始数据的分布特征:中心位置、分布、偏度、变异范围、异常值
箱子越长数据变异越大,中间横线在箱子中点表明数据分布对称,否则不对称
统计地图
概念:用不同的颜色和花纹表示统计量的值在地理分布上的变化
绘制:可根据行政区域或者地理特征绘制,各个区域统计指标通过不同颜色或花纹表示不同的意义
应试技巧
统计图的选择
分类
比较图
直条图
比较分类变量的频数分布,横轴变量是非连续型指标
百分条图
侧重内部构成比,而且适用多组数据构成比比较
饼图
侧重内部构成比,但只能体现一组数据
分布图
直方图
显示频数分布,横轴是连续型指标
箱式图
相比直方图、直条图、茎叶图能直接提示描述性指标,如中位数
茎叶图
相比直方图,能更直观显示原始数据,且允许某些区组的样本缺失
热图
描述时间与空间分布
统计地图
描述地理分布
动态图
线图
变化趋势
半对数线图
变化速度
关系图
散点图
图形类型
条图
能清楚的表示出每个项目的具体数目
圆图
清楚的表示出各部分在总体中所占的百分比
线图
能清楚的反映事物的变化情况
常见分布总结
三个重要名词
总体分布:在总体中,个体值X的取值范围及其概率
样本分布:在样本中,个体值X的取值范围及其概率
个体观察值的分布
抽样分布:按照相同的样本容量,相同的抽样方式,反复地抽取样本,每次可以计算一个平均数,所有可能样本的平均数所形成的分布,就是样本均属的抽样分布
样本统计量的分布
资料的分布
对称分布
集中位置在中间,左、右两侧大致对称的分布
均数=中位数=众数
不对称分布
正偏态
集中位置偏向数值小的一侧(左侧)
均数>中位数>众数
负偏态
集中位置偏向数值大的一侧(右侧)
均数<中位数<众数
三大总体分布
正态分布
连续型随机变量的分布
是重要的连续型分布,随机变量X服从均数为μ,标准差为σ的正态分布,记为X~N(μ,σ²)
正态曲线:是正态分布的两个参数
正态曲线在横轴上方均数处最高
正态分布以均数为中心,左右对称
正态分布有两个参数,即位置参数μ和形态参数σ
标准正态分布:是一种特殊的正态分布,通常用U或Z表示服从标准正态分布的变量,此时称随机变量X服从均数为0,标准差为1的标准正态分布,记为X~N(0,1)
标准化转换
u变换,也称Z变换
正态分布:一簇曲线
标准正态分布:一条曲线
变换思想:一般~特殊,“向一个标兵看齐”
变换方法:中心位置平移,横轴刻度标准化
标准正态分布界值表
标准正态分布界值与概率
应用
熟练掌握正态分布的68-95-99.7法则(牢记)
运用正态近似法计算医学参考值范围(运算)
标准化转换,涉及到以下两个互逆应用(运算)
估计某个随机变量在一定取值范围内的观测值个数占全部观测值数量的百分比
通过已知的百分比,估计总体变量值的分布范围
运用正态近似法计算置信区间(运算)
详见计算题总结
正态分布是很多统计学分析方法的理论基础(理解)
二项分布
离散型随机变量的分布
二项分布:n次伯努利试验,成功的次数为X的离散概率分布,其中每次试验的成功概率为p,失败概率为1-p,实际上,当n=1时,二项分布就是伯努利分布
伯努利试验要求:互斥、独立、重复
二项分布的基础理论是伯努利试验,那么也应该满足伯努利试验的3个基本要求
1、每次随机试验的可能结果有2个,并且两种结果互相排斥(互相独立),如阳性或阴性、生存或死亡、患病或未患病
2、每一次试验成功的概率为π,其对立结果出现的概率则为1-π,实际工作中,π往往是未知的,但是可以通过大量的重复试验,用观察所得到的资料计算相应的样本率p作为π的估计值
3、n次重复的伯努利试验的结果互相独立,每次试验的结果不会影响到其他试验的结果
二项分布特点
X的总体均数(也称期望值),μx=nπ(图形中的高峰值)
X的总体方差σx=nπ(1-π)
π=0.5时图形是对称的,方差最大为0.25n,X的分布以nπ为对称轴,且呈对称分布,π越偏离0.5,对称性越差
与正态分布的关系:对于同一个π,n越大,分布越趋于对称,当n→∞时,只要π不太靠近0或1(特别是nπ>5且n(1-π)>5时),二项分布接近于正态分布
应用时记得校正
泊松分布
离散型随机变量的分布
概念:描述在单位面积、单位时间或单位空间罕见事件发生次数的概率分布,记作P(μ)
举例
放射性物质单位时间内的放射次数
单位体积内粉尘的计数
每滴海水中浮游生物数量
某一区域内野生动物或昆虫数
显微镜下细胞或微生物计数
自然灾害发生的次数
汽车站台的侯客人数
机器出现的故障数
有传染性的事件不可以用泊松分布
注意
无论是二项分布、还是泊松分布,二者都是基于伯努利试验
泊松分布是二项分布的极限形式
泊松分布和二项分布在一定条件下将会近似正态分布(中心极限定理)
泊松分布的特点
二项分布在“成功”概率π很小,样本含量(试验次数)n趋向于无穷大时,近似于泊松分布
本质还是二项分布
泊松分布的方差和均数相等,均为μ(注意不是标准差)
可加性:X~P(λ1),X~P(λ2),若X与Y独立,则X+Y~P(λ1+λ2)
图形分布规律:呈非对称分布,分布图的形态取决于λ,λ<5时为偏峰(只可能是正偏),λ越小分布越偏,随着λ的增大,分布趋向于对称
当λ≥20时,泊松分布近似正态分布
用泊松分布描述某随机事件A在单位时间内的发生次数,其条件为
1、普通性:在充分小的观察单位上A的取值最多为1,这最多发生1次,这样保证了随机事件A在一瞬间不可能发生两次或两次以上
2、独立增量性:一个事件的发生不影响其他事件的发生,即事件独立发生,不存在传染性,聚集性的事件
3、平稳性:每一次事件的发生概率是相同的
总结
概率函数
正态分布
二项分布
Poisson分布
关系
伯努利试验 成功
伯努利试验 成功
伯努利试验 成功
n次
二项分布
泊松分布
正态分布
标准误与抽样分布
核心定理
大数定律:指在随机实验中,每次出现的结果不同,但是,大量重复试验结果的平均值,总是接近某一个确定值。其原因是,在大量的观察试验中,个别的、偶然的因素影响而产生的差异将会互相抵消,从而使现象的必然规律性显示出来
数字量化视角:随着重复试验次数增多和样本量增加,样本均数将趋近于总体均数
中心极限定理:指给定一个任意分布的总体,每次从这些总体中随机抽取n个样本,一共抽m次,可以分别计算得到m个样本均值,这些平均值的分布接近正态分布
图形展示视角:不依赖于总体分布形态,随着重复试验次数增多和样本量增加,样本均数的分布将近似于正态分布
样本均数的中心极限定理:从任意均数等于μ,方差等于σ²的一个总体中抽取样本量为n的简单随机样本,当样本量n很大时,无论总体分布形态如何,样本均数的抽样分布近似服从正态分布
连续型变量
样本率的中心极限定理:从“成功”率为π的总体中随机抽取样本量为n的样本,其样本“成功”率用p表示,当nπ>5且n(1-π)>5时,样本量p近似服从正态分布
离散型变量
本质一样
总结
常见的三种抽样分布形式
χ²分布
概念:若k个随机变量X1,X2…… Xk是互相独立,符合标准正态分布的随机变量,则随机变量X的平方和服从自由度为k的卡方分布,记作X~x²(k)
本质上是多个标准正态分布之和
图形特点:一簇单峰正偏态分布曲线,且随着自由度的增加,正偏的程度越来越小
取值范围:0~∞
自由度:v
补充
频数分布拟合优度检验时的χ²检验,自由度v=k-1-g(k为组数,g是以样本数据估计参数的个数)
查χ²分布界值表可见,当P=0.05时,当自由度v越大,χ²值越大
四格表资料的原始公式
四格表资料的校正公式
校正后的χ²值<未校正的χ²值
当应该使用校正公式而未使用时,会导致χ²增大,相应的P值减小
F分布
概念:设从两个方差相等的正态分布N(μ1,σ1²)和N(μ2,σ2²)总体中随机抽取样本量为n1和n2的样本,样本均数和标准差分别为x1、s1和x2、s2,且F=S1²/S1²,则f值服从自由度为(n1-1, n2-2)的F分布
本质上是两个卡方分布的比值
图形特点:F分布为一簇单峰正偏态分布曲线,与两个自由度有关,且随着两个自由度的增加,正偏的程度越来越小
取值范围:0~∞
自由度:v1、v2
t分布
概念:设从正态分布N(μ,σ²)随机抽取样本量为n的样本,样本均数和标准差分别为x和s,且t=(x-μ)/[s/根号n],则服从自由度为n-1的t分布
t分布本质上是分母服从标准正态分布,分母服从卡方分布的分布
图形特征:一簇以0为中心,左右对称的单峰曲线;随着自由度的增加,t分布曲线将越来越接近于标准正态分布
取值范围:-∞~+∞
自由度:v
只有一个参数
正态分布、Z分布、t分布的关系
总结
参数估计与假设检验
两个重要名词
参数估计:统计推断的一种,根据从总体中抽取的随机样本来估计总体分布中未知参数的过程
定量推断
假设检验:统计推断的一种,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过样本数据进行统计推理,对此假设应该被拒绝还是接受作出推断
定性推断
区别与联系
关系
1、置信区间可判断差异是是否具有实际意义
2、置信区间具有假设检验的主要功能:在α水准上可回答差异有无统计学意义
3、置信区间可提供假设检验没有的信息:根据置信区间上、下限的数值大小可判断差别是否具有实际意义
4、假设检验可提供确切的P值,提供“有差别”结论的概率保证。而置信区间只能在预先确定的置信度上进行差别有无统计学意义的推断,没有精确的概率值,且有可能增大二类错误
5、只有把置信区间与假设检验相结合起来,互相补充才是对比较问题的完整分析
检验水准 α与 P 值的联系与区别
P值的含义
定义:在H0成立的条件下,计算现有样本统计量以及更极端情况的概率,即等于及大于(或等于即小于)现有样本统计量的概率,称为假设检验的P值
eg.分析一种新药与常规药的疗效时,P<0.05,且新药有效率比常规药高,故可认为
假设新药与常规药效果相同,而结论未接受假设,说错的可能性<5%(√)
假设新药与常规药效果不同,而结论未接受假设,说对的可能性>5%(×)
假设应该是H0,而不是H1
参数估计(定量)
标准差与标准误
两者的主要区别在于:标准差越大,表示变量值越分散,而标准误越大,则均数分布的抽样误差大
点估计与区间估计
如果我们估计的一个区间的范围没有包括总体参数的话,这个曲线是没有意义的,所以我们一般先保证准确性,再强调精确性,这也是为什么我们要规定α
注:区间估计的理论基础是抽样分布规律,要估计一个参数,必须了解相应的统计量的抽样分布规律。区间估计在点估计的基础上,能给出一个估计范围,提高了估计的准确性,同时对区间宽度的控制,提高了估计的精确性
对于一个参数可以获得几个估计值(√)
准确性与精确性
置信区间的“辨析”
置信区间计算的常见情形总结
总体均数的(1-α)置信区间
1、当总体标准差σ已知
2、当总体标准差σ未知且样本量比较大时(如n>50),用Z分布代替t分布
3、当总体标准差σ未知且样本量比较小时(如n<50),采用t分布
两总体均数之差的(1-α)置信区间
1、当样本量足够大,如n1>50,n2>50,则选用Z分布估计置信区间
2、当样本量不够大时,用t分布估计置信区间
方差齐
=合并样本方差
v=n1+n2-2
方差不齐
总体率的(1-α)置信区间
1、n很小时
查表法
2、np≥5且n(1-p)≥5
Z分布
两个总体率之差的置信区间
1、n1p1、n1(1-p1)、n2p2、n2(1-p2)均大于5时
近似正态法
2、n1p1、n1(1-p1)、n2p2、n2(1-p2)不太大时
统计量p1-p2不再服从正态分布
校正正态检验法
Poisson总体平均计数μ的(1-α)置信区间
1、当样本较小时,如X≤30
查表
2、样本较大时,如X>30时
Z分布
假设检验(定性)
小概率事件与反证法
1、小概率事件:通常情况下将发生概率不超过0.05的事件称作小概率事件,也可以根据实际研究需要确定为更小的概率,如0.01、0.001
2、反证法:3000另一个假设,如果收集到的证据推翻了前提假设,我们就可以拒绝该假设
3、本质:“假设检验”,顾名思义“建立一个前提假设,检验他是否真的成立”,首先假设H0是真命题,H0为真命题的发生概率则是小概率事件,在H0为真的前提下,原本几乎不可能发生的小概率事件却发生了,推翻了H0的结论,因此我们要拒绝H0,接受H1,反之,则不拒绝h0
决策标准
决策标准即检验水准,也称为显著性水平。用α表示,用来表示“H0为假”这一样本结果极不可能发生的概率值。
分类
参数检验
t检验
非参数检验
卡方检验
秩和检验
假设检验的规范步骤
1、提出检验假设
根据研究目的提出相应的“零假设H0”和“备择假设H1”,并确认是选择“单侧检验”还是“双侧检验”
2、确定检验水准α
α确定后,拒绝域也随之确定了
3、计算检验统计量
根据样本资料和零假设H0提供的前提条件,选择合适的检验统计量,如Z,t等
4、确定P值,作出统计推断
根据计算得到的检验统计量,确定P值,比较P值与α大小,判断统计学差异的显著性,并作出推断
二类错误
假设检验的核心是推断H0
1、当H0为真时,此时,拒绝H0就是错误的,不拒绝H0就是对的
2、当H0为假时,此时,拒绝H0就时对的,不拒绝H0就是错的
当我们拒绝H0时,只会犯一类错误
当我们不拒绝H0时,只会犯二类错误
检验效能
定义:是总体之间确实存在差异,按照现有的检验水准α,能发现它们有差异的能力,用(1-β)表示。
影响因素
1、总体差别的大小:正确选择被试因素及其水平,这是实验成败的首要环节。被试因素的有效性越强,H0与H1涉及的不同总体均数之间的差距越大,两者在分布上的重叠面积就越小。由于β较小,1-β就必然较大
2、标准差的大小:由于α与β呈反比,两全其美的方法就是使两个互相比较的总体分布都很集中,重叠面积缩小,这样就可以收到α和β均减小的效果。在两个总体均数与样本含量固定的条件下,各总体分布的面积不变,但其扩布范围与标准差成正比,因此,尽量减少个体差异,严格控制实验条件,认真遵守操作规程,努力使标准差减小到合理水平,这是提高检验效能的重要途径之一
3、样本量:根据中心极限定理,样本量增加,样本统计量的标准差(标准误)减少,抽样分布趋向集中,α与β都减小,因而检验效能增加
4、检验水准α:α↑,拒绝域增加,拒绝H0假设的概率就增加,假设检验的效能也就越大
5、单双侧检验:对于同样的检验水准α,单侧检验的拒绝域要大于双侧检验,因此单侧检验的检验效能要高于双侧检验
总结
假设检验的核心思想
1、确定待检验假设
零假设H0:为需要做出检验的假设
备择假设H1:与零假设对立的假设
2、找证据,选择检验统计量
检验统计量是对H0假设进行检验的统计量
3、确定拒绝域
落在拒绝域,则拒绝H0,否则,不拒绝H0
4、确定P值
根据检验统计量,查表找P值
5、检查样本结果
P值与检验水准α(拒绝域)做比较
6、得出结论
注意是统计学结论,不等于专业结论
统计设计与获取数据
结合“计算题总结”使用
统计综合分析逻辑
统计工作的步骤
1、统计设计
是开展研究工作的前提和依据,一个完整的设计应包括研究全过程的内容
2、收集资料
按照设计要求取得准确、可靠的原始数据
3、整理资料
将收集到的原始资料系统化、条理化,便于进一步计算与分析
4、分析资料与解释结果
根据研究设计的要求、资料的类型和分布的特征等选择统计分析方法,包括统计描述和统计推断。最后结合卫生统计学知识与专业知识对分析结果做出恰当的解释
统计分析五步法
1、资料类型
定量资料
2、检验目的
差异性检验
独立性分析
拟合优度检验
3、对比组数
单样本
两组
三组及以上
4、研究设计类型
完全随机设计
配对设计
随机区组设计
5、数据特征及样本量
独立
正态/样本量大小
方差
方法选择
参数检验
t检验
t'检验
配对t检验
Z检验
F检验One-way ANOVA
F检验Two-way ANOVA
非参数检验
Wilcoxon符号秩和检验
Wilcoxon秩和检验
Kruska-Wallis H秩和检验
Friedman M检验
统计分析五步法
1、资料类型
分类资料
无序分类资料
有序分类资料
2、检验目的
差异性检验
独立性分析
拟合优度检验
3、对比组数
单样本
分类资料(2×2)
分类资料(R×C)
4、研究设计类型
完全随机设计
配对设计
随机区组设计
5、数据特征及样本量
样本量大小
理论频数、实际频数
属性情况
方法选择
卡方检验
成组卡方检验
配对卡方检验
R×C列联表卡方检验
Fisher确切概率法
基于秩的非参数检验
Wilcoxon秩和检验
Kruskal-Wallis H秩和检验
三种常见的研究目的
拟合优度检验
概念:又称优度检验,是指通过构建检验统计量,分析现有的观测变量的分布形态,检查其分布能否与某一期望分布很好地吻合起来
差异性检验
概念:差异显著性检验是用于比较两个或者多个样本的差异是否显著的统计分析方法
分析方法小结
关联性分析
概念:关联分析是研究现象间是否存在相关关系,并具体对具有依存关系的现象进一步探讨其相关程度及相关方向,是研究随机变量间相关关系的一种统计方法。要确定相关关系的存在,相关关系的方向和形态以及相关关系的密切程度,主要可以通过绘制相关图标、计算协方差和相关系数来完成
分析方法小结
三种分析类型之间的联系
独立性检验与差异性分析有何异同点
(1)分类变量的关联性分析与率(或构成比)的差异性分析,在检验过程和方式上完全一致。仍需强调的是,这两大类分析在研究目的、设计方案、数据结构与结果解释方面有着本质的区别
(2)关联性分析,主要针对同一随机样本的两个不同属性变量所形成的交叉表,侧重于推断两个不同属性变量之间存在关联性与否:
(3)率(或构成比)的比较,则主要针对两个或多个独立随机样本所形成的交叉表,侧重于推断其分别所代表的总体率(或构成比)之间是否存在差异性
(4)在应用时需结合具体研究目的具体分析
常用的统计设计类型
两类医学研究类型
观察性研究
在没有任何干预措施的条件下,客观地观察和记录研究对象的现状及其相关特征
实验性研究
是指对研究对象给予干预措施的研究,并对干预效果进行评价
两者最大的区别:是否施加干预
常见研究方法
观察性研究
抽样调查、普查
概率抽样:简单随机抽样、系统抽样、分层抽样、整群抽样、多阶段抽样
非概率抽样
实验性研究
实验设计三要素
处理因素
实验单位/实验对象
实验效应
实验设计三原则
对照
随机
重复
提高对比组间均衡可比性
分类①
按处理因素多少分
单因素设计
按某一分组变量特征来分析某效应变量差异的方法
主要有
完全随机设计
配对设计
随机区组设计
关注的是处理因素
交叉设计
多因素设计
考察两个及以上分组因素的某个或某些效应变量间差异的方法
主要有
析因设计
重复测量设计
分类②
完全随机设计
判断:一步法、一次性随机分组
研究对象总体或目标人群
随机抽样/非随机抽样
研究对象
随机分组
对照组
处理组1
处理组2
处理组3
配对设计
判断:组对子,自身或异体配对
自身配对
eg.用相同的方法测量同一患者药物服用前和服用后的血压值
研究对象总体或目标人群
研究对象
试验前结果
处理因素
试验后结果
异体配对
研究对象总体或目标人群
研究对象
配对条件
实验对子
随机分配
实验组
对照组
随机区组设计
判断:两步法,第一步先组成区组,第二步再随机处理组
研究对象总体或目标人群
研究对象
配伍条件
区组
随机分配
处理组1
处理组2
处理组3
交叉设计
判断:交叉,顺序颠倒
研究对象总体或目标人群
研究对象
配对条件
实验对子(可无)
随机分配
试验组
对照组
对照组
试验组
交叉用药(洗脱期)
析因设计
判断:看研究目的,是否探究联合作用(交互作用)
研究对象总体或目标人群
随机抽样/非随机抽样
研究对象
随机分配
A1B1组
A1B2组
A2B1组
A2B2组
重复测量设计
判断:不同时间、重复观察
研究对象总体或目标人群
研究对象
试验组
对照组
测量时间0 测量时间1 测量时间2 ……
总结:常见实验设计类型对比
不同研究设计的辨析
完全随机设计与随机区组设计
注意:两个因素、非独立性
完全随机设计只涉及一次随机分配,而随机区组设计先形成区组,然后再对同一区组内的研究对象进行随机分配
随机区组设计与配对设计
随机区组设计也有可能出现自身对照的
配对设计需要形成“对子”,一个“对子”有两个研究对象,而随机区组设计可以看成“对子”中包含的研究个数超过了两个
完全随机设计与重复测量设计
时间
补充学习
临床试验常见的统计分析类型
临床试验通过不同组比较说明药物或治疗方案的效果,根据研究目的与比较类型的不同分
优效性试验
指主要目的为显示试验药物的效应优于对照药的试验,包括试验药是否优于安慰剂、试验药是否优于阳性对照药、或剂量间效应的比较
等效性试验
目的是确证两种或多种治疗的疗效相当,即使有一定差异,但该差异在临床上并无重要意义
非劣效性施压
主要目的是为了显示试验药物的效应在临床上不劣于阳性对照药的试验,比如试验药的疗效虽然在临床上稍低于对照药,但其差异也是在临床可接受范围内
随机分组的方法
随机数法的应用
按某一原则编号
取随机数
1、奇偶数法
奇数分为A组
偶数分为B组
适用于分两组
2、余数法
可以整除为A组
余数为1为B组
余数为2为C组
余数为3为D组
……
3、随机编秩法
①先按随机数从小到大的顺序编序号,如随机数相同,按其出现的先后顺序,先出现的为小
②归组,需要1~10为A组,11~20为B组……
适用于分多组
补充
某研究人员欲将12只小鼠按月龄、体重相近的原则配成对,然后将每一对中的小鼠随机分到实验组和对照组,应如何分组?
先将6对小鼠按体重从小到大的顺序编号(2分。再从随机数字表中任一行,如第18行最左端开始横向连续取12个两位数字(4分)。事先规定,每一对中,随机数较小者序号为1,对应于 A 组,随机数较大者序号为2,对应于 B 组(4分)
统计推断——t检验
Z检验与t检验
Z分布与t分布的区别与联系
联系
随着自由度增大,t分布趋近于标准正态分布,即当v→∞时,t分布趋近于标准正态分布
区别
①t分布为抽样分布,标准正态分布为理论分布
②t分布比标准正态分布的峰值低,且尾部翘得更高
③t分布的图形只由v决定,标准正态分布的参数由两个
如图
Z检验与t检验的区别与联系
t检验的应用条件
不同情形下的t 检验
注意:标准误的分母
常见的方差齐性检验
F检验:应用于两样本方差齐性检验,要求数据服从正态分布
Levene检验:应用于两个或多个样本方差齐性检验,不依赖总体分布的具体形式
Bartlett检验:应用于两个或多个样本方差齐性检验,要求数据服从正态分布
假设检验和置信区间之间的关系
单样本
情形一:总体标准差σ未知,且样本量n不大时
情形二:总体标准差σ未知,且样本量n足够大
总结
双侧(1-α)置信区间的基本形式
配对总体差值的置信区间
两总体均值之差的置信区间(两总体方差相等)
总结
人卫第八版中的置信区间都是根据t/z分布获得的,包括直线相关和回归中的置信区间
1、反应变量平均值的双侧(1-α)置信区间
2、ρ的置信区间估计,转换为Zp的双侧(1-α)置信区间
3、ρ=0的假设检验:t检验
思考:为什么置信区间只用到了t/Z分布界值?
因为t分布和Z分布是样本均数的抽样分布,而F分布计算的是方差,卡方则是计算的是理论频数和实际频数的符合程度,与均值无关
解题思路
回归:定量资料分析步骤
定量资料 (k=1)
正态或样本量较大
t检验/z检验
不满足正态性
Wilcoxon符号秩和检验
定量资料 (k=2)
完全随机设计
正态、方差齐
①成组t检验 ②样本量较大,z检验
正态、方差不齐
①成组t'检验 ②Wilcoxon秩和检验
偏态分布
Wilcoxon秩和检验
配对设计
对子间独立、差值符合正态分布
配对t检验
不满足正态性
①变量变换使之符合正态性检验 ②Wilcoxon符号秩和检验
定量资料 (k≥2)
完全随机设计
正态、方差齐
完全随机设计的方差分析
非正态和/方差不齐
Kruskal-Wallis H秩和检验
随机区组设计
处理组间、区组间数据满足正态性 、方差齐性
随机区组设计的方差分析
不满足正态性、方差齐性
①数据转换方法 ②Friedman M 检验
补充
题:某研究欲比较特殊饮食疗法与药物疗法降低血清胆固醇的效果,将24名志愿者完全随机分成两组,接受降胆固醇试验,受试者在实验前后各测量一次血清胆固醇(mmol / L ),结果如下表,试判断两种治疗方案的降胆固醇的效果
问1:试问可以直接比较两种方法试验后数据进行比较吗?
答1:不可以。因为试验前样本之间有变异,试验后因为处理因素的不同又有了新的变异,如果只考虑试验后而不考虑试验前样本之间的变异,变异的累加会使结论的不可靠性增大
统计推断——F检验
t检验与F检验
两组以上不能用t检验
1、在1次t检验中,得到“两组有差异的”的结论的可能性犯错误的概率是多少?(α=0.05)
2、重复比较三次,每次均不犯一类错误的概率为:0.95³=0.86——概率的乘法计算性质
3、至少有一次犯一类错误的概率为1-0.86=0.14>0.05
若用t检验进行多个样本均数的多次两两比较,将会加大犯一类错误的概率
当比较组数=2时,对于同一资料的双侧检验F=t²
限定双侧检验
包括完全随机设计和随机区组设计
完全随机设计:两独立样本t检验等价于完全随机设计的方差分析
随机区组设计:配对设计的t检验等价于随机区组设计的方差分析
方差分析的资料要求
完全随机设计的方差分析并不能完全取代成组设计(两独立样本)的t检验
多组比较时,进行多次两两比较会增大犯一类错误的概率,故相比于方差分析,t检验存在不足
方差分析只能检验H1:μ1≠μ2,即只能检验两均数间是否有差异,无法检验μ1<μ2或μ1>μ2
各处理组方差不相等时,t检验科采取校正自由度的办法进行假设检验 (即成组t'检验),而方差分析在该情况下不适用
不同类型的方差分析
方差分析与方差齐性检验
F分布是一种分布形态,F检验是利用F分布进行的假设检验
F检验两种常见用途
方差分析:双侧检验,单侧界值(α=0.05),适用于两组或多组数据
组间=处理效应+随机效应,组内=随机效应,一般来说组间≥组内,故一般F≥1,只查单侧界值
方差齐性检验:双侧检验,双侧界值(α=0.1),只适用于两组数据
注意
人为把方差大的放在分母上,因此F统计量≥1,故只需查单侧界值
只查单侧界值,因此界值形式为F0.05(v1,v2)
为了减小第二类错误,尽量避免把方差不齐的数据认作方差齐,一般检验水准为0.1
我们得到方差齐的可能性降低了
思考:为什么方差分析和方差齐性检验都用F分布呢?
(赵耐青版本P58),F分布的定义:两总体方差相等时两样本方差之比服从F分布
方差分析
方差齐性检验
“均方(MS)”可看作一种特殊类型的“方差”
思考:为什么方差分析是单侧界值?
(1)以完全随机设计为例,方差分析中检验统计量 F 的计算是用组间均方除以误差均方(即 F= MS组间 / MS组内 )。其中,组间均方反映处理因素和随机误差的效应,组内均方反映随机误差的效应
(2)若 H0 成立,组间均方只反映随机误差的效应,因此 F 值等于1。若 H0不成立,组间均方反映处理因素和随机误差的效应, F 值大于1
(3)从理论上说, SS 组间 ≥ SS 组内 , F 值应大于或等于1,不会小于1,从而认为方差分析是单侧界值(注意:在实际中,由于测量和抽样误差的存在,可能会出现 SS 组间 < SS 组内 的的情况)
思考:为何在相同自由度( v1 ,v2)及 α 水准时,方差分析的界值比方差齐性检验的界值小?
(1)因为方差分析是看单侧界值,在 F 分布中,用于检验均数间差异的方差分析,由于被检验的各个均数是无序排列的,故必然是双侧检验
(2)其 P 值对应于 F 分布曲线下界值右端的尾部,故必然是单尾面积
(3)而在方差齐性检验中, P 值对应于 F 分布曲线下左右两部分面积之和,是双侧面积(双侧界值,双侧检验),所以在相同自由度( V ,V2)及 a 水准时,方差分析的界值比方差齐性检验的界值小
方差分析的基本思想
区组变异本质是从原来的组内变异分解出来的
比较重要的两类方差分析
两个均数间的多重比较(4种:2+2)
探索性研究,比较次数为C(n,2)(n为总组数)
在研究设计阶段未预先考虑或预料到,经假设检验得出多个总体均数不全等的提示后,才决定多个均数的两两事后比较,往往涉及到每两个均数的比较
多重两两比较的检验
SNK法
Bonferroni法
证实性研究,比较次数为n-1
在设计阶段就根据研究目的或专业知识而计划好的某些均数间的两两比较,常用于事先有明确假设的研究
多个处理组与对照组的比较
Dunnett-t检验
LSD-t检验
总结
解题思路
定量资料分析步骤
统计推断——卡方检验
卡方检验的基本思想
卡方检验的基本思想实质:将对两个或多个总体率(构成比)的比较转化为实际频数与理论频数吻合程度的比较
当v=1时,χ²(0.05)=3.84
卡方检验一般只能进行双侧检验,对应的是单侧界值
卡方分布
性质
详见上面的“抽样分布”专题
用途
差异性检验
独立性(关联性)检验
拟合优度检验(了解)
分类资料分析步骤
差异性检验:两组或多组独立样本资料
两独立样本2×2交叉表
1、应用场景
2、应用条件
两样本互相独立(配对表中的样本数据一般不独立)
对样本量的要求
n≥40且各个格子理论频数T≥5
成组卡方检验
(基本公式)
(四格表专用)
n≥40,但出现一个格子1≤T<5
卡方检验公式需校正
(基本公式)
(四格表专用)
若出现以下三种情况之一,则卡方检验不再适用,宜采用Fisher确切概率法
n<40
任意一个格子的理论频数T<1
看n和实际频数最小的格子数的理论频数来判断
卡方检验后所得概率P接近检验水准
对卡方自由度的理解
v=(R-1)×(C-1)
周边合计数不变,观察交叉表中可变动的数字个数,可结合Fisher确切概率法的求解思路理解
举例:2×2四个表中,固定周边合计数不变,当a改变时,b、c、d必然随之改变(即可通过确定a来计算其他值),那么可变动的数字个数只有1个,即a
3、Fisher确切概率法
基本思想:保持周边合计数不变,计算交叉表中各个实际频数变动的所有可能组合所对应的概率,再将获得现有样本的概率以及比它更极端的所有概率求和,直接算出单侧或双侧的累积概率进行推断
4、两个率的Z检验和χ²检验的联系与区别
多组独立样本R×C交叉表
1、应用场景
多个构成比的比较
指标变量个数j>2
多个率的比较
指标变量个数j=2
卡方分割(率的多重比较)
多个率或多个频率分布比较的卡方检验,当结论为拒绝H0时,仅表示多组之间是有差别的
若需要明确究竟哪两组之间存在差别,可做率的多重比较,将R×C表分割为若干个小的四个表进行检验
率的多重比较与均数的多重比较,在检验思想上是完全一致的。研究者可以依据研究的具体目的,选择率的两两比较,亦可选择与共用对照比较。
但在具体分割过程中,需根据比较的次数合理地修正检验水准α,否则将人为地增大犯一类错误的概率
2、卡方统计量公式
(基本公式)
v=(R-1)×(C-1)
3、应用条件
多组样本间互相独立
对样本量的要求
R×C交叉表没有校正公式,若理论频数过小,或1/5以上格子的理论频数小于5,则要考虑合理合并行或列,或增加样本量
若有一个格子的理论频数小于1,则应采用Fisher确切概率法
双向无序资料直接应用,若为单向有序或双向有序则需要进一步考虑
4、有序分类资料(R×C交叉表)的统计分析
单向有序R×C交叉表
分组有序,指标无序
视为无序分类,采用卡方检验
分组无序,指标有序
Wilcoxon秩和检验
Kruskal-Wallis H秩和检验
双向有序R×C交叉表
属性不同
差异性检验
视为单向有序,采用Kruskal-Wallis H秩和检验
关联性分析
Gamma检验、线性趋势检验
属性相同
一致性检验(Kappa检验)
差异性检验:配对资料
配对四个表
1、应用场景
eg.用两种不同的方法对同一患者进行检测
2、计算检验统计量
在H0成立下,b与c两个格子理论频数都应该为(b+c)/2
(b+c)≥40
配对卡方公式
(b+c)<40
配对卡方校正公式
配对R×R交叉表
检验统计量
k=R,自由度为v=k=1
注意与独立R×C交叉表自由度进行区分
差异性检验总结
独立性:同一份样本不同属性是否有关联 差异性:不同样本所代表的总体率是否有差异
独立性检验
基本思想
一般的变量X和变量Y相互独立是指变量X的概率分布与Y的概率分布互不相关,即称其为独立随机样本。反之,则认为分类变量的概率分布彼此相关,这常见于一份随机样本同时按两种不同属性分类。
不同情形下的独立性检验
数据形式:2×2交叉表、无序分类R×C交叉表、配对四格表
分析结果
卡方值
列联系数
2×2交叉表
2×2交叉表的差异性比较/独立性检验之间的区别
2×2交叉表、R×C交叉表:难点在于对抽样及资料呈现形式的辨别,公式与差异性检验一致
配对四格表
依据研究目的(提问方式)进行判断
思考:配对2×2交叉表,率的他异性比较/独立性检验对应的卡方统计量计算公式不同,该如何选择?
独立性检验:是否存在关联
(基本公式)
(2×2四格表专用)
率的差异性检验:率是否相同
该公式不能用于独立性检验
解题思路
回顾上面:“分类资料分析步骤”
分类资料的分析
详见“计算题总结”
差异性检验
分类资料 (k=1)
正态或样本量较大
正态近似法,单样本Z检验
不满足正态性
基于二项分布的确切概率法
推断样本所代表的总体率与给定总体率间是否存在差异
分类资料 (2×2)
完全随机设计
n≥40且各个格子理论频数T≥5
成组卡方检验
n≥40,但出现一个格子1≤T<5
卡方检验公式需校正
n<40或任意一个格子的理论频数T<1
Fisher确切概率法
凡是能用Z检验做两个率比较的资料,都可用四格表卡方检验
配对设计
(b+c)≥40
配对卡方公式
(b+c)<40
配对卡方校正公式
双向无序分类 (R×C)
完全随机设计
不宜有1/5以上格子的1<T<5,或任一格子T<1
行×列表资料的卡方检验
有1/5以上格子的T<5,或任一格子T<1
Fisher确切概率法
单向有序分类 (R×C)
完全随机设计
分组变量有序,指标变量无序
相当于:分析不同组间的构成比
行列表资料的卡方检验
分组变量两分类无序,指标变量多分类有序
相等于:两个独立样本等级强度的差异
Wilcoxon秩和检验
分组变量多分类无序,指标变量多分类有序
相当于:多组独立样本等级强度的差异
Kruskal-Wallis H 秩和检验
重点关注:分析指标是否有序
不同处理组的病变率 不同性别组的膳食结构 不同处理组的疗效 不同年龄组的患病人数 不同年龄组的疗效
双向有序分类 (R×C)(属性不同)
完全随机设计
两个有序分类变量间有无差别
可视指标变量为单向有序R×C表资料,选用Kruskal-Wallis H秩和检验
两个有序分类间是否有相关关系
Gamma系数/等级相关分析
两个有序分类变量间是否有线性变化趋势 (如剂量-反应关系)
有序分组资料的卡方线性趋势检验
双向有序分类 (R×C)(属性相同)
实质是2×2配对设计的扩展,即水平数≥3的诊断试验配伍设计
完全随机设计
一致性检验:分析两个有序分类变量的一致性
一致性检验或Kappa检验
独立性分析
两分类资料 (2×2)
完全随机设计
两个独立分类变量是否独立
配对设计
两个配对分类变量是否独立
双向无序分类 (R×C)
完全随机设计
分类变量是否独立
卡方检验+列联系数
双向有序分类 (R×R)(属性相同)
Gamma系数
统计推断——基于秩的非参数检验
参数检验与非参数检验
区别
参数检验是指已知总体分布类型(如正态分布)时,根据样本数据对总体分布的统计参数(如均值,方差等进)行推断,如t检验,F检验。
非参数检验是不依赖总体分布类型,也不对总体参数进行推断,根据样本数据对总体的分布形式或特征进行推断,如卡方检验,秩和检验
卡方检验:所涉及的卡方分布是指卡方值的分布,卡方值是一个理论数,并不是总体的一个参数;其次,卡方检验检验的是样本是否符合某理论分布,不是对总体的参数进行推断的,因此卡方检验属于非参数检验
非参数检验的特点
适用范围广
除了总体分布不明确的定量资料外,也可用于等级资料,或含有不确定界限(如>40h或0.5mg以下等)的超限值资料。它不像参数统计方法对总体分布等有特殊限定和应用条件,适合处理更多种分布的情形
具有稳健性
参数检验是建立在严格的假设的条件之上的,一旦不满足假设条件,其推断结论的正确性很难保证,而非参数检验一般带有最弱的假定,所受的限制条件少,稳定性好,应用较广
基于秩的非参数检验
秩和检验又称顺序和检验,是一种基于秩的非参数检验方法
1、秩的本质:实测数据按一定规则,比如从小到大排列,按照次序编号,称为秩(秩次)
2、秩和:按照一定的规则,求出秩的和
3、基于秩的统计推断:通过秩及其统计量的分布对所对应总体的分布进行比较
将原始数据的信息转化为秩次,再对秩次进行分析的假设检验都是秩和检验
秩和检验对总体分布的形状差别不敏感,只对总体分布的位置差别敏感
总结
不同情形下的非参数检验
回顾:“定量资料分析步骤”
回顾:“分类资料分析”
1、不同设计类型的参数检验与非参数检验
2、不同设计类型对应的非参数检验方法
3、秩和检验的假设检验及编秩过程
注意编秩规则
Wilcoxon符号秩和检验编秩时,若遇到差值绝对值相等,若符号相同,可顺序编秩,也可平分秩次,若符号不同,则平分秩次并记为原来的符号
4、秩和检验方法的应用条件和计算公式
适用类型
应用条件
参数
计算公式
Wilcoxon符号秩和检验
5 ≤n ≤50 (赵耐青版本)
样本量n
查表法
n>50
样本量n
(校正公式)
Wilcoxon秩和检验
n1≤10(较小组数为n1) |n1-n2|≤10
n1、|n1-n2|
查表法
n1、n2较大时 (n1>10或n2-n1>10)
n1、n2
(校正公式)
小结
1、查T界值表
若检验统计量T在上、下界值范围内,则其P值大于相应概率。若T值在上、下界值范围外,则其P值小于相应概率
2、Wilcoxon秩和检验
标准正态转换(Z)+连续性校正
等秩矫正
3、关于查表法的样本量范围各版本教材不同
Krustal-Wallis H检验
在H界值表范围内 (k=3,ni<5) (赵耐青版本)
各组样本量ni
查H界值表
超出H界值表时
v=k-1
(校正公式)
卡方近似法,查卡方界值表
Friedman 秩和检验 (赵耐青版本)
在M界值表范围内 (b ≤15且k=2、3)
处理组数k、区组数b
查M界值表
超出M界值表时
v=k-1
卡方近似法,查卡方界值表
解题思路
回顾:“定量资料分析”
回顾:“分类资料分析”
简单线性回归与相关
两对关系对比
1、回归关系与函数关系
联系:二者都是表示变量间数量依存关系的方法
区别:函数关系是一一对应的确定性关系,而回归关系不是
2、相关关系与回归关系
简单线性相关
1、线性相关的概念
两个变量之间,一个增大,另一个也相应增大(或者减小),这种现象称为共变,即两个变量之间有“相关关系”
两个随机变量之间这种呈现性趋势的关系称为线性相关,又称简单相关,简称相关。
2、相关系数的计算
计算
3、相关系数的统计推断
注意:根据样本数据求的r是样本的相关系数,它是总体相关系数的估计值,因此要判断两变量是否有相关关系,要对总体相关系数是否为0进行统计推断
1、查表法
根据v=n-2即α,查r临界值表(Pearson相关系数检验用),r的绝对值越大,概率P越小
2、t检验
建立假设检验,确定检验水准
H0:ρ=0,两个变量间无线性相关关系 H1:ρ≠0,~~~有线性相关关系 α=0.05
计算检验统计量
t检验
v=n-2
确定P值,作出统计推断
3、置信区间
1、一般情况下(ρ≠0)时,r的抽样分布并不对称,无法利用正态分布理论对ρ进行统计推断
2、利用数理理论和蒙特卡罗模拟显示,按下式对r作变换后的zr具有近似正态性:
r的取值范围为(-1,1),开区间
zr是单调增函数
3、服从均数为,标准差为的正态分布
4、故的1-α置信区间计算公式如下:
5、则总体相关系数的ρ的1-α置信区间:
4、秩相关
计算
5、相关分析应用的注意事项
1、在进行相关分析之前,应该先绘制散点图
2、作相关分析时要注意是否有实际意义
3、相关关系不一定是因果关系
4、线性相关的前提条件是两变量服从双变量正态分布
5、分层资料盲目合并容易造成假象
简单线性回归
1、概念及其计算
概念:直线回归分析:当某一变量你Y随着另一变量X的变动而变动,其散点图呈现直线趋势,则统计上这种研究两个变量间的数量依存关系的统计方法叫做线性回归分析,也称为简单线性回归分析。其中Y是因变量,表示被估计或被预测的变量,X是自变量表示因变量Y所依存的变量
易错描述
直线回归分析用于刻画因变量Y对自变量X在数值上的相关关系(×)
描述的是反应变量如何随解释变量x改变而改变,即两变量间的数量依存关系(√)
直线回归方程的拟合方法的原则是各观测点距直线的垂直距离平方和最小(×)
是纵向距离平方和最小(√)
总体线性回归模型与样本回归方程
简单线性回归的计算
最小二乘估计:各实测点到回归直线的纵向距离的平方和最小
和分别表示x的离均差平方和、x与y的离均差积和。
问:b≠0是否说明总体中(即β≠0)呢?→统计推断
2、简单线性回归中的统计推断
b≠0的原因
由于抽样误差引起的,总体回归系数β=0
确实存在线性回归关系,总体回归系数β≠0
方差分析
方差变异度分析
基本思想
称为总离均差平方。既不考虑y与x的回归关系时y的总变异。
称为回归平方。在中,由于无论回归关系如何,特定样本的均数不变,故此部分变异是由于的不同造成的,而不同正是由于两变量的回归关系引起的。因此反映了在y的总变异中可以用y与x的回归关系所解释的部分,也即y的总变异中由于y与x的回归关系而使y的总变异减少的部分。越大,说明回归效果越好。
即我们可以用回归方程预测的
称为残差平方和。他反映了除x对y的回归关系影响之外的所有一切因素对y的变异的作用,也即在总平方和中无法用回归关系解释的部分,表示考虑回归关系之后y的变异。在散点图中,各实测点离回归直线越近,越小,说明直线回归的拟合越好
t检验
1、建立检验假设,确定检验水准
H0:即自变量X与因变量Y无线性回归关系
H1:即自变量X与因变量Y有线性回归关系
2、计算检验统计量t值
关注其自由度
Sb:表示样本回归系数的标准误
SYX:表示去除X影响后Y的变异程度,即剩余标准差
3、确定P值,作出统计推断
P≤0.05,则两变量之间存在直线回归关系
P>0.05,则两变量之间不存在直线回归关系
总体回归系数β的区间估计
点估计:样本值代替
区间估计
意义:若区间不包括0,说明按照现有的检验水准β≠0。结论与前面方差分析和t检验的结论相同
3、回归方程拟合效果评价
(1)评价方法
决定系数,记为R²,定义为回归平方和与总离均差平方和之比
构成比指标
R²取值范围为[0,1],无单位。反映回归贡献的相对程度,即在因变量的总变异中用回归关系所能解释的比例,在实际应用中,也常用决定系数来反映回归拟合的实际效果,另外决定系数除作为反映回归拟合效果的统计量,还可用来对回归效果做假设检验,此拟合优度检验等价于对总体回归系数的假设检验
(2)注意事项
方差分析、t检验判断回归关系是否存在,而决定系数R²反映自变量X对因变量Y的影响大小。一个拟合良好的回归方程应该具有较小的P值(P≤0.05)和较大的决定系数R²(大于0.7)
4、利用回归方程进行估计和预测
因变量的总体均数置信带
(1)点估计
(2)区间估计
因变量的个体值预测带
5、相关分析应用的注意事项
1、在进行相关分析之前,应该先绘制散点图
判断两变量间是否存在线性趋势
判断资料是否存在异常点
2、作回归分析时要注意是否有实际意义
3、回归关系不一定是因果关系
4、两变量间无线性回归关系,不代表两者没关系
5、分层资料盲目合并容易造成假象
6、线性回归方程的适用范围以自变量的取值范围为限,应避免外延
7、线性回归模型的适用条件(LINE):线性、正态、独立、方差相等
多重回归
多重线性回归
回归方程是否有意义的假设检验
通过对回归方程进行方差分析,以确定回归方程是否有统计学意义
H0 :β1=β2=β3=0 H1 :各βi不全等于0
前提条件
线性、独立、正态、等方差
偏回归系数的含义
当方程中其他解释变量保持不变时, Xi变化一个单位, Y 平均变化βi个单位
标准化偏回归系数
比较自变量对因变量的影响
偏回归系数不能说明自变量对因变量的影响!因为每个解释变量都具有各自的计量单位以及不同的变异程度,所以不能直接利用偏回归系数的数值大小比较方程中各个解释变量对反应变量 y 的影响大小。
方法:可以首先将原始观测数据进行标准化,根据标准化的数据拟合回归模型,此时得到的回归系数称为标准化偏回归系数。标准化偏回归系数的绝对值越大的解释变量在数值上对反应变量Y的影响越大
自变量筛选的方法
最优子集法
结果最优
向后剔除法
向前引入法
逐步筛选法
生存分析
1、寿命表法适用于样本例数较多时的频数表资料
2、对数秩检验( log - rank 检验)是比较多组生存曲线的一种常用的非参数检验方法
不用于估计生存率
3、乘积极限法,又称 Kaplan - Meier 法、简记为 K - M 法。该方法是一种非参数的估计生存率的方法。 K - M 法一般用于观察对象数目较少的未分组资料,它能够充分利用每条记录的信息,估计不同生存时间点的生存率
非参数的估计生存率的方法
寿命表
类型
现时寿命表:数据来源于横断面调查,以获得某年(或某一时期内)所有年龄组死亡率作为已知数据,然后人为假定同时出生的一代人(一般为10万人)按照这些年龄组死亡率先后死去,直至全部死亡,分别计算出这一代人在不同年龄组的“死亡概率”、“死亡人数”、“尚存人数”及期望寿命等指标,由此编制现时实寿命表
寿命表:是一种呈现不同年龄组死亡概率、期望寿命及相关指标的表格,反映某群体的生命全过程情况,是对人体整体健康状况及死亡的综合测量指标
定群寿命表:也称为队列寿命表,数据由随访观察获得,反映某一人群(事先确定了队列)的死亡经历的寿命表
完全寿命表:年龄组是每1岁为1组,刚出生不足1岁记为“0~”,实足1岁到不足2岁记为“1~”
简略寿命表:其年龄区间是[x,x+n),除0岁组外,其他年龄区间的n均大于1,典型的年龄区间是0~,1~,5~,10~,…,85~。该寿命表的年龄区间5岁以前不等距,5岁以后一般等距