导图社区 MPH卫生统计学考研知识点总结
浙江大学MPH公共卫生硕士考试大纲和知识点总结,如: 1.重点掌握卫生统计学中的基本概念、基本指标和基本方法。熟悉卫生统计的基本步骤。 2.掌握统计图表的制作要求和应用条件。
编辑于2023-04-06 11:38:19卫生统计学
1.重点掌握卫生统计学中的基本概念、基本指标和基本方法。熟悉卫生统计的基本步骤。
统计学是收集、分析、解释与呈现数据资料的一门科学
收集数据:实验设计、调查设计
分析数据:统计学描述、统计学推断
解释数据:根据专业等解释统计结果
呈现结果:向杂志社、上级部门发表结果
统计学
统计学研究对象:不确定现象(随机现象)
统计学研究方法:通过大量重复观察,发现不确定现象背后隐藏的统计学规律。
统计推论的基础:在一定条件下,不确定现象发生的可能性,即概率(probability)。
医学统计学在医学研究中的运用主要有三个方面:
1、以正确的方式收集数据,如实验设计、调查设计、抽样方法、样本估计方法等。
2、描述数据的统计特征,如数据化简、统计指标的选择与计算、统计结果的表达等。
3、统计分析及得出正确结论,如根据概率分布,对实验和观察结果存在的差异和关联作出统计推断。
统计学
第一部分
统计描述
表格和图形
寿命表
统计推断
t检验、卡方检验
方差分析
相关与回归
第二部分
统计设计
干预研究
动物实验
临床试验
观察性研究
现代统计
多重回归
Logistics回归
Cox回归
Meta分析
统计工作的基本步骤
1、统计设计:包括调查、实验设计
2、收集资料:取得准确可靠的原始资料
3、整理资料:对资料进行清理、改错,数量化
4、分析资料:统计描述、统计推断
数据类型
计数资料
按某种属性分类,然后清点每类的数据,称计数资料,也叫定性数据
特点:无固有计量单位
计量资料
用仪器、工具等测量方法获得的数据,即为计量资料。也叫定量数据
特点:有计量单位
等级资料
半定性或半定量的观察结果。有大小顺序,也叫有序分类资料。
如癌症分期:早、中、晚
三类资料间关系
基本概念
随机变量及其分类
变量概念
定性变量(Qualitative variable)
分类变量(Categorical variable)
有序变量 (Ordinal variable)
定量变量(Quantitative variable)
离散型变量 (Discrete variable)
连续型变量 (Continuous variable)
变量分类
离散型变量,相当于计数资料
连续性变量,相当于计量资料
有序变量,相当于等级资料
变量类型的转化:连续型→有序→分类→二值
同质与变异
同质:指事务的性质、影响条件或背景相同或非常相近
没有同质性就构不成一个总体
变异:指同质的个体之间的差异
总体内没有变异性就无需统计学
总体与样本
总体(population):根据研究目的确定的同质研究对象的全体(合集)。 分有限总体与无限总体
目标总体(target population): 试图下结论的某个总体
研究总体(study population) : 资料来源的较小的总体
样本:从总体中随机抽取的部分观察单位
为保证样本的可靠性和代表性,需要采用随机的抽样方法(在总体中每个个体具有相同的机会被抽到)
抽样(sampling):从研究总体抽取部分个体
数据(data):观察所得资料
信息(information):数据分析的产物
推断inference
data
information
knowledge
参数与统计量
参数:总体的统计指标,如总体均数、标准差。固定的常数
统计量:样本的统计指标,如样本均数、标准差。参数附近波动的随机变量
误差
实际观察值与客观真实值之差
系统误差
在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差,流行病学称之为偏倚
特点:观察值有系统性、方向性、周期性的偏离真值
可以通过严格的实验设计和技术措施消除
随机误差
排除系统误差后尚存的误差,受多种无法控制的因素的影响
特点:大小方向不一的随机变化
随机测量误差
提高操作者熟练程度可以减少这种误差
随机抽样误差
由抽样造成的样本统计量和总体参数间的差异
不可避免,但有一定的分布规律,可估计
概率
确定性现象:在一定条件下,一定会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫必然事件;肯定不发生某种结果的叫不可能事件
随机现象:在同样条件下可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为随机事件。随机事件的特征:1、随机性;2、规律性:每次发生的可能性的大小是确定的。
概率:随机事件发生的可能性大小,用大写的P表示;取值[0,1]
小概率事件
必然事件P=1
不可能事件P=0
随机事件0<P<1
P<=0.05(5%)或P<=0.01(1%)称为小概率事件,统计学上认为不大可能发生
概率的加法律
设有两个事件,若其中的任何一个发生时,另一个不可能发生,则称这两个事件为互斥事件。当这两个互斥事件的任何一个都有可能发生时,其概率是这两个事件单独发生的概率之和。
概率的乘法律
设有两个或多个事件,当其中一个事件的发生并不影响其他事件是否发生时,则称这些事件为相互独立事件。若两个或多个独立事件都同时发生时,其概率是这些事件单独发生的概率之乘积。
条件概率
假定有疾病A和条件B,用P(A)表示疾病A发生的无条件概率,P(A|B)表示在条件B存在的情况下,疾病A发生的条件概率。若P(A|B)=P(A),则表示条件B与疾病A无关,若P(A|B)≠P(A)则表示条件B影响了疾病A发生的概率。
在实际应用中,通常把治疗措施作为条件,分析治疗的实施情况(治疗或不治疗等)和疾病预后的关系。在流行病学研究中也常把可疑的致病因素或对疾病的干预措施视为条件,分析某疾病发病率的变化是否与某些条件有关
频率
样本的实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现f次,则事件A的出现的频率为f/n
频率与概率间的关系
样本频率总是围绕概率上下波动
样本含量n越大,波动幅度越小,频率越接近概率
动态数列是一系列按时间顺序排列起来的统计指标(包括绝对数、相对数及平均数等)。它说明事物在时间上的变化和发展趋势。按时间特点可分为时点动态数列和时期动态数列;按基期特点可分为定基比和环比
常用概率分布
分布:随机变量的取值规律
分布函数:描述分布的规律
变量类型
连续型变量
如:正态分布
离散型变量
如:二项分布,泊松分布
二项分布
二项分布的概率函数P(X)可用公式
其中
对于任何二项分布,总有
1. 二项分布的条件:
1) 每次实验结果,只能是两个互斥的结果之一。
2) 相同的实验条件下,每次实验中事件A的发生具有相同的概率π。
3) 各次实验独立,各次的实验结果互不影响。
2. 二项分布的特征
1. n,π是二项分布的两个参数,所以二项分布的形状取决于n,π。
2. 当π =0.5时分布对称,近似对称分布。
3. 当π ≠0.5时,分布呈偏态,特别是 n 较小时,π 偏离0.5越远,分布的对称性越差,但只要不接近1和0时,随着 n 的增大,分布逐渐逼近正态。
4. 当 π 或 1 π 不太小,而 n 足够大,通常 nπ 和 n(1 π) 均大于或等于5,我们常用正态近似的原理来处理二项分布的问题。
3. 二项分布的均数和标准差
对于任何一个二项分布B(n,π),如果每次试验出现“阳性”结果的概率均为π,则在 n 次独立重复实验中,出现 X 次阳性结果
总体均数为
标准差为
如果以率表示,将阳性结果的频率记做为
则P的总体均数
总体标准差为
是频率P的标准误,反映阳性频率的抽样误差的大小
Poisson分布
Poisson分布是一种离散型分布,用于描述单位时间、空间、 面积等的罕见事件发生次数的概率分布
Poisson分布要求观察结果相互独立,发生的概率p不变
Poisson分布一般记作P(λ),其概率函数为
式中,λ=nπ为Poisson分布的总体均数; X 为观察单位内某稀有事件的发生次数; e 为自然对数的底,为常数,约等于2.71828
随着λ的增大,Poisson分布逐渐趋于对称分布
当λ>20时,Poisson分布可视为近似正态分布
Poisson分布具有以下特性:
(1)总体均数与总体方差相等:均为λ 。
(2)可加性:
从总体均数分别为λ1 和λ2 的两个Poisson分布总体中各自随机抽出一份样本,其中稀有事件的发生次数分别为X1 和X2 ,则合计发生数 T=X1 +X2 也服从Poisson分布,总体均数为λ1+λ2 。
关系
正态分布
正态分布的特征
1.关于x=μ对称。即正态分布以均数为中心,左右对称。
2. 在x=μ处取得概率密度函数的最大值,在x=μ±δ处有拐点,表现为钟形曲线。即正态曲线在横轴上方均数处最高。
3. 正态分布有两个参数,即均数µ和标准差σ。µ是位置参数, σ是变异度参数(形状参数)。常用N(µ,σ²)表示均数为μ,标准差为σ的正态分布;用N(0,1)表示标准正态分布。
4. 正态曲线下面积分布有一定规律。横轴上正态曲线下的面积等于1(也常写作100%)。
标准正态分布
均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布。
正态分布是一种对称分布,其对称轴为直线X=µ,即均数位置,
理论上:
µ±1σ范围内曲线下的面积占总面积的68.27%
µ±1.96σ范围内曲线下的面积占总面积的95%
µ±2.58σ范围内曲线下的面积占总面积的99%
实际应用中:
X ±1S范围内曲线下的面积占总面积的68.27%
X ±1.96S范围内曲线下的面积占总面积的95%
X ± 2.58S范围内曲线下的面积占总面积的99%
标准正态分布的µ=0,σ=1,则
µ±σ相当于区间(1,1),
µ±1.96σ相当于区间(1.96,1.96),
µ±2.58σ的区间相当于区间(2.58,2.58)。
区间(1,1)的面积:12Φ(1)=12×0.1587=0.6826=68.26%
区间(1.96,1.96)的面积:12Φ(1.96)=12×0.0250=0.9500=95.00%
区间(2.58,2.58)的面积:12Φ(2.58)=12×0.0049=0.9902=99.02%
正态分布的应用
1. 确定医学参考值范围
参考值范围(reference range):指特定的“正常”人群的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在的范围
1. 正态近似法:适用于正态分布或近似正态分布的资料。
2. 百分位数法:适用于偏态分布资料。
2. 质量控制图
控制图基本原理:如果某一波动仅仅由个体差异或随机测量误差所致,那么观察结果服从正态分布
判断异常的8种情况是:
有一个点距中心线的距离超过3个标准差(控制限以外)
在中心线的一侧连续有9个点
连续6个点稳定地增加或减少
连续14个点交替上下
连续3个点中有两个点距中心线距离超过2个标准差(警戒限以外)
连续5个点中有4个点距中心线距离超过1个标准差
中心线一侧或两侧连续15个点距中心线距离都在1个标准差以内
中心线一侧或两侧连续8个点距中心线距离都超出1个标准差范围
参数估计基础
样本均数的抽样分布与抽样误差
误差泛指实测值和真实值之差。按其产生原因与性质分两大类:系统误差和随机误差。抽样误差是一种随机误差。
抽样误差由于生物固有的个体变异,从某一总体中随机抽取一个样本,所得样本统计量与相应总体参数往往是有差异的,这种差异称为抽样误差(sampling error)
误差产生的原因
系统误差:由受试对象、研究者、仪器设备、研究方法等确定性原因造成,有倾向性,可避免。
随机误差:由多种无法控制的偶然因素引起的,无倾向性,不可避免。
抽样误差:产生的根本原因是个体变异、产生的直接原因是抽样。
正态分布总体样本均数抽样分布具有以下特点:
样本均数恰好等于总体均数极其罕见;
样本均数之间存在差异;
样本均数围绕总体均数,中间多、两边少,左右基本对称,呈近似正态分布;
样本均数间的变异小于原始变量值间的变异。
中心极限定理表明
从正态总体N(µ,σ²)中随机抽取例数为 n 的多个样本,样本均数服从正态分布;即使是从偏态总体中随机抽样,当 n 足够大时(如 n>30),样本均数也近似正态分布,且样本均数的均数等于原分布的均数
均数抽样误差
由固然存在的个体变异和抽样造成的样本均数与样本均数及样本均数与总体均数之间的差异称为均数的抽样误差
样本频率的抽样分布与抽样误差
样本频率抽样误差
从同一总体中随机抽出观察单位相等的多个样本,样本率与总体率及各样本率之间都存在差异,称为频率的抽样误差。
样本频率的标准误
表示样本频率抽样误差大小的指标即为频率的标准误。
频率的标准误愈小,用样本频率估计总体概率的可靠性愈好;反之,用样本频率估计总体概率的可靠性愈差。
频率的标准误与样本含量 n 的平方根成反比,增加样本含量可以减少样本频率的抽样误差。
t 分布的概念与特征
t 分布的概念
在统计应用中,可以把任何一个均数为µ,标准差为σ的正态分布N(µ , σ² )转变为 µ=0 σ=1的标准正态分布,即将正态变量值 X 用 Z = (X-µ)/σ 来代替。
由于 X 服从正态分布,故
服从标准正态分布N (0,1)。
实际资料的分析中,由于σ 往往未知,故标准化转换演变为:
服从 υ = n1 的 t 分布,即:
t 分布曲线特点:
1. t 分布曲线是单峰分布,它以0为中心,左右对称。
2. t 分布的形状与样本例数 n 有关。自由度越小,则Sx 越大,t 值越分散,曲线的峰部越矮,尾部则偏高。
3. 当 n→∞时,则 S 逼近 σ,t 分布逼近标准正态分布。t 分布不是一条曲线,而是一簇曲线。
正确使用 t 界值表
与单侧概率相对应的 t(a,v) 值用 表示,与双侧概率相对应的t(a/2,v) 值用 表示。
由于 t 分布是以0为中心的对称分布,表中只列出了正值,故查表时,不管 t 值正负只用绝对值表示。
总体均数和概率的区间估计
参数估计的概念
统计推断包括参数估计和假设检验。参数估计就是用样本指标(统计量)来估计总体指标(参数)。
参数估计
点估计(point estimation)
用样本统计量直接作为总体参数的估计值
区间估计(interval estimation)
按预先给定的概率(1-α)估计总体参数的可能范围,该范围就称为总体参数的1-α置信区间(confidence interval, CI) 。
预先给定的概率(1-α)称为置信度,常取95%或99%。如无特别说明,一般取双侧95%。
置信区间由两个数值即置信限(下限和上限)构成
总体均数的区间估计
总体均数置信区间的计算
σ 已知
按标准正态分布原理计算,由 Z分布,标准正态曲线下有95%的 Z 值在±1.96之间。
通式(双侧):
σ未知,但样本例数 n 足够大(n>50)时
由 t 分布可知,自由度越大,t 分布越逼近标准正态分布,此时t 曲线下约有95%的 t 值在±1.96之间
σ未知且样本例数n较小时
按t分布原理,此时某自由度的t曲线下约有95%的r值在±to.o5/2(v)之间
总体概率的区间估计
总体概率的置信区间与样本含量 n、阳性频率 P 的大小有关,可根据 n 和 P 的大小选择以下两种方法。
1. 正态近似法
当样本含量足够大,且 P 和 1P 不太小,则样本率的分布近似正态分布。
2. 查表法
当 n 较小,如 n≤50,特别是 p 和 1p 接近0或1时,应按照二项分布的原理估计总体率的可信区间。
2.掌握统计图表的制作要求和应用条件。
统计表
统计表的结构
表号及标题
包括何时、何地、何事
标目
线条
数字
备注
统计图
统计图的结构
标题
标目
点线条面
刻度
图例
直条图(bar chart)
直条图是用等宽直条的高度表示相互独立的各项指标数量的大小
可描述离散型定量变量和定性变量的频率分布
用直条的长度表示相互独立的统计指标的大小,可分为
单式条图:具有一个统计指标,一个分组标志
复式条图:具有一个统计指标,两个分组因素
分段条图:具有两个统计指标,一个分组因素,且两个统计指标必须有隶属关系
误差条图:用条图或线图表示均数的基础上,在图中附上标准差的范围
绘制条图注意事项
纵轴的刻度必须从0开始,否则会改变各对比组间的比例关系
横轴各直条一般按统计指标由大到小排列,也可按事物本身的自然顺序排列
各直条的宽度要一致,各直条应有相等的间隔,其宽度一般与直条的宽度相等或为直条宽度的一半
圆图
用于表达事物内部的百分构成比大小
各个扇形面积的大小反映了各组成部分百分比的大小
从12点钟处开始绘制,顺时针方向排列
百分条图
作用与圆图相同,更适用于多组百分比的比较
线图
普通线图
用线段的升降表示某事物动态变化,或某现象随另一现象变迁的情况(绝对差)
适用于连续性资料
纵轴:算术尺度;横轴:连续型变量(时间、年龄等)
半对数线图
表示事物发展速度(相对比)
纵轴:对数尺度;横轴:连续性变量(时间、年龄等)
直方图(histogram)
用矩形面积表示连续性变量的频数(频率)分布
横轴:连续变量的组段;纵轴:频数或频率,尺度从0开始
各矩形条之间不留空隙
矩形的高度为频数或频率,宽度为组距
累计频率分布图(cumulative histogram)
用于描述连续型变量的累计频率分布
横坐标:变量的组段
纵坐标:各组段的累计频率
纵轴为0.25、0.50和0.75时所对应的横轴尺度分别为下四分位数、中位数和上四分位数
箱式图(box plots)
箱式图可综合描述定量变量的平均水平和变异程度,还可显示数据中的离群值(outlier)或极端值(extreme case)
描述分布特征
散点图
用点的密集程度和趋势表示两种现象间的相关关系
横轴:自变量X;纵轴:应变量Y
纵轴与横轴的起点可根据资料的情况而定
统计地图
用于表示某现象的数量在地域上的分布
各种统计图适用的资料类型与分析目的
3.重点掌握三种不同类型资料(数值变量资料、无序分类变量资料和有序分类变量资料)的统计描述和统计推断方法。
统计描述
计量资料的统计描述
当变量值个数较多时,对各变量值出现的频率列表即为频率分布表(frequency distribution table),简称频率表
频率分布表的图形表示即为频率分布图
离散型定量变量的频率分布图可用直条图(bar graph)表达
用途
1、揭示资料的分布类型(对称分布、正偏峰分布、负偏峰分布)
2、揭示变量的分布特征
集中趋势
离散趋势
3、便于发现某些离群值或极端值
4、便于进一步计算统计指标和统计分析
频数表与频数分布
频数表的编制步骤
1、求极差
即最大值与最小值之差,又称为全距R
2、决定组数、组段和组距
根据研究目的和样本含量n确定
组距=极差/组数,通常分10-15个组,为方便计,组距参考极差的十分之一,再略加调整
下限:组段的左端点
上限:组段的右端点
3、列出组段
第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其他组段上限值忽略
4、划记计数
用划记法将所有数据归纳到各组段,得到各组段得频数
频数表的分布特征
1、集中趋势
变量值集中位置
平均水平指标
2、离散趋势
变量值围绕集中位置的分布情况
变异水平指标
正态分布与偏态分布
正态分布
中间高、两边低、左右对称
均数=中位数=众数
右偏态/正偏态
长尾向右延伸
均数>中位数>众数
左偏态/负偏态
长尾向左延伸
均数<中位数<众数
平均指标
平均数
反映了资料的集中趋势
算数均数,适用于对称分布
几何均数,适用于观察值变化范围跨越多个数量级的资料
中位数,适用于各种分布的定量资料,特别是偏峰分布资料。
算术均数
简称均数(mean)
适合描述对称分布资料的集中位置,也称平均水平
适用条件:资料呈正态或近似正态
计算
直接法
频率表法
对于样本含量较大的数据集,可以在编制频率表的基础上计算均数的近似值。
几何均数(geometric mean,G)
适用条件:呈倍数关系的等比资料或对数正态分布(正偏倚)资料
适用于原始观察值分布不对称或观察值变化范围跨越多个数量级的资料,但经对数转换后呈对称分布的变量,如服从对数正态分布的变量
同一资料,几何均数<均数
中位数(median,M)
将一批数据从小至大排列后位次居中的数据值,符号为Md,反映一批观察值在位次上的平均水平
适用条件:适合各种类型的资料。尤其适合于:1、大样本偏态分布的资料,2、资料有不确定数值,3、资料分布不明等
适用于各种分布的定量资料,特别是偏峰分布资料
特点:仅仅利用了中间的1-2个值
频数表资料的中位数
对频率表资料,可通过百分位数法近似计算中位数
百分位数(percentile)是指将n个观察值从小到大依次排列后,对应于x%的数值
众数(mode)
出现次数(或频数)最多的观察值;在频数分布图中对应于高峰所在位置的观察值。
适用于大样本;较粗糙
变异指标
变异指标反映数据的离散度。即个体观察值的变异程度
极差较粗,适合于任何分布
标准差与均数的单位相同,最常用,适合于近似正态分布
变异系数主要用于单位不同或均数相差悬殊资料
平均指标和变异指标分别反映资料的不同特征,常配套使用,如
正态分布:均数、标准差
偏态分布:中位数、四分位半间距
同一总体中不同个体间存在的差异称为变异(variation)
极差/全距
R=最大-最小
优点:简便
缺点:1、只利用了两个极端值,2、n大,R也会大,3、不稳定
百分位数与四分位间距
百分位数:数据从小到大排列;在百分尺度下,所占百分比对应的值。记为Px
四分位间距:QR=P75-P25
四分位半间距:QD=QR/2
百分位数的应用
确定医学参考值范围
如95%参考范围=P97.5-P2.5,表示有95%正常个体的测量值在此范围
中位数Md与四分位半间距QD一起使用,描述偏态分布资料的特征
四分位数间距Q是总体中数值居中的50%个体散布的范围
Q越大意味着数据间变异越大
方差
也称均方差,样本观察值的离均差平方和的均值。
表示一组数据的平均离散情况
总体方差
样本方差
方差越大意味着数据间变异越大
标准差
即方差的正平方根,其单位与原变量X的单位相同
样本标准差S
标准差越大意味着个体间变异越大
变异系数CV
适用条件:1、观察指标单位不同,2、同单位资料,单均数相差悬殊
主要用于不同变量间变异程度的比较,尤其是量纲不同的变量间的比较
CV=S/均数
描述分布形态统计指标
偏度系数(coefficient of skewness,SKEW)
总体偏度系数为0时,分布是对称分布
取正值时,分布为正偏峰
取负值时,分布为负偏峰
峰度系数(coefficient of kurtosis,KURT)
正态分布的总体峰度系数为0
取负值时,其分布较正态分布的峰平阔
取正值时,其分布较正态分布的峰尖峭
计数资料的统计描述
计数资料的数据整理
计数资料:按某种属性分类,然后清点每类的数据
常用相对数指标
频率型指标
率:说明某现象或某事物发生的频率或强度
率=(实际发生数/可能发生总数)X比例基数K
率指标不能直接相加
强度型指标
强度:单位时间内某事件发生的频率
强度=发生某事件的观察单位数/∑(可能发生某事件的单位数*观察时长) *K
相对比型指标
相对比:是A、B两个有关指标之比,说明A是B的若干倍或百分之几,通用用倍数或分数表示
构成比:说明某一事务内部,各组成部分所占的比重,也叫百分比
应用注意事项
不能以构成比代替率
计算相对数的分母不宜过小,小则直接叙述
进行率的对比分析时,应注意资料可比性
正确求平均率
医学人口统计
统计资料来源
日常工作记录(报告单、卡、册)
统计报表
人口调查(抽查和普查)
描述人口学特征的常用指标
人口总数
人口学特征指标
性别、年龄、文化、职业等
生育和人口死亡的常用指标
测量生育水平的统计指标
粗出生率
总生育率
年龄别生育率
总和生育率
测量人口再生育的统计指标
自然增长率NIR
是粗出生率(CBR)与粗死亡率(CDR)之差,即NIR=CBR-CDR
粗再生育率GRR
是指每个妇女一生平均生育的女儿数,GRR = 总和生育率×女婴占出生婴儿的比例
净再生育率NRR
是在粗再生育率的基础上扣除了母亲一代所生的女儿中0-49岁的死亡数,剩下的即为真正能取代母亲一代的女儿数
死亡统计指标
测量死亡水平的指标
粗死亡率(crude death rate,CDR), 简称死亡率(mortality rate),指某地某年平均每千人口中的死亡数,反映当地居民总的死亡水平。
婴儿死亡率(infant mortality rate , IMR),指某年活产儿中未满1周岁婴儿的死亡频率,是反映社会卫生状况、婴儿保健工作以及人群健康状况的重要指标之一,也是死亡统计指标中较敏感的指标。
围生儿死亡率(perinatal mortality rate)是衡量孕前、孕期、产期、产后保健工作质量的敏感指标之一。
5岁以下儿童死亡率(child mortality rate under age 5)是近些年来国际组织推荐并应用较多的综合反映儿童健康水平和变化的主要指标。
死因别死亡率(causespecific death rate,CSDR)指某种原因(疾病)所致的死亡率,也称某病死亡率。死因别死亡率是死因分析的重要指标,它反映各类病伤死亡对居民生命的危害程度。
病死率(fatality rate, FR)指在某一期间内(1年)患某病者因该病死亡的百分比,可说明一种疾病的严重程度,也可反映一个医疗单位医疗水平和质量
死因构成及死因顺位的指标
死因构成比(proportion of dying of a specific cause),也称比例死亡比(proportionate mortality rate, PMR)或相对死亡比,指全部死亡人数中,死于某死因者所占的百分比,说明各种死因的相对重要性。
死因顺位是指按各类死因构成比的大小由高到低排列的位次,说明各类死因的相对重要性。
当死者患有多种疾病和损伤时,必须从中选出一种最重要的致死原因作为死者的死因,称基本死因(underlying death cause)。
疾病统计常用指标
疾病和病因分类
疾病分类(classification of diseases)是在疾病命名法的基础上,考虑到对疾病的认识及防治需要,将一些具有共同特性的疾病归纳在一起,加以分类。
疾病统计指标
某病发病率
发病率(incidence rate,IR)表示一定时期内,在可能发生某病的一定人群中新发生某病的强度。
时点患病率
患病率(prevalence rate, PR)又称为现患率,指某时点上受检人数中现患某种疾病的频率,通常用于描述病程较长或发病时间不易明确的疾病的患病情况,如慢性病在某一时间横断面的患病情况。
分为时点患病率和期间患病率
发病率和患病率有密切关系,两者与病程(D)的关系是:PR=IR×D
期间患病率
“期间”指观察所包括的时间范围,可以年、月、旬或周为观察期间,但通常用年或月。
治愈率
治愈率(cure rate)表示受治病人中治愈的频率。有效率表示受治病人中治疗有效的频率。主要用于对急性病危害或防治效果的评价。
生存率
生存率(survival rate):指病人能活到某一时点的概率。
常用于对慢性病如恶性肿瘤及心血管病等的治疗效果评价或预后估计。
计算方法:直接法和寿命表法
残疾患病率
残疾患病率是通过询问调查或健康检查发现的残疾患者与调查(检查)人数之比,说明人群患残疾的频率。
粗率的标准化法
如果两组个体的年龄、性别、病情等变量在两组内的分布存在差异,则粗死亡率、粗发病率、粗治愈率等不能直接进行比较。
为消除两组个体其它变量分布不同的影响,需要首先对两组数据作标准化处理。
“标准”选择:
1)选定两组之一,将其作为“标准”;
2)两组合并,作为“标准”;
3)在两组之外另选一个群体,如采用全国、全省或全地区的对象,将其作为“标准”。
如果上述“某事件的发生率”为死亡率, 则实际死亡人数与期望死亡人数之比称为标准化死亡比(standard mortality ratio,SMR)。
若SMR >1, 表示被标准化人群的死亡率高于标准死亡率;
若SMR <1, 表示被标准化人群的死亡率低于标准死亡率。
应用标准化法的注意事项
1.标准化法的应用范围很广。
2. 标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。
3.标准化法的实质是找一个“标准”,使两组得以在一个共同的“平台”上进行比较。选择不同的“标准”,算出的标准化率也会不同。
4.两样本标准化率是样本值,存在抽样误差。样本小时,进行假设检验。
动态数列
动态数列(dynamic series)是按时间顺序将一系列统计指标(可以是绝对数,相对数或平均数)排列起来,用以观察和比较该事物在时间上的变化和发展趋势。
常用动态数列分析指标:
绝对增长量
绝对增长量是说明事物在一定时期增长的绝对值。可分为:
1、累计增长量
即报告期指标与基线期指标之差。
2、逐年增长量
即报告期指标与前一期指标之差。
发展速度与增长速度
发展速度与增长速度均为相对比,说明事物在一定时期的变化情况。可计算:
定基比,即报告期指标与基线期指标之比
环比,即报告期指标与其前一期指标之比
发展速度
表示报告期指标的水平相当于基线期(或前一期)指标的百分之多少或若干倍。
增长速度
表示的是净增加速度,增长速度=发展速度–100%。
平均发展速度与平均增长速度
用于概括某现象在一段时期中的平均变化
平均发展速度是发展速度的几何平均数
平均增长速度=平均发展速度-100%
动态数列的分析不仅可以总结过去,而且可以进行预测,即根据平均发展速度公式计算几年后达到的指标。
动态数列图
线图和半对数线图可以直观地描述动态数列的发展变化趋势。
线图(line chart) 线图是用线段的升降表示统计指标的变化趋势,或某现象随另一现象的变迁情况,适用于连续型变量。
分为:单式线图和复式线图
半对数线图(semilogarithmic line chart) 半对数线图用于表示事物的发展速度(相对比)。其横轴为算术尺度,纵轴为对数尺度,线图上的数量关系变为对数关系。
统计推断
参数估计
包括点估计与区间估计
假设检验
均数的抽样误差
由于个体差异导致的样本统计量与总体参数间的差别
t分布与可信区间
t分布
1.单峰分布,曲线在t=0处最高,并以t=0为中心左右对称
2.与正态分布相比,曲线最高处较矮,两尾部翘得高
3.随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布
总体均数的估计
总体均数的点估计与区间估计
点估计:由样本统计量直接估计总体参数
区间估计:在一定可信度下,同时考虑抽样误差
总体均数的可信区间
区间的可信度(如95%或99%)是重复抽样(如1000次)时,样本(如n=5)区间包含总体参数(μ)的百分数。常用100(1-α)%或(1-α)表示,α一般取0.05或0.01
总体均数差的可信区间
大样本总体均数的可信区间
t分布的极限分布时μ分布,因此对于大样本,可按正态分布原理,用μ0.05/2=1.96代替t=0.05/2,v
μ的95%CI
可信区间
95%可信区间
从总体中作随机抽样,作100次抽样,每个样本可算得一个可信区间,得100个可信区间,平均有95个可信区间包括μ(估计正确),只有5个可信区间不包括μ(估计错误)
计数资料的统计学推断
率的抽样误差与可信区间
样本率p和总体率π的差异称为率的抽样误差,用率的标准误度量
总体率的可信区间:根据样本率推算总体率可能所在的范围
样本量足够大服从正态分布
率的统计学推断
样本率与总体率比较的u检验
u检验的条件:np和n(1-p)均大于5时
两个独立样本率比较的u检验
4.掌握假设检验的基本思想,熟悉假设检验的基本步骤。
假设检验
对总体的某种规律提出一个假设,通过样本数据来推断,决定是否拒绝这一假设,这样的统计活动,称为假设检验(hypothesis testing)
总体间差异:
1.个体差异,抽样误差所致
2.总体间固有差异
判断差别属于哪一种情况的统计学检验,就是假设检验
t检验时最常用的一种假设检验之一
小概率思想:P<0.05(或P<0.01)是小概率事件。在一次试验中基本上不会发生。 P<=α(0.05)样本差别有统计学意义;P>α(0.05)样本差别无统计学意义
假设检验的步骤
1.建立假设、确定检验水准α
H0:μ1=μ2 零假设/原假设/无效假设
干预组和对照组的总体均数相等
H1:μ1≠μ2 对立假设/备择假设
干预组和对照组的总体均数不等
检验水准:α=0.05(双侧)
一般采用双侧检验
2.选定方法和计算检验统计量
根据统计推断目的、设计、资料组数、样本含量等选择方法。 如两组小样本比较用t检验、大样本比较u检验、方差齐性检验用F检验
3.查相应界值表,确定P值,作出判断
决策原则:H0成立时, 若当前情形是不太可能发生的,则拒绝H0
P=P(|t|>t统计量当前值的绝对值)
P<=α(0.05)拒绝H0,接受 H1,样本差别有统计学意义
P>α(0.05)不拒绝H0,样本差别无统计学意义
P值的意义:
在零假设成立的条件下,出现“统计量当前值及更不利于零假设的数值”的概率为P
若统计量≥当前值就拒绝零假设,则犯假阳性错误的概率为Ρ 。
规定一个“小”的概率α,称检验水准(size of a test)
如果P≤α,表明“不大可能”犯假阳性错误
P 值很小说明:“犯第Ⅰ类错误的机会小”
如果P>α,表明“颇有可能”犯假阳性错误
假设检验的两类错误
统计推断的两类错误及其概率
(1-β)即把握度:两总体确有差别,被检出有差别的能力
(1-α)即可信度:重复抽样时,样本区间包含总体参数(μ)的百分数
第Ⅰ类错误
假阳性错误,弃真
将拒绝了正确的无效假设H0称为Ⅰ类错误(type Ⅰerror)
实际情况与H0一致时,却根据统计量数值拒绝H0,这样的错误称为第Ⅰ类错误
出现第Ⅰ类错误的概率用α表示
通常称之为检验水准(level of significance),常取 α=0.05
第Ⅱ类错误
假阴性错误
将接受了错误的无效假设H0称为Ⅱ类错误(type Ⅱ error)
实际情况与H0不一致时,却根据统计量数值不拒绝H0,这样的错误称为第Ⅱ类错误
出现第Ⅱ类错误的概率用β表示
在统计学中将l-β称为检验效能(power of test),其意义是当两个总体存在差异时(即备择假设 H1:μ≠μ0成立时),所使用的统计检验能够发现这种差异(拒绝无效假设H0:μ=μ0)的能力,通常检验效能应该达到0.8左右
对于某一具体的检验,当样本量n一定时,α越小β越大,α越大β越小
检验的功效
H0实际上不成立时,根据统计量的数值拒绝H0,做对了!这样的概率,称为检验功效,记为1-β
意义:当两个总体参数的确存在差异时,所使用的统计检验能够发现这种差异的概率
影响因素:总体参数、个体差异、样本量和检验水准α
参数间差异越大,功效越大
个体差异越小,功效越小
样本量越大,功效越大
α 越大,功效越大
在假设检验结果的解释和评价中,特别是分析那些未能拒绝 H0的假设检验结果,事后估计1-β的值,有助于判断是总体的参数确实没有差别,还是由于样本量太小,而导致检验效能不足,如1-β < 80%。
假设检验注意事项
可比性
正确选用假设检验方法
差别的实际意义
判断结论时不能绝对化
单侧检验与双侧检验
报告结果应写出统计量值、具体P值,单侧时应注明
5.掌握常用假设检验方法和应用条件,主要包括z检验、t检验、χ²检验、方差分析、秩和检验、线性相关回归等。
t检验
t 检验是以 t 分布为基础的一类比较均数的假设检验方法,t 分布的发现使得小样本统计推断成为可能
t检验的应用条件为随机样本、来自正态总体、方差齐性
1. 随机样本;
2. 来自正态分布总体(小样本时) ;
3. 两独立样本比较时,要求两总体方差相等(方差齐性)
主要用于样本含量较小,总体标准差σ未知的正态分布资料
t分布曲线
①单峰分布,曲线在t=0 处最高,并以t=0为中心左右对称
②与正态分布相比,曲线最高处较矮,两尾部翘得高(见绿线)
③ 随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。
单样本t检验是推断该样本所属总体的均数与已知的某一数值有无差别。 配对设计资料的t检验着眼于差值的总体均数是否为0
单样本资料的 t 检验
推断样本所属总体的均数是否与已知值有差异
检验的假设:
H0: μ=μ0 H1: μ≠μ0 (双侧)
统计量:
分子:样本均数与μ0 的差距
分母:样本均数的标准误
t : 用标准误来度量样本均数与μ0 的差距,没有量纲
理论依据:
H0 成立时,统计量
理论:H0 成立时,统计量 t 服从自由度为 ν =n-1 的t 分布
统计推断:
事先规定一个“小”的概率a (检验水准)
若 P 值小于a ,拒绝零假设;
若 P 值不小于a ,则不拒绝零假设。
配对设计资料的 t 检验
1.随机配对设计是将受试对象按某些混杂因素(如性别、年龄等)配成对子,每对中的两个个体随机分配给两种处理(如处理组与对照组)
2.或者同一受试对象作两次不同的处理(自身对照)
优点:配对设计减少了个体差异
特点:资料成对,每对数据不可拆分
计算出各对子差值d的均数。当比较组间效果相同时,d的总体均数μd=0,故可将配对设计资料的假设检验视为样本均数与总体均数μd=0的比较,所用方法称为配对t检验方法
检验的假设:
统计量:
分子:样本差值d 的均数与0的差距
分母: d 的均数的标准误
n:对子数
已知:H0成立时,
故以α为检验水准,如果 t 大于相应的界值,则P<α,拒绝H0; 否则不拒绝 H0
两独立样本的 t 检验
抽样
从同一对象群,随机抽取两组,各接受不同处理, 或者从两个对象群,各随机抽取一组,接受相同处理
数据
两独立样本的资料
目的
检验两个总体均数是否相等
假定
两个总体均服从正态分布,方差相等(方差齐性)
1. 建立检验假设,确定检验水准
2. 计算统计量
已知,当 H0成立时,统计量服从自由度 ν = n1 + n2 - 2 的 t 分布
3. 确定 P 值,作出推断
小结
1. 两独立样本均数比较的 t 检验,前提条件为:随机样本、来自正态总体、方差齐性。
2. 若两样本所属总体方差相等,零假设成立时,检验统计量t服从自由度为n1+n2-2的t 分布
计算统计量的数值后,据此估计 P 值。
3. 若两样本所属总体方差不等,以 t' 为统计量。
样本含量不大时,近似地采用的 t 分布的临界值,自由度需要校正;
近似 t 检验(Satterthwaite近似法)
样本含量较大时,可近似采用标准正态分布的临界值。
两独立样本资料的方差齐性检验
1. 建立检验假设,确定检验水准
2. 计算统计量F
3. 确定 P 值,作出推断
查 F 分布的双侧临界值表, P>0.05,在a=0.05 的水准上不能拒绝 H0,两个样本方差的差异不具有统计学意义。 结论:不能认为两个总体方差不相等。
大样本均数比较的u检验
两样本均数比较时当每组样本量大于30(或50)时,可采用u检验;但只是近似方法
优点:简单,u界值与自由度无关
u0.05=1.96,u0.01=2.58
χ²检验
可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等
各种情形下,理论与实际偏离的总和即为卡方值,它服从自由度为v的卡方分布
四格表资料的卡方检验
1.建立检验假设,确定检验水准
H0:p1 = p 2 ,即两种药物治疗消化道溃疡的愈合率相同
H1:p1 ≠ p 2,即两种药物治疗消化道溃疡的愈合率不同
a = 0.05
2.计算统计量
3. 确定P值,做出推断
自由度为ν=(行数―1)×(列数―1)
2×2列联表χ²检验的专用公式
2×2列联表χ²检验的校正公式
2×2列联表χ²检验的注意事项
1. χ²校正公式仅用于四格表资料,对多组样本分布,一般不作校正
2. 当n<40或T<1时,校正值也不恰当,这时可以用Fisher确切概率法检验
3. 两组疗效对比的必要前提之一,是两组患者“病情相似”,这一点非常重要,只有在两组对象其他方面“同质”的前提下才能比较两个频率,才能进行列联表的χ²检验
R×C列联表χ²检验注意事项
R×C列联表χ²检验要求理论频数不宜太小,不宜有1/5以上格子的理论频数小于5,也不宜有一个理论频数小于1,否则有可能产生偏性。
如果出现理论频数不满足此要求,可考虑选择如下方法处理:
(1) 增加样本含量;
(2) 结合专业知识将该格所在行或列与别的行或列合并;
(3) Fisher确切概率法,借助软件实现。
连续性校正
卡方分布是一连续型分布,而行*列表资料属离散型分布,对其进行校正称为连续性校正,又称Yates校正
当n>=40,而1<=T<5时,用连续性校正公式
当n<40或T<1时,用Fisher精确检验
配对四格表资料的卡方检验
计算公式
计算公式的校正
拟合优度χ²检验注意事项
每组中的理论频数不小于5,否则需要合并组段
合并后样本含量仍不大,则应进行连续性校正
秩和检验
参数检验和非参数检验
参数检验的定义:
在总体分布类型已知(如正态分布)的条件下,对其未知参数检验。如 t 检验和方差分析,都是基于总体分布为正态分布、总体方差相等的前提下对总体均数进行的检验。
非参数检验的定义:
若总体分布未知或已知总体分布与检验所要求的条件不符,经数据转换也不能使其满足参数检验的条件,这时需要采用一种不依赖于总体分布形式的检验方法。这种方法不是对参数进行检验,而是检验总体分布位置是否相同,因而称为非参数检验
非参数检验是不依赖总体分布类型,也不对总体参数进行推断的一类统计方法。
非参数检验不受总体分布的限制,适用范围广,但对服从参数检验条件的资料采用非参数检验进行分析时,会降低检验效能,增加犯II类错误的概率。
非参数检验的适用条件:
1. 总体分布类型不明
2. 总体分布呈偏态分布
3. 数据一端或两端有不确定值的资料
4. 总体方差不齐
5. 有序分类变量资料
非参数统计分析方法
参数统计->已知总体分布类型,对未知参数(μ、Π)进行统计推断->依赖于特定分布类型,比较的是参数
非参数统计->对总体的分布类型不作任何要求->不受总体参数的影响,比较分布或分布位置->适用范围广;可用于任何类型资料(等级资料,或>50mg)->对于符合参数统计分析条件者,采用非参数统计分析,其检验效能较低
秩和检验是首先将数据按从小到大,或等级从弱到强转换成秩后,再求秩和,计算检验统计量━━秩和统计量,做出统计推断。
一类常用的非参数统计分析方法;基于数据的秩次与秩次之和
Wilcoxon符号秩和检验
1. 建立检验假设,确定检验水准
H0:差值的总体中位数等于0
H1:差值的总体中位数不等于0
α=0.05
2. 计算检验统计量T值
(1) 求差值d
(2) 编秩:依差值的绝对值由小到大编秩;差值为0,不编秩,且总的对子数相应减少;差值的绝对值相等,称为相持,取平均秩。
(3) 分别求正、负秩和
3. 确定P值,做出推断
(1) 查表法(n≤50)
根据n(非零对子数)和T值,查T界值
(2) 正态近似法(n>50):作正态近似检验
Wilcoxon配对符号秩和检验的基本思想
在配对样本中,由于随机误差的存在,各对差值的产生不可避免,假定两种处理的效应相同,则差值的总体分布为对称分布,并且差值的总体中位数为0。若此假设成立,样本差值的正秩和与负秩和应相差不大,均接近n(n+1)/4 ;当正负秩和相差悬殊,超出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝H0。
两组独立样本比较的秩和检验
对于计量数据,如果资料方差相等,且服从正态分布,就可以用t检验比较两样本均数。如果此假定不成立或不能确定是否成立,就应采用秩和检验来分析两样本是否来自同一总体
假定两组样本的总体分布形状相同
如果两总体分布相同->两样本来自同一总体->任一组秩和不应太大或太小->T与平均秩和n0(1+N)/2应相差不大
步骤
1.H0:两样本来自相同总体;H1:两样本来自不同总体(双侧),或H1:样本A高于样本B(单侧);α=0.05
2.编秩:两样本混合编秩次,求得R1、R2、T
相同观察值(即相同秩),不同组--平均秩次
3.确定P值作结论
1.查表法
当n1≤10,且n2-n1≤10时,查T界值表
双侧0.01<P<0.02 内大外小
按照 a =0.05水准,拒绝H0 ,可以认为两种有差别
2.正态近似法
当相同秩次较多时用校正公式
Wilcoxon秩和检验的基本思想
假设含量为n1与n2的两个样本(且n1≤n2),来自同一总体或分布相同的两个总体,则n1样本的秩和T1与其理论秩和 (N(N+1)/2)/2相差不大,即[T1-n1(N+1)/2]仅为抽样误差所致。当二者相差悬殊,超出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝H0。
配对设计资料的秩检验
1.H0:差值的总体中位数=0,H1:差值的总体中位数≠0;α=0.05
2.求差值:依其绝对值从小到大编秩次
绝对值相等者取平均秩次
将差值的正负标在秩次之前
零差值时秩次正负各半(或不安与编秩)
3.分别求正负秩次之和,以绝对值较小者为R值
4.根据统计量R确定对应的P值
小样本时,查表
大样本时,正态近似
多组独立样本比较的秩和检验
K-W检验,或H检验
推断定量变量或有序分类变量的多个总体分布有无差别
1、建立检验假设,确定检验水准
H0:3种方法治疗后患者生存月数的总体中位数相等
H1:3种方法治疗后患者生存月数的总体中位数不全相等
a =0.05
2、计算检验统计量H值
(1) 编秩 将三组数据合并,其余步骤同两组定量变量资料
(2) 求各组秩和Ri
3、确定P值,做出推断
(1) 查H界值表
当组数k=3,且各组例数ni≤5时,可查H界值表得到P值。
P<0.05。按照a=0.05水准,拒绝H0 ,接受H1 ,故可认为3种方法有差别。
(2) 查χ²界值表
当组数或各组例数超出H界值表时,由于H0 成立时H值近似地服从n=k1的χ²分布,此时可由χ²界值表得到P值。
频数表法
属于同一组段的观察值,一律取平均秩次(组中值),再以该组段频数加权,计算H0值
随机单位组设计的秩和检验
回归与相关
依存关系:应变量Y随自变量X变化而变化
回归分析
互依关系:应变量Y与自变量X间的彼此关系
相关分析
直线回归
直线回归的概念
描述应变量y与自变量x的依存关系,既y是依赖于x的改变而改 变的数量关系的变化。
函数关系:确定
回归关系:不确定
目的:建立直线回归方程
一般表达式:Y=a+bX
b >0,表明Y 与 X呈同向线性变化趋势;
b <0,表明Y 与 X呈反向线性变化趋势;
b =0,表明Y 与 X 无线性回归关系,但并不表明没有其它关系。
最小二乘法原则:使各散点到直线的纵向距离(即残差)的平方和最小
残差平方和越小,该直线对散点趋势的代表性越好
直线相关
相关系数,又称积差相关系数,或Pearson相关系数
说明相关的密切程度和方向的指标
r--样本相关系数
r无单位,-1<=r>=1
r的正负值表示两变量之间线性相关的方向
r的绝对值大小则表示两变量之间线性相关的密切程度
ρ--总体相关系数
v=n-2
直线回归与相关的区别
1.资料
回归
Y正态随机变量,X为选定变量
X、Y服从双变量正态分布
相关
X、Y服从双变量正态分布
2.应用
回归
由一个变量值推算另一个变量值
相关
只反映两变量间互依关系
3.回归系统有单位,相关系数无单位
直线回归与相关的联系
1.方向一致:r与b的正负号一致
2.假设检验等价:tr=tb
3.r=b根号lxy/lyy
4.用回归解释相关
决定系数
线性相关注意事项
1.散点图显示变量间有线性趋势时,才进行相关分析
2.线性相关适用于双变量正态分布资料
3.正确理解相关关系,“相关不等于因果”
4. 出现异常值时慎用相关
5. 分层资料盲目合并易出假象。
秩相关,或称等级相关
适用于:不服从双变量正态分布;总体分布类型未知;数据本身有不确定值;等级资料
两个分类变量的关联分析
对分类变量间的联系,可作关联(association)分析
对两个分类变量交叉分类计数所得的频数资料(列联表)作关于两种属性独立性的χ²检验
交叉分类2×2列联表
对样本量为n的一份随机样本同时按照两个二项分类的特征(属性)进行交叉分类形成一个2×2交叉分类资料表,也称为2×2列联表
小结
相关是测量变量间的相互关联或联系的指标。相关研究的两个变量其关系是平等的,均为随机变量。
在分析相关时必须先做散点图
两连续变量间的相关分析方法主要有Pearson积矩相关和Spearman秩相关
分类资料的关联分析可区分为两分类和多分类的情形,检验都采用卡方检验。
相关和关联是两变量间相互关联或联系数量上的关系,不能据此推论两变量有因果关系。相关有可能只是伴随关系。
线性回归的假设检验
假设检验包括两个方面:
1. 回归模型是否成立(model test):方差分析
2. 总体回归系数是否为零(parameter test): t 检验
线性回归分析的前提条件:
1. 线性:反应变量与自变量的呈线性变化趋势。
2. 独立性:任意两个观察值相互独立,一个个体的取值不受其他个体的影响。
3. 正态性:在给定值X时,Y 的取值服从正态分布
4. 等方差性:对应于不同的X 值,Y 值的总体变异相同 。
简单线性回归的应用
统计预测
个体的容许区间
预测是回归分析的重要应用之一,医学上常用在给定 X 值(预报因子)时,计算个体 Y 值的容许区间。所谓个体 Y 值的容许区间是指总体中 X 为某定值时,个体Y 值的波动范围
均数的置信区间
当 X 为某定值和在给定置信度的情况下,欲知 Y 的总体均数的分布如何?我们可以估计总体中当 X 为某定值Xi 时,Y 的总体均数 μ 的(1-α)置信区间
统计控制
简单线性回归分析通常需要报告以下内容 :
1. 分析目的;
2. 拟合简单线性回归方程的估计方法;
3. 是否符合前提条件(LINE);
4. 参数估计结果;
5. 模型的拟合优度及其假设检验;
6. 对结果的专业解释。
6.掌握单因素方差分析的基本思想和应用条件;熟悉不同设计类型下的方差分析方法和基本分析思路,如完全随机设计方差分析,随机区组设计方差分析,析因设计方差分析,重复测量设计方差分析,正交设计方差分析和拉丁方设计方差分析等。
多组资料均数的比较
方差分析常用于两个及两个以上独立样本均数的比较,当用于两个均数的比较时,同一资料所得结果与t检验等价,且有如下关系:t²=F
方差分析的基本思想及应用条件
方差分析 ANOVA:用于两个或两个以上样本均数的比较,还可分析两个或多个研究因素的交互作用以及回归方程的线性假设检验等
将所研究的对象分为多个处理组,施加不同的干预,施加的干预称为处理因素,处理因素至少有两个水平。用这类资料的样本信息来推断各处理组间多个总体均数是否存在差别,常采用的统计分析方法为方差分析,又称F检验
方差分析的基本思想
把全部观察值间的变异--总变异按设计和需要分解成两个或多个组成部分,再作分析
方差分析的基本思想是把全部数据的总的离均差平方和(SS总)分解成若干部分,其总自由度(V总)也作相应的分解。
首先将总变异分解为组间变异和误差(组内)变异,然后比较两者的均方,即计算F值,若F值大于某个临界值,表示处理组间的效应不同,若F值接近甚至小于某个临界值,表示处理组间效应相同(差异仅仅由随机原因所致)
对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。不同之处在于变异分解的项目因设计不同而异
试验数据有三个不同的变异
1.总变异:全部测量值与总均数间的差别
SS总反映了所有测量值之间总的变异程度,SS总=各测量值与总均数差值的平方和
2.组间变异:各组的均数与总均数间的差异
SS组间反映了各组均数间的变异程度,组间变异=1随机误差+2处理因素效应
3.组内变异:反映各组内个体间的差异,体现为每组的原始数据与该组均数的差异
在同一处理组内,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异。SS组内仅仅反映了随机误差的影响,也称SS误差/误差变异
用离均差平方和SS表示变异的大小
三种变异之间的关系
SS总=SS组间+SS组内,且V总=V组间+V组内
总离均差平方和分解为组间离均差平方和组内离均差平方和
相应的总自由度分解为组间自由度和组内自由度
组内变异 SS组内:随机误差
组间变异 SS组间:处理因素+随机误差
均方MS
变异程度除与离均差平方和的大小有关外,还与其自由度有关,由于各部分自由度不相等,因此各部分离均差平方和不能直接比较,须将各部分离均差平方和除以相应自由度,其比值称为均方差,简称均方MS。
组间均方计算公式:MS组间=SS组间/V组间
组内均方计算公式:MS组内=SS组内/V组内
均方之比=F
如果各组样本的总体均数相等,即各处理组的样本来自相同总体,无处理因素的作用,则组间变异同组内变异一样,只反映随机误差作用的大小。组间均方与组内均方的比值称为F统计量
F=MS组间/MS组内,V1=V组间,V2=V组内
F值接近于1,就没有理由拒绝H0;反之,F值越大,拒绝H0的理由越充分。数理统计的理论证明,当H0成立时,F统计量服从F分布
方差分析的应用条件
各样本是相互独立的随机样本
各样本来自正态总体
各处理组总体方差相等,即方差齐性或齐同
上述条件与两均数比较的t检验的应用条件相同。当组数为2时,方差分析与两均数比较的t检验是等价的,对同一资料,t²=F
方差齐性检验的主要方法:
Bartlett χ²检验:资料服从正态分布的多个总体方差齐性检验的方法 。
Levene检验:资料是任意分布时的方差齐性检验法,既可用于检验两总体方差齐性,也可用于检验多个总体的方差齐性。
小结
1. 方差分析对数据有两个假定:正态性和方差齐性。对假定条件最为简单和直观的判断就是采用残差图,也可采用检验的方法,用Bartlett 和Levene检验来判断方差齐性。
考察前提条件的残差图法
残差的计算公式:
完全随机设计资料:
随机区组设计资料:
2. 对不符合方差分析假定条件的资料
一是通过某种形式的数据变换,使之满足方差分析的条件
数据变换
所谓数据变换(data transformations),即对原始数据作某种函数变换,它虽然改变了资料分布的形式,但未改变各组资料间的关系,其缺点是分析结果的解释欠直观
1) 对数变换:将原始数据取自然对数或常用对数
该变换适用于:
(1)对数正态分布资料,如抗体滴度资料,疾病潜伏期等。
(2)标准差与均数成比例,或变异系数接近甚至等于某一常数的资料
2) 平方根变换:将原始数据开算术平方根
该变换适用于方差与均数成比例的资料,如服从Poisson分布的资料
3) 平方根反正弦变换又称角度变换:就是将原始数据开平方根再取反正弦
该变换适用于百分比的数据资料
二是采用非参数统计分析方法,如秩和检验
三是采用近似检验的方法,如Tamhane's T2,Dunnett's T3 等
完全随机设计资料的方差分析
完全随机设计是将同质的受试对象随机地分配到各处理组,再观察其实验效应。
完全随机设计是最常见的研究单因素两水平或多水平的实验设计方法,属单向方差分析(oneway ANOVA)
随机分组方法
1.编号,确定分组方案
2.产生随机数字,排序
3.按方案分组
方差分析的步骤
1.建立假设并确定检验水准α
H0:μ1=μ2=μ3
H1:μ1,μ2,μ3不全相等
α=0.05
2.计算F值
3.查F值表,确定P值,下结论
SS总=SS组间+SS组内
随机区组设计资料的方差分析
又称随机单位组设计、配伍组设计,也叫双因素方差分析,是配对设计的扩展
具体做法:将受试对象按性质相同或相近者组成b个单位组(配伍组),每个单位组中有k个受试对象,分别随机地分配到k个处理组
(1) 建立检验假设,确定检验水准
对于处理组:
H0:三个处理组总体均数相等
H1:三个处理组总体均数不全相等
α=0.05
对于区组:
H0:十个区组总体均数相等
H1:十个区组总体均数不全相等
α=0.05
(2) 计算检验统计量
(3) 确定P值并作出推断结论
计算出处理和区组的F值,并根据相应的自由度查F界值表得出P值。
对于处理组,P < 0.01,拒绝,可认为三种不同的处理效果不同,即三个总体均数中至少有两个不相同。
对于区组,P >0.05,不能拒绝 ,即尚不能认为十个区组的总体均数不同。
这样,各个处理组不仅样本含量相同,生物学特点也比较均衡,比完全随机设计更容易察觉处理间的差别
随机单位组设计
随机分组方法(每个单位组内随机)
与完全随机设计的方差分析基本相同,主要区别在于:F值计算的方差分析表不同
变异来源从组内变异中分解除单位组变异与误差变异
SS总=SS处理+SS区组+SS误差
均数间的多重比较
当方差分析的结果拒绝H0,接受H1时,只说明k个总体均数不全相等。若想进一步了解哪些两个总体均数不等,需进行多个样本均数间的两两比较或称多重比较,也叫posthoc检验
1. 在研究设计阶段未预先考虑或预料到,经假设检验得出多个总体均数不全等的提示后,才决定进行多个均数的两两事后比较
这类情况常用于探索性研究,往往涉及到全部均数两两之间进行比较,可采用SNK(StudentsNewmanKeuls) 法、Bonferroni 法等
2. 在设计阶段就根据研究目的或专业知识而计划好的某些均数间的两两比较
它常用于事先有明确假设的证实性研究,如多个处理组与对照组的比较,某一对或某几对在专业上有特殊意义的均数间的比较等,可采用Dunnett检验、LSDt检验,也可用Bonferroni 法。
当单位组间差别有统计学意义时,这种设计由于减少了误差,较完全随机设计的试验效率提高了
多种比较用t检验会加大Ⅰ型错误
多重比较的几种方法
SNK-q检验(多个均数间全面比较)
属于多重极差检验,用于每两个均数间的比较
Bonferroni法
若每次检验水准为α',共进行m次比较,若当H0为真时,犯第一类错误的累积概率α不超过mα',也即 α'=α/m。此方法较为保守,检验功效低于SNK法。
LSD-t检验(有专业意义的均数间比较)
Dunnett检验(多个实验组与对照组比较)
适用于k–1个实验组与对照组均数的比较
7.掌握生存分析方法和应用条件,熟悉随访资料分析方法。
生存分析三要素
观察起点
是反映生存时间起始特征的时间
发病时间,第一次确诊时间,随机化入组的时间
终点事件
又称失效事件,泛指标志某种处理措施失败或失效的特征事件
某种疾病的发生,疾病的复发或死亡
生存时间
每个研究对象出现某一结局所经历的时间
完全数据
complete data 指在整个研究过程中,随访到了观察对象的终点事件发生的时间,研究者可以获得从起点到终点完整的生存时间,所提供的是确切的生存时间
删失数据
censored data 在整个研究过程中,无法获得确切生存时间的数据,称为删失数据,或截尾数据
产生原因
1.失访
2.因其他原因死亡(如死于车祸)而终止观察
3.研究结束时终点事件尚未发生
与生存曲线相关的概念
死亡概率
用q表示,指某时段开始时存活的个体,在该时段内死亡的可能性。如年死亡概率表示年初尚存人口在今后1年内死亡的可能性
q=某年内死亡人数/某年初人口数
生存概率
用p表示,某时段开始时存活的个体,到该时段结束时仍存活的可能性
p=1-q
注意:如果年内有删失,则分母用校正人口数(年初人口数-删失例数/2)
生存率
0时刻存活的个体在t时刻仍存活的可能性,又称为生存函数
生存率与生存概率的关系
生存概率是时间单位上生存的可能性,生存率是某个时间段(由一个或多个单位时间组成的时间段)生存的可能性,即数个单位时间生存概率的累积结果(乘积)
中位生存时间
生存函数取值为0.5时对应的生存时间称为中位生存时间(median survival time),又称中位生存期或半数生存期,记为T50,表示有50%的个体可以存活到比T50更长时间,通常用于描述生存期的平均水平
生存曲线
以生存时间t为横坐标,各时间点的生存率S(t)为纵坐标,将各个时间点的生存率连接在一起绘制成的连续曲线称为生存曲线
生存分析基本内容
1.描述生存时间分布特点
寿命表法
用途:用于大样本
形状:折线形生存曲线
乘积极限法
Kaplan-Meier法又称乘积极限法,基本思想是将所有观察对象的生存时间(包括删失数据)由小到大依次排列,对每个时间点进行死亡概率、生存概率和生存率的估计。
1.生存率及标准误
2.中位生存时间
3.生存曲线
4.生存率的95%CI
一般用于观察对象数目较少的未分组资料,能够充分利用每条记录的信息,估计不同生存时间点的生存率
用途:用于小样本
形状:阶梯形生存曲线
2.生存曲线比较
Log-rank检验
基本思想
假定两总体生存曲线无差别,则根据两种处理不同生存时间的期初观察人数和理论死亡概率计算出的理论死亡数,与实际死亡数应相差不大,否则无效假设不成立,认为两条生存曲线差异有统计学意义
衡量观察数与理论数差别大小的统计量为卡方值,服从自由度为(组数−1)的卡方分布
生存曲线的走形
生存曲线是一条下降的曲线,分析时应注意曲线的高度和下降的坡度。平缓的生存曲线表示高生存率或较长生存期,陡峭的生存曲线表示低生存率或较短的生存期
生存曲线间的距离
两条曲线之间的距离越大,说明两组患者的终点事件发生率的差异也越大,换句话说,就是越容易出现统计学差异
生存资料的基本要求
样本:随机抽样方法获得,要有一定的数量。
终点事件:死亡例数不能太少,删失比例不能太大。
生存时间:尽可能准确。因为常用的生存分析方法都在生存时间排序的基础上做统计处理,即使是小小的误差,也可能改变生存时间顺序而影响结果
用途:整条生存曲线的比较,本质上是单因素的分析方法。
要求:各条生存曲线不能交叉。若交叉提示有混杂因素,应采用分层分析或者多因素方法来校正混杂因素。
结果解释:假设检验有意义,可进一步用生存曲线的高低或中位生存期来描述其方向。
3.生存状况影响因素分析
Cox回归
8.掌握实验设计三大要素、四大原则和常见的实验设计类型。熟悉调查设计中的常用抽样方法及误差估计方法,如简单随机抽样、系统抽样、整群抽样和分层抽样等。
9.掌握多元线性回归分析和Logistics回归分析;熟悉Cox回归分析和Poisson回归分析。
logistic回归
1.logistic 回归是多变量统计方法中的重要内容,根据研究设计和构建似然函数模型(是否用条件概率)的不同,logistic 回归分为非条件模型和条件模型两大类。它是研究因变量Y为分类变量时,Y与多个自变量X1、X2、……、X(定量、定性)间回归关系的一种分析技术,该技术广泛地应用于临床医学与流行病学研究中∶筛选危险因素、校正混杂因素、预测与判别。
2.logistic 回归模型的参数估计采用极大似然法,求解回归系数估计值后,仍需进行假设检验,包括对整个回归方程的检验和对每个回归系数的检验两方面内容。回归方程的检验一般可用似然比检验,回归系数的检验常用Waldx检验。
3.logistic 回归模型的参数β与流行病学研究中常用指标OR有如下关系∶在控制其他因素后,某一变量X的二水平C1与C2(C2>C1)的优势比为 OR。当变量X的回归系数β>0时,OR>1,该因素为一危险因素;β<0时,OR<1,该因素为一保护因素;β=0,0R=1,该因素对结果不起作用。
在基准风险率函数未知的情况下估计模型参数的方法,该估计方法被称为Cox 比例风险回归模型,简称Cox回归。
10.掌握临床试验中统计分析思路和方法,熟悉相应的统计学专业术语。
研究设计的基本要素
研究假说
科学研究的假说:根据已有知识作出假定性的说明和推断,有待研究予以验证
研究对象
纳入标准
年龄、性别、临床诊断、病情…
排除标准
常为保障病人安全
研究因素
影响结局的内外因素
研究因素:
实验性研究,施加于研究对象的外界干预,也称为处理 (treatment)因素
观察性研究,因素是自然存在的,如暴露 (exposure) 因素、危险(risk) 因素
非研究因素:混杂因素或协变量,应予控制
动物实验:窝别、年龄、体重、营养等
临床疗效研究:疾病分期、病理类型等
结局指标
结局指标 (outcome, end point)
度量研究因素产生的:效应 (effect) 或反应 (response)
主要指标 (primary outcome)
次要指标 (secondary outcome)
客观指标和主观指标
准确度 (accuracy) 、精密度 (precision)
灵敏度 (sensitivity)、特异度 (specificity)
调查表
调查表(form)
问卷 (questionnaire)
量表(scale)
病例报告表(case report form,CRF)
生存质量(quality of life,QOL) 测定量表
一份量表含若干领域(domain)
一个领域含若干方面(facet)
一个方面含若干条目(item)
量表的考评
效度(validity) 有效性和正确性
量表确实测定了所要测定的特征?
客观真实性的程度?
信度(reliability)
可靠性 稳定性 一致性
可接受性(acceptability)
被测定者对量表的接受程度
医学科学研究
分为
干预性研究
实验研究由处理因素、实验单位和实验效应三个要素组成;应该遵守对照、随机化和重复的基本原则;研究对象接受不同处理由随机分配决定;
观察性研究
观察性研究只能对已存在的状况和有关因素进行观察或调查,不能用随机化分组来平衡混杂因素的影响;适宜的统计学设计和分析对于观察性研究而言,尤其重要。
医学研究设计包括
专业设计
统计学设计
统计学设计是运用统计学原理和技术,对研究资料的收集、整理和分析进行科学设计
统计学设计的基本要素:
建立假说
确定研究对象
确定研究因素
明确结局指标
设计用于调查的量表等
统计设计的基本原则
1. 对照(Control)
医学研究多数是通过比较产生结论,对照是比较的基础
1.消除非研究因素的混杂
2.鉴别研究因素的效应和自然发展结果
实验的三要素
(1) 受试对象
纳入标准和排除标准
(2) 实验因素 (干预因素)
控制重要的非实验因素 (其他)
(3) 实验效应
但测得的是实验效应与其他效应之和
2. 随机 (Randomization)
降低系统误差的影响,贯穿于设计和实施全过程:
(1) 样本代表性
总体中任何一个个体都有同等的机会进入样本;
(2) 组间可比性
样本中任何一个个体都有同等机会被分配到任何一个组
(3) 排除实验顺序影响
样本中的任何一个个体先后接受处理的机会相同
随机化分组:使实验组与对照组在非实验因素的分布方面尽量保持均衡一致。
随机化方法
随机数字表(random number)
计算机伪随机数(pseudo random number)发生器 — 可重复
为保证实验的可靠性和可重复性,在实验设计中所用的随机化方法、随机数及产生随机数的程序、种子数等均应有记录(备查)
3. 重复 (Repeat)
重复实验、重复取样、重复测量
在大量重复实验的条件下,该处理的真实效应才会比较真实地显露出来
实验组和对照组的实验单位应具有一定的数量 — 样本含量
样本含量的估算: 比较两组测定值的均数
(1) 预计欲比较的两总体参数的差值δ
(2) 预计总体标准差σ
(3) 允许出现假阳性结果的机会α
(4) 允许出现假阴性结果的机会β
样本含量的估算:比较两组发生某结局的百分比
(1) 预计一个组发生某结局的百分比约为π1
(2) 预计另一组发生某结局的百分比约为π2
(3) 允许犯假阳性错误的机会α
(4) 允许犯假阴性错误的机会β
与重复实验相比,重复取样和重复测量属于第二位
误差控制与统计计划
误差来源
抽样误差
不可避免,但有一定规律,利用统计学技术,不仅可以控制,还可估计其大小。
非抽样误差
1. 过失误差
2. 系统误差 又称偏倚(bias)
(1) 选择偏倚(selection bias)
(2) 测量偏倚(measurement bias)
(3) 混杂偏倚(confounding bias)
混杂因素:若某非研究因素,既与研究因素有关,又与效应有联系;研究因素与效应之间的联系可能被掩盖或歪曲, 造成混杂偏倚。
设计:收集混杂变量的数据
分析:采取分层分析和多元分析的技术
偏倚的控制
设计阶段质量控制
1. 围绕研究目的,严密设计总体方案
2. 明确定义研究对象,正确划分观察范围
3. 正确选择观察指标和欲调查问题
4. 选择恰当的观察方式,保证数据质量
5. 预研究,试点,评估方案的可行性,及时修改研究计划
6. 规定一整套标准操作方法 (standard operation procedure, SOP)
资料收集阶段质量控制
1. 研究人员的选择与培训
2. 盲法
(1) 单盲
(2) 双盲
评估盲法的实施
3. 定期检查研究记录
4. 检查研究对象的依从性
资料整理与分析阶段质量控制
1. 问卷等测量报告的核对
2. 数据录入质量控制
3. 基线分析与校正
4. 分层分析、多因素分析
统计分析计划
研究设计、资料搜集与整理分析是科学研究的三个紧密联系的阶段。
在研究设计时要同时制订详尽的统计分析计划, 以规范数据的管理和统计分析方法,使之与设计相匹配。
事先无计划,或疏虞计划,在获取研究数据以后,多方计算,以求得研究者期待的结论,这样的事后分析(post hoc analysis)往往导致虚假结果。
1. 数据录入与数据库的建立
二维结构数据库
每一行:
一个观察单位(observational unit, case) 的记录(record)
每一列:
一个变量(variable),调查的项目或观察指标
2. 数据核查与离群数据处理
(1) 数据核查
人工检查和计算机检查
(2) 离群数据(outlier) 处理
(3) 缺失值(missing value) 处理
缺失值的比例不能太大
完全随机缺失(missing completely at random, MCAR) — 可以仅对完整资料的对象分析(complete subject analysis);否则,需利用适宜统计方法“填充”
3. 统计分析方法的选择与前提
选择统计分析方法需考虑以下要素:
研究目的
设计类型
变量类型和数目
数据分布特征
样本量……
不同设计类型需采用不同的统计分析方法
思考:采用什麽统计方法?
(1) 比较平均效应、两独立小样本、单个定量变量、正态分布
t 检验
(2) 比较平均效应、配对样本、单个定量变量、分布特征不详
符号秩检验
(3) 比较平均效应、两独立大样本、单个分类变量、二项分布
χ² 检验
(4) 比较平均效应、两独立小样本、单个分类变量、二项分布
Fisher 精确检验
小结
误差来源包括非抽样误差和抽样误差;非抽样误差包括过失误差和系统误差(bias) 。
常见偏倚包括:选择偏倚、测量偏倚和混杂偏倚。应当在设计阶段、资料收集阶段和资料整理与分析阶段对偏倚进行控制,观察性研究尤其如此。
必须在制订研究计划的同时制订详尽的统计分析计划书 (statistical analysis plan, SAP),包括原始数据的录入与数据库的建立、数据清理与核查、统计描述和统计推断的方法
11.熟悉常用统计软件的应用,如SPSS,SAS等。