导图社区 人卫第九版 流行病学 第五章 队列研究
这是一篇关于人卫第九版 流行病学 第五章 队列研究的思维导图,是将研究人群按照是否暴露于某个因素或暴露的程度分为暴露组和非暴露组,追踪观察并比较两组成员在特定时间内与暴露因素相关结局(如疾病)发生率的差异,从而判定暴露因素与结局之间有无因果关联及关联程度的一种观察性研究方法。
编辑于2023-12-20 23:18:40第五章 队列研究
第一节 概述
概念与基本原理*
概念
是将研究人群按照是否暴露于某个因素或暴露的程度分为暴露组和非暴露组,追踪观察并比较两组成员在特定时间内与暴露因素相关结局(如疾病)发生率的差异,从而判定暴露因素与结局之间有无因果关联及关联程度的一种观察性研究方法
暴露
泛指能影响结局(如疾病)的各种因素
研究对象所具有的与结局有关的特征或状态(如年龄、性别、职业、遗传、行为、生活方式等)或曾接触与结局有关的某因素(如X线照射、重金属、环境因素等)
暴露因素
特征、状态或因素即为暴露因素
队列:具有某种共同特征的一组人群
固定队列
是指观察对象都在某一时刻或一个短时期之内进入队列,之后不再加入新的成员
动态队列
在整个观察期内,原有的队列成员可以不断退出,新的观察对象可以随时进入
危险因素
泛指能引起某特定不良结局,或使其发生的概率增加的因子,包括个人行为、生活方式、环境和遗传等多方面的因素
基本原理与特点*
基本原理
根据研究对象是否暴露于某研究因素或其不同水平将研究对象分成暴露组(E)与非暴露组(Ē)
随访一定时间,比较两组之间所研究结局(outcome)发生率的差异,以分析暴露因素与研究结局之间的关系
四个特点
时间上是前瞻性的
队列研究开始时,入选的研究对象都没有发生所研究的结局
属于观察性研究
队列研究是基于研究人群自然暴露于可疑因素后观察相关结局出现的情况
设立对照,按照暴露与否进行分组
是由因到果的研究,符合时间顺序,因果联系能力强
用途*
检验病因假设(主要目的和用途)
在研究暴露与疾病的关系时,通常根据描述流行病学的研究结果提出病因线索或假设,然后进行分析流行病学研究验证假设
评价预防措施效果
通过人群的“自然实验”可以评价这些因素预防疾病的效果
研究疾病的自然史
不但可了解队列成员个体疾病的自然史,而且可全面了解疾病在人群中的发生、发展直至转归的全过程,包括暴露因素变化、早期生物学效应的产生、机体结构或功能的改变等疾病临床前的变化与表现以及临床发病和之后的转归,全面揭示疾病的自然史,为制定预防策略和措施提供依据
预后因素研究和新药上市后监测
类型
前瞻性队列研究 (基本形式)
在研究开始时,根据每个研究对象的暴露情况对研究对象进行分组,此时研究结局还没有出现,需要随访观察一段时间,收集每个研究对象研究结局发生情况的信息
特点
研究队列的确定是现在
根据研究对象现在的暴露分组
需要随访*
结局在将来某时刻出现
优点
时间顺序增强了病因推断的可信度
直接获得暴露与结局资料,结果可信
能获得发病率
第一手资料偏倚较小
缺点
所需样本量大,花费大,时间长
研究对象容易失访,影响可行性
应用条件
① 有明确的检验假设
② 所研究疾病的发生率较高,一般不低于5%
③ 明确规定暴露因素和结局变量
④ 有可靠的测量手段
⑤ 能获得足够的观察人群和他们的暴露情况
⑥ 大部分人群能完成随访
⑦ 有足够的人力、财力、物力
历史性(回顾性)队列研究
概念
根据研究开始时研究者掌握的有关研究对象在过去某时刻的暴露情况的历史材料分组
不需要前瞻性观察,研究开始时结局已出现
但其性质仍属前瞻性(从过去的暴露到现在的结局),是从“因”到“果”的研究
优点
省时、省力、出结果快
适用于长诱导期和长潜伏期疾病的研究
短期内完成资料的收集和分析
缺点
资料积累时未受到研究者的控制,内容上未必符合要求
需要足够完整可靠的过去某段时间有关研究对象的暴露和结局的历史记录或档案材料
容易发生选择偏倚和信息偏倚
难以控制混杂因素的干扰
历史资料的完整性和真实性将直接影响研究的可行性和研究结果的真实性
历史前瞻性队列研究(双向性队列研究)
概念
在历史性队列研究的基础上继续进行前瞻性队列研究
适用
适评价对人体健康同时具有短期和长期作用的暴露因素的效应
特点
研究队列的确定是过去
根据研究对象过去某时刻的暴露情况分组
需要随访
部分结局可能已出现
优点
是将前瞻性队列研究与历史性队列研究结合起来的一种设计模式,因此兼有上述二类的优点
第二节 研究设计与实施
确定研究因素
主要暴露因素:在描述和病例对照研究的基础上确定
可能影响结局的因素:混杂因素、人口学特征等
因素的测量:需测量暴露的水平,暴露的时间,及暴露的方式。暴露的测量应采用敏感、精确、简单和可靠的方法
性质:定性,定量
方法:访谈,实验室检查,查阅记录
确定研究结局
指随访观察中预期出现的与暴露因素有关的结果,也就是研究者所希望追踪观察的事件(如发病或死亡等)或某些指标的变化
不同的研究目的,其研究结局不同
应规定明确统一的结局变量判定标准,并在研究的全过程中严格遵守该标准
确定主要研究结局外,还可以同时收集可能与暴露有关的多种结局,分析一因多果的关系,提高研究的效率
确定研究现场与研究人群
研究现场
有足够符合条件的研究对象
当地政府重视、群众理解和支持
医疗条件较好,交通较便利
发病率较高
有代表性
人口相对稳定,便于随访
预期研究结局发生率较高
研究人群
研究开始时没有出现研究结局、但可能出现该结局的人群
暴露人群
职业人群
研究某种可疑的职业暴露因素与疾病或健康的关系
职业人群的暴露史比较明确,暴露水平较高,发病率也比较高
历史记录较为全面、真实和可靠
特殊暴露人群
由于某种原因对某因素有较高暴露水平的人群
常采用历史性队列研究或历史前瞻性队列研究方法
一般人群
即某行政区域或地理区域范围内的全体人群
有组织的人群团体
某些群众组织或专业团体成员、机关或社会团体成员、部队成员、参加人寿保险或医疗保险的人员等
非暴露人群
内对照(internal control)
一群研究对象内部
一般人群或有组织的人群团体
可比性好,也可以了解该人群的总体发病
外对照(external control)
一群研究对象外部
职业人群或特殊暴露人群
需注意两组的可比性
总人口对照(total population control)
整个地区现成的发病或死亡资料
职业人群或特殊暴露人群
优点
对照组资料容易得到
节省研究经费和时间
缺点
注意可比性
多重对照(multiple control)
两种或以上的对照形式人群
优点
减少偏倚
增强结果的可靠性和判断病因的依据
缺点
增加研究工作量
注意暴露组与不同对照组之间的可比性
样本量的估计*
影响样本量的因素
非暴露人群或全人群中估计结局发生率p0
暴露人群与对照人群疾病发病率之差p1-p0
如果不能获得暴露组人群结局发生率p1,可设法取得其相对危险度(RR)的值,由式p1=RR×p0可求得p1
RR为暴露人群与非暴露人群中发病率或死亡率之比
统计学要求的显著性水平α
把握度:1-β
为保证研究的可靠性,把握度至少应在0.80
样本量的计算*
在暴露组与对照组样本量相等的情况下,可用下式计算出各组所需的样本量
P¯:两个发病率的平均值,q=1- P¯ P1:暴露组预期发病率,q1=1- P1 P0:对照组预期发病率,q0=1- P0 Zα=1.96, Zβ=1.282 (α与β对应的标准正态分布临界值)
已知α、β、p0和RR四个基本数据,即可从某些参考书的相应附表上查出所需要的样本量
计算样本量时需考虑的问题
暴露组与非暴露组的比例(1:1)
预先估计失访率,适当扩大样本量
抽样方法
资料的收集与随访
基线资料及收集方式
基线信息
①人口学资料(年龄、性别、职业、文化程度、婚姻状况等)以及可能的混杂因素信息
②暴露因素信息
有无暴露、暴露的类型、频率、剂量、最早暴露的时间、最高暴露剂量、累积暴露剂量
③结局指标信息
以便进行病因研究时排除已患有所研究疾病的人员
资料收集方式
制订统一且详细的调查表
查阅医院、工厂、单位及个人健康记录或档案
对研究对象进行相关的体格检查、实验室检查和特殊项目检查
进行环境因素的定期监测
随访
随访内容
一般与基线资料内容一致
重点是结局变量
随访对象与方法
所有有完成了基线调查的合格对象(不论是暴露组或对照组)
观察终点
研究对象出现了预期的结果
一般情况下:发生疾病或死亡
某些指标出现变化
失访
由于人口流动等原因,有一些研究对象没有达到观察终点就失去联系,无法获得研究结局的信息
观察终止时间
整个研究工作截止的时间
随访期
影响因素
研究结局出现的速度
暴露与结局的联系强度
随访间隔
间隔过短,浪费人力物力,也给研究对象带来不必要的麻烦甚至伤害
间隔过长则容易失访,并且观察不到中间的变化
一般慢性病的随访间隔期可定为1~3年,Framingham心血管病的随访研究就是每两年随访一次
随访者
则上随访者应为基线调查者,以便增加随访和基线调查的可比性
质量控制
调查员选择
调查员培训
制定调查员手册
监督
第四节 资料整理及分析*
计算方法
人时的计算
人时:观察人数×观察时间,时间单位可以用年、月、日等,最常用的是年
精确法:逐日相加
近似法:年头和年尾人数之和除以2
寿命表法:当年内进入或退出队列的个人均作1/2人年计算
率的计算*
常用指标
累积发病率(CI)
研究人群的数量比较多,人口比较稳定(即固定队列),无论发病强度大小和观察时间长短,均可计算研究疾病的累积发病率
以整个观察期内的发病人数除以观察开始时的人口数
表示发病率的累积情况
必须说明累积时间的长短,否则,其流行病学意义不明确
适用条件
样本大
人口稳定
整齐的资料(固定队列)
发病密度(ID)
当观察的人口不稳定时,观察对象进入研究的时间先后不一,以及各种原因造成失访,每个观察对象随访的时间不同,这样的队列即为动态队列,此时用总人数为单位计算率是不合理的。用人时为单位计算发病率,称为发病密度
最常用的人时单位是人年,如10个研究对象被观察1年或者1个研究对象被观察10年都为10个人年
适用条件
观察时间长
人口不稳定
存在失访
标化比(SMR)
当研究对象数量较少,结局事件发生率比较低时,无论观察时间长短,都不宜直接计算率。此时可以全人口的发病(或死亡)率作为标准,计算出该观察人群的预期发病(或死亡)人数;再求得观察人群中实际发病(或死亡)人数与此预期发病(或死亡)人数之比,即标化发病(或死亡)比
适用条件
结局事件发生率
不宜直接计算率时
以全人群为对照
SMR 的意义
SMR=1 研究人群某病发病(死亡)危险=标准人群
SMR>1 研究人群某病发病(死亡)危险>标准人群, 是标准人群的SMR倍
SMR<1 研究人群某病发病(死亡)危险<标准人群
标化比例死亡比(SPMR)
适用条件
某单位不能得到历年人口资料(无分母)
仅有死亡人数、原因、日期和年龄
显著性检验(了解)
队列研究中暴露组与对照组发病率或死亡率的比较需作统计学显著性检验
关联强度的估计(效应的估计)*
相对危险度(RR)*
相对危险度是反映暴露与发病(死亡)关联强度的最常用的指标,也叫率比或危险度比;是暴露组和非暴露组的发病(或死亡)率之比
Ie:暴露组发病(或死亡)率
Io:非暴露组发病(或死亡)率
a:暴露组发病数
n1:暴露组样本量
c:对照组发病数
n0:对照组样本量
RR与关联强度
1)RR=1表示两组的发病率或死亡率没有区别;
2)RR>1表示暴露组的发病率或死亡率高于非暴露组,暴露可增加发病或死亡的危险性,暴露因素是疾病的危险因素;
3)RR<1表示暴露组的发病率或死亡率低于非暴露组,暴露可减少发病或死亡的危险性,暴露因素是保护因素。
RR值离1越远,表明暴露的效应越大,暴露与结局关联的强度越大。
关联统计学意义计算
归因危险度(AR)*
是暴露组发病(或死亡)率与对照组发病(或死亡)率差的绝对值,说明发病(或死亡)危险特异地归因于暴露因素的程度
统计学意义
RR与AR比较*
从RR看,吸烟者与非吸烟者相比,死于肺癌的危险比死于心血管疾病的危险大得多,说明吸烟与肺癌的病因联系较强; 从AR看,吸烟对心血管疾病的作用较大,如果消除吸烟因素,可使心血管疾病的死亡率有更加明显的下降,即预防所取得的社会效果更大
归因危险度百分比 AR%(ARP)
'暴露人群中'的发病或死亡归因于暴露的部分占全部发病或死亡的百分比;RR↑ AR%↑
人群归因危险度(PAR)
是指总人群发病(或死亡)率中归因于暴露的部分
人群归因危险度百分比 PAR%(PARP)
是指总人群发病(或死亡)率中归因于暴露的部分占总人群全部发病(或死亡)率的百分比
意义:出PAR%与反映暴露致病作用的RR有关,又与人群中暴露者的比例有关,说明暴露对全人群的危害程度。如果某种暴露是某疾病的一个重要病因,即RR较大,但在人群中的暴露率很小,则PAR%会较小
例题 P66(非常重要***)
剂量反应关系分析
分析方法
列出不同暴露水平下的发病率
以最低暴露水平组为对照,计算各暴露水平的RR和危险度差(RD)
必要时,应对率的变化作率的趋势性检验
例题分析*
意义:分别计算各暴露水平亚组的RR和AR,如果暴露的剂量越大,RR和AR越大,则暴露与效应之间存在剂量反应关系,说明该暴露作为病因的可能性就增大 结果:肺癌死亡率、RR和AR均随每日吸烟量的升高而增大,两者存在剂量效应关系,说明吸烟很可能是肺癌死亡的原因
第五节 偏倚及其控制
选择偏倚*
产生原因
选择对象的方法不当
最初选定参加研究的对象中有人拒绝参加或失访
历史性队列研究中部分档案丢失或记录不全
研究开始时未能发现早期病人等
志愿者队列
控制
预防为主,抽样方法正确,严格按规定标准选择对象
失访偏倚*
研究对象因迁移、外出、死于非终点疾病或拒绝继续参加观察而退出队列所引起的偏倚。本质上属于选择性偏倚
设计*
选择便于随访的人群
在计算的研究样本的基础上扩大10%*
实施
加强对随访员的管理
制定随访计划和监测措施
期中分析
整理资料
对于有缺项或漏项的对象进行补查
信息偏倚
产生原因
疾病、暴露标准不明确
检验仪器不精确、检验技术不熟
询问技巧不佳、记录错误,造假等
控制
提高临床诊断技术、明确各项标准
选择精确稳定的测量方法
事前调准仪器
严格实验操作规程
同等对待每个研究对象
培训调查员,提高技巧,统一标准
混合偏倚
控制
设计阶段
限制研究对象,匹配
分析阶段
分层分析、标准化或多因素分析
第六节 优点与局限性
优点
直接获得暴露组和非暴露组的发病率或死亡率
直接估计危险度
符合时间顺序,验证病因的能力较强
获得一种暴露与多种结局的关系
收集的资料完整可靠,不存在回忆偏倚
可研究疾病的自然史
局限性
不适于发病率很低的疾病的病因研究
易发生失访偏倚
耗时,耗人力、物力、财力
设计要求严密,资料的收集和分析难度较大
随访过程中,已知变量的变化或未知变量的引入增加分析难度