导图社区 人卫第九版 流行病学 第六章 病例对照研究
这是一篇关于人卫第九版 流行病学 第六章 病例对照研究的思维导图,包含偏倚及其控制、 优点与局限性、资料分析、研究设计与实施等。
编辑于2023-12-21 16:09:07第六章 病例对照研究
第一节 概述
概念
是按照有无所研究的疾病或某种卫生事件,将研究对象分为病例组和对照组,分别追溯其既往(发病或出现某种卫生事件前)所研究因素的暴露情况,并进行比较,以推测疾病与因素之间有无关联及关联强度大小的一种观察性研究
基本原理与特点*
基本原理
根据研究对象是否患有所要研究的某种疾病或出现研究者所感兴趣的卫生事件,将研究对象分为病例组和对照组
以确诊患某种特定疾病的病人作为'病例'
以不患该病但具有可比性的个体作为'对照'
通过询问、实验室检查或复查病史,搜集既往危险因素暴露史
测量并比较两组各因素的暴露比例,经统计学检验该因素与疾病之间是否存在统计学关联
评估各种偏倚对研究结果的影响,并借助病因推断技术,判断某个或某些暴露因素是否为疾病的危险因素
病例对照研究基本原理示意图
基本特点
观察性研究
病例对照研究中各种因素是否暴露是自然存在而非人为控制
设立对照
研究对象分为病例组、对照组
由“果”推“因”
因果联系的论证强度相对较弱
病例对照研究不能观察到由因到果的发展过程,一般而言不能证实暴露因素与疾病之间的因果联系,但可为队列研究及实验性研究提供病因研究的线索和方向
用途
广泛探索影响因素
众多与疾病或卫生事件发生相关的可疑因素中,筛选相关因素
深入检验某个或某几个病因假说
研究健康状态等事件发生的影响因素
疾病预后因素的研究
临床疗效影响因素的研究
类型(按照研究设计)
非匹配病例对照研究
非匹配病例对照研究对于病例和对照之间的关系不作限制和规定
从设计所规定病例和对照人群中,分别抽取一定量的研究对象
对照组人数≥病例组人数
对照组应能代表产生病例的人群
匹配病例对照研究
匹配/配比(matching)
指所选择的对照在某些因素或特征上与病例保持一致
匹配因素或匹配变量
年龄、性别、居住地
要求
对照在某些因素或特征上与病例保持一致
目的
对两组进行比较时排除匹配因素的干扰,提高研究的效率
注意事项
慎重选择匹配因素
必须是已知的混杂因素
可疑病因不作为匹配因素
避免 “匹配过度(overmatching)”
将不起混杂作用的因素作为匹配变量进行匹配,企图使病例与对照尽可能一致
分类
成组(频数)匹配病例对照研究
指对照组具有某种或某些因素或特征者所占的比例与病例组一致或相近,即病例组与对照组之间某些因素和特征的分布一致或接近
个体匹配病例对照研究
指以个体为单位使病例和对照在某种或某些因素或特征方面相同或接近
比例一般为1:1,最多不超过1:4
衍生的几种主要研究类型
病例对照与队列研究作为病因研究的主要方法,有其各自的优势与不足,而且这些优势与不足相互补充,因此,在实践过程中产生了一些新的研究类型,结合使用这两种方法,扬长避短
巢式病例对照研究
病例队列研究
病例病例研究
病例交叉设计
病例时间对照设计
第三节 研究设计与实施
确定研究目的与类型
确立研究目的
查阅相关文献资料,了解本课题的研究现状,结合既往的研究结果以及临床或卫生工作中需要解决的问题,提出病因假设,确定研究目的
明确研究类型
非匹配或频数匹配病例对照研究
用于广泛地探索疾病的危险因素
个体匹配病例对照研究
研究是罕见病,或所能得到的符合规定的病例数很少,则可采用1:R个体匹配的设计方法
对照与病例在某些重要因素或特征方面的可比性要求,随机抽取的对照组很难与病例组均衡可比
确定研究因素
研究因素的确定
研究者感兴趣的与所研究疾病或其他结局事件有关的暴露因素,包括较明确的病因因素、可疑的病因因素以及可能的混杂因素
研究因素的规定
对每项研究因素的暴露或暴露水平作出明确而具体的规定
尽可能采取国际或国内统一的标准,以便交流和比较
研究因素的收集
每个研究对象的暴露及疾病的信息均应准确记录于调查表,
确定研究对象*
病例的选择
选择原则
代表性
足以代表产生病例的靶人群
诊断明确
对所研究疾病的诊断标准作出明确的规定
对于无明确诊断标准的疾病,可根据研究的需要制定明确的工作定义
病例类型
新发病例(尽量选)
研究期间新发生并诊断的病例
代表性好、回忆偏倚小、病历资料容易获得、被调查因素改变少
现患病例
研究人群中已存在的某病的病人
收集需要时间较短,费用相对较低
回忆因患病时间较长而易发生偏差,难以区分暴露和疾病的时间顺序,而且容易掺入疾病迁延及存活的因素
死亡病例
研究时已死亡的病例
费用低,出结果快,获得的信息对进一步深入研究有一定的帮助
资料准确性较差
病例来源
医院
方便可行,节省费用,合作性好,信息较完整、准确
罕见病的唯一可行方法
容易发生选择偏倚
社区
代表性较强
病例获得比较困难,工作量和工作难度均较大
对照的选择
选择原则
对照必须是未患所研究疾病的人,即按照所研究疾病的诊断标准判定的非病人
代表性
所选择的对照应能代表目标人群暴露的分布情况,最好是全人群的一个无偏样本,或是产生病例的靶人群中全体未患该病人群的一个随机样本
可比性
除研究因素(暴露因素)以外,其他有关因素在病例组与对照组间的分布应一致
年龄、性别、居住地
对照的形式
①非匹配或成组设计
②匹配设计(尽可能选择)
目的
提高研究效率
控制混杂因素的干扰
要求对照在某些特征或因素上与病例保持一致,以保证对照与病例具有可比性
匹配变量必须是已知的混杂因素,或有充分的理由怀疑为混杂因子
防止匹配过度
匹配的方式:频数匹配、个体匹配
病例与对照的比例:1:1配对、1: r匹配
如果所研究的是罕见病或所能获得的合格病例数很少,为了达到较满意的统计学功效,可采用1: r匹配
对照的来源
①同一个或多个医疗机构中诊断的其他疾病的患者;
实际工作中常采用这种对照
易于选取,比较合作,且可利用档案资料
代表性较差,容易产生偏倚
尽可能选择多个医院、多科室、多病种的病人作对照
②社区人群或团体人群中非该病病例或健康人;
代表性强
实施难度大,费用高,所选对照不易配合
③病例的邻居或同一住宅区内的健康人或非该病病例;
④病例的配偶、同胞、亲戚、同学或同事。
病例与对照的选择,尤其是'对照的选择'是整个研究的关键之一。
研究得出的结论是否可靠,首先要看对照的选择是否合理。
病例与对照选择的基本原则:
代表性、可比性(往往更重要)
选择方法:匹配或抽样
估计样本含量*
样本大小的影响因素
研究因素在对照组或人群中的估计暴露率(p0)
研究因素与疾病关联强度的估计值,即RR(相对危险度) 或OR (暴露的比值比)
假设检验的显著性水平,即Ⅰ类错误的概率(α值)
检验的把握度(1-β),β为Ⅱ类错误的概率
一般而言,α或β越小,所需样本量越大 α、β和p0一定时,OR或RR的估计值越远离1;因素 对疾病发生的作用越强,所需样本量越小 p0与p1差值越大,所需样本量越小
样本大小的估计方法
非匹配或成组匹配设计样本量估计
病例数与对照数相等时
n为病例组或对照组人数,Zα与Zβ分别为α与β对应的标准正态分布的分位数
p0与p1分别为对照组和病例组某因素的估计暴露率,q0=1-p0,q1=1-p1,p-=(p0+p1)/2,q-=1-p-
个体匹配设计样本量估计
1:1配对病例对照研究样本量估计
病例和对照暴露情况不一致的对子数(m):
p=OR/(1+0R)
总对子数M
p0与p1分别为目标人群中对照组和病例组某因素的估计暴露率
注意
估计的条件并非一成不变,估计的样本量并非绝对精确的数值
样本量并非越大越好
在总的样本量相同的情况下,病例组和对照组样本含量相等时研究效率最高
不同研究设计的样本量的计算方法不同
资料收集
第三节 资料分析*
描述性分析
研究对象的一般特征描述
性别、年龄、职业、居住地等
均衡性检验
推断性分析*
非匹配或成组匹配设计资料的分析*
非匹配或成组匹配病例对照研究资料分析表
暴露与疾病关联性分析*
检验病例组某因素的暴露率与暴露比例(a/n1)与对照组(b/n0)之间的差异是否有具有统计学意义
检验此假设一般采用四格表χ²检验
四格表中一个格子的理论数>1但<5,总例数>40时,用校正χ²检验
关联强度分析**
关联强度分析的目的是推断暴露因素与疾病关联的密切程度,是病因学研究中资料分析的核心内容
RR为表示关联强度最常用的指标,是暴露队列的发病率或死亡率与非暴露队列发病率或死亡率之比。因病例对照研究中无暴露组和非暴露组的观察人数,故不能计算发病率和死亡率,因而不能求得RR,但可通过计算比值比(OR)来近似估计RR
比值比(OR)
病例组暴露的概率为a/n1,无暴露的概率为c/n1 者的比值(odds)=(an;)(cn)=a/c
同理,对照组暴露与无暴露的比值=b/d
意义
在不同患病率和发病率的情况下,OR与RR是有差别的。一般而言,如果疾病的发病率较低,所选择的病例和对照代表性好,则OR接近于RR
当发病率低于5%,OR可以较好地反映RR
OR=1,表明研究因素与疾病之间无关联
OR>1,表明研究因素与研究的疾病成“正”联系,数值愈大,该因素为危险因素的可能性愈大
OR<1,表明研究因素与研究的疾病成“负”联系,数值愈小,该因素为保护因素的可能性愈大
OR可信区间的计算
OR是一个样本的点估计值,它不能反应总体OR值,故需用样本OR推测总体OR所在范围
Miettinen氏卡方值法
计算时一般用不校正的χ²值,也可用
Woolf氏自然对数转换法
1:1配对(个体匹配)设计资料的分析*
1:1配对病例对照研究资料整理模式
暴露与疾病有无关联
计算OR及95%CI
Miettinen氏卡方值法
计算时一般用不校正的χ²值,也可用
Woolf氏自然对数转换法
分级分析
病例对照研究分级资料整理表
分级分析是将不同暴露水平的资料由小到大或由大到小分成多个有序的暴露等级,不同水平的各级分别与无暴露或最低水平的暴露作比较,以分析暴露与疾病或其他卫生事件之间是否存在剂量反应关系
病例组与对照组暴露水平分布的检验
用R×C列联表χ²检验
计算各暴露水平的χ²、OR及95%CI
检验此假设一般采用四格表χ²检验
四格表中一个格子的理论数>1但<5,总例数>40时,用校正χ²检验
Miettinen氏卡方值法
计算时一般用不校正的χ²值,也可用
Woolf氏自然对数转换法
分层分析*
病例对照研究分层分析模式
未被配比的混杂因素,需用分层分析的方法去识别,并估计和控制其作用
判断因素是否符合混杂因素的条件
按混杂因素分层、列表,计算各层的 ORi
进行齐性检验
各层 OR 值无明显差别,计算总的 OR(ORMH )
各层 OR 值有明显差别,不计算 ORMH,考虑交互作用
总χ²
共同表示
的95%可信区间的计算
Miettinen氏卡方值法
计算时一般用不校正的χ²值,也可用
Woolf氏自然对数转换法
分级分析
当获得的某些暴露因素为不同暴露水平时,该资料为分级资料
将不同暴露水平分成多个有序的暴露等级,不同暴露等级与无暴露或最低水平的暴露作比较,分析暴露与疾病之间的剂量反应关系
第四节 偏倚及其控制*
选择偏倚*
产生原因
主要产生于研究的设计阶段
选择的研究对象不能代表源人群
常见偏倚*
入院率偏倚(伯克森偏倚)*
以医院为基础的病例对照研究中常发生这种偏倚
现患病例-新发病例偏倚(奈曼偏倚)*
病例对照研究中的研究对象如果选自现患病例,特别是病程较长的现患病例,所得到的暴露信息可能与存活有关而与发病无关,或者是由于疾病而改变了原有的一些暴露特征(如生活习惯),与新发病例所提供的暴露信息有所不同,其结果可能将存活因素等作为疾病发生的影响因素,夸大或缩小了研究因素和研究疾病的真实关系
检出症候偏倚(暴露偏倚)*
某因素的存在可提高所研究疾病早期病例的检出率
对照选择中的偏倚
选择的对照不能代表产生病例的人群,与所研究的可疑病因有关的其它疾病病人作为对照
选择偏倚的控制
尽可能在社区人群中选择病例与对照
尽可能地从多家(类)医院选择病例与对照
尽可能选择新发病例作为研究对象
医院中收集病例最好包括不同来源的早、中、晚期病人
信息偏倚*
产生原因
主要发生于研究的实施过程中
收集整理信息中测量暴露与结局的方法有缺陷
常见偏倚*
回忆偏倚*
研究对象对暴露史或既往史回忆的准确性和完整性存在系统误差
最常见和最严重的偏倚之一
调查偏倚*
来源于调查者、调查对象、调查环境、测量试剂与设备等
信息偏倚的控制
选择新发病例作为调查对象也可减少回忆偏倚
尽量采用客观记录资料
培训调查员,统一对病例和对照的提问方式和调查技术
仪器、试剂要精良、统一,经常检查、校准
混杂偏倚
产生原因
既与疾病有关系,又与研究的暴露因素有联系的因素在病例和对照组分布不同
控制
对研究对象采取限制、匹配
分层分析
多因素分析
第五节 优点与局限性* (与队列研究作对比)
优点
特别适用于罕见病、潜伏期长疾病的病因研究
省力、省钱、省时间,并易于组织实施
可同时研究多个因素与某种疾病的联系
对研究对象多无损害
应用范围广,不仅应用于病因的探讨,而且广泛应用于其他健康事件的原因分析,如疫苗免疫学效果考核及暴发调查等
局限性
不适于研究暴露比例很低的因素
选择偏倚难以避免
获取既往信息时,难以避免回忆偏倚
暴露与疾病时间先后难以判断,论证因果关系的能力较弱
不能测定暴露组和非暴露组的发病率,不能直接分析RR,只能用OR 来估计RR