导图社区 流行病学
公共卫生流行病学思维导图,整理了疾病的分布、描述性研究、病例对照研究、实验流行病学、筛检、病因及其发现和推断等内容,一起来看吧!
编辑于2023-02-23 19:28:19流行病学
绪论
简史
发展史
学科形成前期
希波克拉底 《空气、水及地点》 全世界最早
意大利威尼斯 最早的检疫
英国John Graunt 第一张寿命表 设立比较组 将统计学引入流行病学领域
学科形成期
英国James Lind 流行病临床试验先河
英国Edward Jenner 主动免疫先河
英国伦敦流行病学学会_全世界第一个 标志流行病学学科的形成
英国John Snow 现场调查、分析与控制
学科发展期 (现代流行病学)
第一阶段
Jerome Cornfield 相对危险度、比值比
Nathan Mantel和William Haenszel 分层分析法
第二阶段
Sackett 总结35种偏倚
Miettinen 偏倚分类 比较、选择、信息
Jerome Cornfield 第一个多变量模型
Last 第一本《流行病学辞典》
第三阶段
融合、扩大
Schulte 《分子流行病学_原理和实践》
我国的成就
伍连德
旱獭_鼠疫_宿主
苏德隆
血吸虫、霍乱
何观清
中华白蛉_黑热病_传播媒介
钱宇平
遗传流行病学研究和获得性免疫缺陷综合征
定义
人群_疾病与健康_防制_策略
与Last提出的定义一致
诠释
研究内容的三个层次
疾病
伤害
健康
任务的三阶段
揭示现象
找出原因
提供措施
三种基本方法
观察法
实验法
数理法
学科的三大要素
原理
方法
应用
原理和应用
基本原理
实际应用
疾病预防和健康促进
疾病的监测
疾病病因和危险因素的研究
疾病的自然史
疾病防治的效果评价
研究方法
观察法
描述流行病学
现况研究
监测
生态学研究
产生假设
分析流行病学
病例对照研究
既能产生假设,又能检验假设
队列研究
检验假设
实验法
实验流行病学
临床试验
现场试验
个体试验
社区试验
验证假设
数理法
理论流行病学
特征
群体
对比(核心)
概率论和数理统计学
社会心理
预防为主
发展
与其他学科的关系及展望
疾病的分布
疾病频率测量指标
发病频率测量指标
发病率
定义
指一定期间内,-定范围人群中某病新发生病例出现的频率
公式
计算发病率需考虑的因素
新发病例数
暴露人口数
观察时间
应用
罹患率
定义
指在某一局限范围短时间内的发病率
优点
根据暴露程度较精确地测量发病频率
公式
应用
在食物中毒、职业中毒或传染病的暴发及流行中,常使用该指标
续发率(二代发病率)
定义
指某些传染病在最短潜伏期到最长潜伏期之间,易感接触者中发病人数占所有易感接触者数的百分比
公式
应用
常用于传染病的流行病学调查
比较传染病传染力的强弱
分析传染病流行因素及评价卫生防疫措施的效果
患病频率测量指标
患病率(现患率)
定义
是指某特定时间内总人口中某病新旧病例所占的比例
分类
时点患病率
期间患病率
影响患病率的原因
引起患病率升高的主要因素
新病例增加(即发病率增高)
治疗水平提高,病人免于死亡,但未痊愈,病程延长
未治愈者的寿命延长
病例迁入
健康者迁出
易感者迁入
诊断水平提高
报告率提高
引起患病率降低的主要因素
新病例减少(发病率下降)
病死率增高
病程缩短
治愈率提高
健康者迁入
病例迁出
患病率与发病率、病程的关系
患病率=发病率×病程
应用
反映疾病的现患状现
对于病程较长的慢性病,可反映其流行情况
用于估计某病对居民健康危害的严重程度,进行卫生经济学评价与分析
可为医疗没施规划,估计医院床位周转,卫生设施及人力的需要量,医疗质是的评估和医疗其用的投入等提供科学依据
患病率与发病率的比较
感染率
定义
指在某时间内被检人群中某病原体现有感染者人数所占的比例
公式
应用
在流行病学作中应用较为广泛,特别是对那些隐性感染、病原携带者及轻型和不典型病例的调查较为常用
研究某些传染病或寄生虫的感染情况和评价防制工作的效果
为估计某病的流行态势和制定防制措施提供依据
评价人群健康状况的常用指标
死亡与生存频率测量指标
死亡率
定义
在一定期间内,某人群中总死亡人数在该人群所占的比例
公式
应用
是测量人群死亡危险最常用的指标
反映一个人群总死亡水平的指标,用于衡量某一时期,某一地区人群死亡危险性的大小
既可反映一个地区不同时期人群的健康状况和卫生保健工作的水平,也可为该地区卫生保健工作的需求和规划提供科学展
作为疾病发生风险的指标,在病死率高和生存时间短共同存在的情况下死亡率可以反映人群的发病率(如胰腺癌)
死亡专率可提供某病死在人群、时间、地区上变化的信息,用于探讨病因和评价防制措施
病死率
定义
表示一定时期内因某病死亡者占该病病人的比例,表示病人因该病死亡的危险性
公式
应用
表示确诊某病者的死亡概率
反映疾病的严重程度
反映医疗水平和诊治能力,常用于急性传染病,也可用于慢性病.
一种疾病的病死率受疾病严重程度、诊断及治疗水平和病原体毒力的影响,随医疗水平、病因、环境和宿主等因素的变化而变化 用病死率作为评价不同医院的医疗水平时要注意医院间的可比性
病死率与死亡率不同,死亡率汁算时分母为平均人口数,包括了所研究疾病的病人和非病人,而病死率的计算只与所研究疾病的病人有关
婴儿死亡率
定义
反映一周岁以内儿死亡水平的指标,是指婴儿出生后不满周岁死亡人数与出生人数的比率
公式
应用
反映一个国家或地区医疗卫生条件、社会经济力、人民生活水平以及科技发展水平的重要指标,也是衛量人口素质的重要依据之一
生存率
定义
指接受某种治疗的病人或某病病人中,经n年随访尚存活的病人数所占的比例
公式
应用
反映疾病对生命的危害程度
可用于评价某些病程较长疾病的远期疗效,常用于癌症、心血管疾病、结核病等慢性疾病的研究
疾病负担指标
潜在减寿年数 (PYLL)
定义
是某病某年龄组人群死者的期望寿命与实际亡年龄之差的总和,即死亡所造成的寿命损失
应用
是人群中疾病负担测量的一个直接指标,也是评价人群健康水平的一个重要指标
比较不同疾病所致的寿命减少年数
比较不同地区及不同时间潜在减寿年数的特点及变化趋势
用于综合估计导致某人群早死的各种死因的相对重要性
用于防制措施效果的评价和卫生政策的分析
伤残调整寿命年 (DALY)
定义
指从发病到死亡所损失的全部健康寿命年,包括因早死所致的寿命损失年( YLL) 和疾病所致伤残引起的健康寿命损失年 (YLD)两部分
应用
比较与评价地区间的卫生健康状况
确定不同病种的疾病负担,分析不同人口学特征、不同地区、不同时间的危害程度及变化趋势
确定危害人群健康的主要病种及重点人群和地区
进行卫生经济学评价
疾病流行强度
指在一定时期内疾病在某地区人群中发病率的变化及其病例间的联系程度
散发
定义
指发病率呈历年的一般水平,各病例间在发病时间和地点上无明显联系,表现为散在发生
确定散发时多与当地近三年该病的发病率进行比较,如果当年发病率未明显超过既往平均水平,称为散发
当疾病预防与控制有效时,会呈现散发,常见于如下情况
1.病后免疫力持久的疾病,或因预防接种使人群维持一定免疫水平的疾病常呈散发,如麻疹。
2.有些以隐性感染为主的疾病,常以散发形式存在,如脊髓灰质炎、乙型脑炎等。
3.有些传播机制不容易实现的传染病也可出现散发,如斑疹伤寒、炭疽等。
4.某些长潜伏期传染病也以散发形式存在,如麻风。
暴发
定义
指局部地区或集体单位,短时间内突然发生很多症状相同病人的现象。
特点
这些人多有相同的传染源或传播途径。大多数病人常同时出现在该病的最短和最长潜伏期之间。
例如
托幼机构的麻疹、手足口病、腮腺炎、甲型病毒性肝炎等疾病的暴发。
流行
定义
指在某地区某病的发病率显著超过该病历年发病率水平
特点
相对于散发,流行出现时各病例之间呈现明显的时间和空间联系
例如
2009 年甲型 H1N1 流感的流行表现出明显的人与人间的传播关系和地域间的播散特征
当某地出现某种疾病的流行时,提示当地可能存在共同的传播困素。
大流行
定义
某病发病率显著超过该病历年发病率水平,疾病蔓延迅速,涉及地区广,在短期内跨越省界、国界甚至洲界形成世界性流行,称之为大流行
例如
流感、霍乱、2009年甲型H1N1流感
疾病的分布
人群分布
年龄
最主要的人口学特征之一,几手所有疾病的发生及发展均与年龄有相当密切的关系
横断面分析
主要分析同一时期不同年龄组或不同年代各年龄组的发病率、患病率或死亡率的变化,多用于某时期传染病或潜伏期较短疾病的年龄分布分析。
对于慢性病,由于暴露时间距发病时间可能很长,致病因子在不同时间的强度也可能发生变化,而同一年 代出生的群体对致病因素暴露的时间和强度具有一定的相似性。
出生队列分析
同一时期出生的一组人群称为出生队列,对其随访若干年,以观察发病情况。
这种利用出生队列资料将疾病年龄分布和时间分布结合起来描述的方法称出生队列分析。
该方法在评价疾病的年龄分布长期变化趋势及提供病因线索等方面具有很大意义。
它可以明确地呈现致病因子与年龄的关系,有助于探明年龄,所处时代暴露特点及经历在疾病的频率变化中的作用。
性别
绝经前女性患心脏病的概率低于男性
职业
石棉工人间皮瘤
在研究职业与疾病的关系时应主要考虑的因素
1.职业是劳动者所处的作业环境,社会经济地位、卫生文化水平、体力劳动强度和精神紧张程度等因素的综合指标
2.疾病的职业分布与作业环境致病因子暴露有关。
3.职业相关致病因子的暴露及其作用与劳动条件、防护设施有关。
4.不同职业人群疾病种类不同,防制重点各异。
5.职业暴露时间及既往职业史对疾病发生的影响。
种族和民族
如黑种人镰刀细胞贫血
婚姻与家庭
已婚妇女宫颈癌发病率高
行为生活方式
吸烟→肺癌、食管癌
流动人口
疟疾、鼠疫
宗教信仰
犹太教→宫颈癌、阴茎癌发病率低
地区分布
疾病的地区分布可采用行政区划法或自然景观法对资料进行归纳和分析
国家间及国家内不同地区的分布
疾病在不同国家间的分布
艾滋病→全球
霍乱→印度
疾病在同一国家内不同地区的分布
鼻咽癌→广东
食管癌→河南
城乡分布
城市
呼吸道传染病、水痘
农村
肠道传染病
地区聚集性
某地区发病及患病等疾病频率高于周围地区的情况,该地区疾病频率超过了随机概率,称为疾病的地区聚集性
地方性
由于自然因素或社会因素的影响,某种疾病经常存在于某一地区或只在一定范围人群中发生,而不需自外地输入时称为地方性。一般可有三种类型。
统计地方性
由于生活条件、卫生条件和宗教信仰等社会因素使某一地区某些疾病发病率长期显著高于其他地区,与该地自然环境关联甚微,称统计地方性。
如痢疾等肠道传染病流行,常发生于卫生条件和经济条件差,人群卫生习惯不良的地区。
自然地方性
某些疾病受自然环境的影响只在某一特定地区存在的情况称为自然地方性。
两种情况
一类是该地区有适合于某种病原体生长发育和传播媒介生存的自然环境,使该病只在这一地区存在,如血吸虫病和丝虫病等
另一类是疾病与自然环境中的微量元素分布有关,如地方性甲状腺肿和氟中毒等。
自然疫源性
某些疾病的病原体在繁衍种属过程中不依赖于人,而在野生动物或家畜中传播,人是偶尔介入该环节时受到感染,这种情况称为自然疫源性
这些疾病称为自然疫源性疾病,如鼠疫、流行性出血热和森林脑炎等
输入性疾病(外来性疾病)
凡本国或本地区不存在或已消灭的传染病,从国外或其他地区传人时,称为输人性传染病
如艾滋病是在 20 世纪 80 年代初期由国外传人我国
地方性疾病
指局限于某些特定地区内相对稳定并经常发生的疾病,也称地方病。
从广义上看,由各种原因所致的具有地区性发病特点的疾病均属地方病,这类疾病表现为经常存在于某一地区或人群,并有相对稳定的发病率。
一般意义上讲是一类由于自然地理环境中人体正常代谢所需的某些微量元素过多或者缺乏所致的疾病。如地方性氟中毒、地方性砷中毒、碘缺乏病、大骨节病等
判断一种疾病是否属于地方性疾病的依据是
①该地区的居民发病率高。
②其他地区居住的人群发病率低,甚至不发病。
③迁人该地区一段时间后,其发病率和当地居民一致。
④迁出该地区后,发病率下降,患病症状减轻或自愈。
⑤当地的易感动物也可发生同样的疾病。
时间分布
短期波动
一般是指持续几天,几周或几个月的疾病流行或疫情暴发,是疾病的特殊存在方式。
其含义与暴发相近,区别在于暴发常用于少量人群,而短期波动常用于较大数量的人群。
短期波动一般具有比较确定的原因,多数情况下是由于大量人群同时或持续暴露于某共同致病
季节性
短期波动一般具有比较确定的原因,多数情况下是由于大量人群同时或持续暴露于某共同致病
严格的季节性
在某些地区以虫媒传播的传染病发生有严格的季节性,发病多集中在少数几个月内,其余月份没有病例的发生
我国北方地区流行性乙型脑炎发病高峰在夏秋季病,其他季节无病例出现,表现出乙脑流行严格的季节性特点
季节性升高
一年四季均发病,但仅在一定月份发病率升高
如肠道传染病和呼吸道传染病,全年均有病例发生 ,但肠道传染病多见于夏秋季,而呼吸道传染病在冬春季高发。非传染病也有季节性升高的现象。如克山病、冠心病,出生缺陷也表现有季节性波动,但乙型病毒性肝炎、麻风、梅毒等传染病的季节性并不明显。
周期性
指疾病频率按照一定的时间间隔,有规律地起伏波动,每隔若于年出现一个流行高峰的现象。
多见于呼吸道传染病,流行性感冒、流行性脑脊髓膜炎、百日咳、水痘、白喉等
主要是由于易感者积累使人群易感性增加,形成发病率增高的现象
影响疾病周期性及间隔时间的常见原因
1.人口密集,交通拥挤和卫生条件差等因素利于疾病的传播。当有传染源和足够数量的易感者存在,又无有效的预防措施时,其流行特征呈现一定的周期性。
2.传播机制容易实现的疾病,当易感者积累到足够数量便可迅速传播。而疾病流行后,新的易感者积累的速度,特别是新生儿的增加,影响疾病周期间隔的时间,累积速度越快,间隔越短。
3.病后可形成稳固免疫的疾病,一度流行后发病率可迅速下降,流行后人群免疫水平持续时间越久,周期间隔越长。
4.周期性的发生还取决于病原体变异及其变异的速度,是影响疾病周期间隔时间的重要因素。
长期趋势(长期变异/长期变动)
指在一个比较长的时间内,通常为几年或几十年,疾病的临床特征、分布状态、流行强度等方面所发生的变化。
有些疾病可表现出经过几年或几十年发病率持续上升或下降的趋势。
长期变异的出现主要原因
病因或致病因素的变化
病原体的变异
机体免疫状况的改变
医疗和防制水平的提高
报告及登记制度完善程度等
疾病的人群、地区、时间分布的综合描述
移民流行病学
是进行疾病人群、地区和时间分布综合描述的一个典型。移民是指居民由原来居住地区迁移到其他地区,包括国外或国内不同省、市、自治区的现象。
由于居住地变迁,气候条件、地理环境等自然因素的变化,生活方式、风俗习惯等社会因素的差异,移民人群疾病频率会发生程度不同的变化。
移民流行病学是探讨疾病病因的一种方法。它是通过观察疾病在移民、移居地当地居民及原居地人群间的发病率或死亡率的差异,从而探讨疾病的发生与遗传因素或环境因素的关系。
移民流行病学常用于肿瘤、慢性病及某些遗传病的病因和流行因素的探讨
移民流行病学研究应遵循的原则
1.若某病发病率或死亡率的差别主要是环境因素作用的结果,则该病在移民人群中的发病率或死亡率与原住国(地区)人群不同,而接近移居国(地区)当地人群的发病率或死亡率。
2.若该病发病率或死亡率的差别主要与遗传因素有关,则移民人群与原住国(地区)人群的发病率或死亡率近似,而不同于移居国(地区)当地人群。
在进行移民流行病学分析与结果解释时应考虑移民生活条件和生活环境的改变程度、原居地及移居地的医疗卫生水平及移民移居的原因,还应考虑移民的人口学特征如年龄、职业、文化水平,社会经济状况,种族和其他人口学因素。若环境因素与某病发生的关系较大时,一般幼年迁移到新移居地后,更容易受新移居地环境的影响。移民的世代数与疾病的发病率也有关,移民在新环境居住的世代数越多,越接近移居国居民的发病水平。
描述性研究
是流行病学研究方法中最基本的类型,主要用来描述人群中疾病或健状况及暴露因素的分布情况,目的是提出病因假设,为进一步调查提供研究线索,该类研究还可用来确定高危人群,评价公共卫生措施的效果等,是分利性研究的基础。
概念
指利用常规监测记录或通过专门调查获得的数据资料(包括实验室检查结果),按照不同地区、不同时间及不同人群特征进行分组,描述人群中有关疾病或健康状态以及有关特征和暴露因素的分布状况,在此基础上进行比较分析,获得疾病三间(人群、地区和时间)分布的特征进而获得病因线索,提出病因假设
种类
现况研究 (横断面研究、患病率研究)
概述
概念
是通过对特定时点(或期间)和特定范围内人群中的疾病或健唐状况和有关因素的分布状况的资料收集、描述,从而为进一步的研究提供病因线索
特点
现况研究一般在设计阶段不设对照组
与病例对照研究不同,病例对照研究根据暴露状态或疾病状态先进行分组,然后收集研究对象的资料
根据研究目的确定研究对象,然后调查研究对象在某一特定时点上的暴露(特征)和疾病的状态
在资料处理与分析时,则可根据暴露(特征)的状态或是否患病的状态来分组比较
特定时间
关注某一特定时点上或某一特定时期内某一群体中暴露与疾病的状况或联系
在确定因果联系时受到限制
原因
1、现况研究中,研究对象一般都是存活期较长的病人。某些病程较短的疾病病人(如迅速痊愈或很快死亡),则很难包括在一个时点或一个短时期的研究中
2、现况研究一般揭示的是某一时点或时期暴露(特征)与疾病的关系,而不能确定暴露(特征)与疾病时间顺序关系
对研究对象固有的暴露因素可以作因果推断
诸如性别、种族、血型、基因型等因素,在疾病发生之前就存在,且不会因是否患病而发生改变,则在排除和控制了可能存在的偏倚的情况下,现况研究可以提供相对真实的暴露(特征)与疾病的时间先后顺序的联系,从而进行因果判断。
用现在的暴露(特征)来替代或估计过去情况的条件
需符合的条件
现在的暴露或暴露水平与过去的情况存在着良好的相关关系,或己被证明变化不大
已知研究因素的暴露水平的变化趋势或规律,以此趋势或规律来估计过去的暴露水平
回忆过去的暴露或暴露水平极不可靠,而现在的暴露资料可以用来估计过去的暴露情况
定期重复进行可以获得发病率资料
两次现况研究的现患率之差,除以两次现况研究之间的时间间隔,即是该时期的发病率
要求两次现况研究之间的时间间隔不能太长,在该时间范围内发病率的变化不大,且疾病的病程稳定
避免了需要长期随访监测研究对象来获得发病率资料的研究分法的弱点
类型
普查(全面调查)
定义
指在特定时点或时期内、特定范围内的全部人群(总体)作为研究对象的调查。(这个特定时点应该较短)
目的
早期发现、早期诊断和早期治疗病人
了解慢性病的患病及急性传染性性疾病的疫情分布
了解当地居民健康水平
了解人体各1类生理生化指标的正常值范围
优点
调查对象为全体目标人群,不存在抽样误差
可以同时调查目标人群弹p多种疾病或健康状况的分布情况
能发现目标人群中的全部病例,在实现"三早"(早期发现、早期诊断、早期治疗)预防的同时,全面地描述疾病的分布与特征,为病因分析研究提供线索
缺点
不适用患病率低且无简便易行诊断手段的疾病
工作量大,因此不易细致,难免存在漏查
调查工作人员涉及面广,掌握调查技术和检查分法的熟练程度不一,对调查项目的理解往往很难统一和标准化,较难保证调查质量
耗费的人力、物力资源一般较大,费用往往较高
抽样调查
定义
指通过随机抽样的方法,对特定时点、特定范围内人群的一个代表性样本进行调查,以样本的统计量来估计总体参数所在的范围,即通过对样本中的研究对象的调查一研究来推论斯所在总体的情况
优点
节省时间、人力和物力资源
调查范围小,调查工作易于做得细致
缺点
设计、实施与资料分析均比普查要复杂
资料的重复或遗漏不易被发现
对于变异过大的研务对家或因素和需要普查普治的疾病则不适合用抽样调查
患病率太低的疾病不适用抽样调查,因为需要很大的样本量,如果抽样比大于75%,则不如进行普查
抽样调查的基本要求是能将从样本获得的结果推论到整个群体(总体),为此,抽样必须随机化,样本量要足够
用途
用于掌握目前群体中疾病或健康状况的分布
提供疾病病因研究的线索
确定高危人群
评价疾病监测、预防接种等防制措施的效果
设计与实施
确定研究目的
这是研究设计的重要步骤,应根据研究所期望解决的问题,明确该次调查所要达到的目的
确定研究的类型
根据具体的研究目的来确定采用普查还是抽样调查
确定研究对象
确定合适的研究对象同样是顺利开展现况研究的关键环节,应根据研究目的对调查对象的人群分布特征、地域范围以及时间点有一个明确的规定,并结合实际情况明确在目标人群中开展调查的可行性。
确定样本含量和抽样方法
样本量
样本量一般来说,由于抽样调查较普查有很多优越性,所以现况研究常采用抽样的办法。也可以采用抽样与普查相结合的方法。
决定现况研究的样本量大小的因素来自多个方面
①预期现患率(p);
②对调查结果精确性的要求:即容许误差(d)越大,所需样本量就越小;
③要求的显著性水平(α):α值越小,即显著性水平要求越高,样本量要求越大。
抽样方法
单纯随机抽样
系统抽样
分层抽样
整群抽样
多阶段抽样
资料收集
确定拟收集资料的内容
个人的基本情况
职业情况
生活习惯及保健情况
妇女生育情况
环境资料
人口学资料
调查员培训
资料收集的方法
通过实验室测定或检查的方法来获取
编制调查表后对研究对象进行调查,进而获得暴露或疾病的资料
利用常规资料
数据整理与分析
现况研究的常见偏倚及其控制
常见的偏倚
偏倚:指从研究设计与实施到数据处理和分析的各个环节中产生的系统误差,以及结果解释,推论中的片面性导致的研究结果与真实情况之间出现的倾向性的差异,进而导致对暴露与疾病之间联系的错误描述。
①主观选择研究对象,即选择研究对象具有随意性,将随机抽样当作随意抽样;
②任意变换抽样方法,如原本根据出院号来随机选择(抽样),之后又改用入院号等其他方法来抽样;
③调查对象因不愿合作或其他种种原因不能或不愿意参加调查从而降低了应答率,若应答率低于 70%就难以用调查结果来估计整个研究总体的状况(称为无应答偏倚);
④所调查到的对象均为幸存者,使得调查结果有一定的局限性和片面性,不能全面反映实际情况(称为幸存者偏倚);
选择偏倚
⑤询问调查对象有关问题时,由于种种原因回答不准确(称为报告偏倚)或调查对象对过去的暴露史或疾病史等回忆不清,特别是健康的调查对象由于没有疾病的经历,而容易将过去的暴露情况等遗忘(称为回忆偏倚);
⑥调查员有意识地深入调查某些人的某些特征,而不重视或马虎对待其他人的这些特征(称为调查偏倚);
⑦在资料收集过程中测量工具、检验方法不正确,化验操作不规范等(称为测量偏倚)。
信息偏倚
偏倚的控制
①严格遵照抽样方法的要求,确保抽样过程中随机化原则的切实实施;
②提高研究对象的依从性和受检率;
③正确选择测量工具和检测方法,包括调查表的编制等;
④组织好研究工作,调查员一定要经过培训,统一标准和认识;
⑤做好资料的复查、复核等工作;
⑥选择正确的统计分析方法,注意辨析混杂因素及其影响。
偏倚是可以避免或减小的,因而在现况研究或其他类型的研究中需要对调查资料进行质量控制,以便尽量减少偏倚的产生,从而能描述事物或事件的真实情况。有效的质量控制的前提是研究设计时要反复论证,尽量设计严密,并应考虑到调查中或调查结束时对资料进行质量评价的方法和指标。
优缺点
优点
抽样调查的样本一般来自人群,即从一个目标群体中,随机地选择一个代表性样本来进行暴露与患病状况的描述研究,故其研究结果有较强的推广意义,以样本估计总体的可信度较高。
现况研究是在资料收集完成之后,将样本按是否患病或是否暴露来分组比较的,即有来自同一群体自然形成的同期对照组,使结果具有可比性。
现况研究往往采用问卷调查或实验室检测等手段收集研究资料,故一次调查可同时观察多种因素,其在疾病病因探索过程中,为不可或缺的基础工作之一。
抽样调查
缺点
现况研究与分析性研究的一个明显区别是其对特定时点即某一时间横断面和特定范围的规定,收集的信息通常只能反映调查当时个体的疾病与暴露状况,难以确定先因后果的时相关系。
现况研究调查得到的是某一一时点是否患病的情况,故不能获得发病率资料,除非在一个稳定的群体中,连续进行同样的现况调查。
在一次现况研究中,如果研究对象中一些人正处在所研究疾病的潜伏期或者临床前期,则其极有可能会被误定为正常人,使研究结果发生偏倚,低估该研究群体的患病水平。
病例报告
病例系列分析
个案研究
历史资料分析
随访研究
生态学研究 (相关性研究)
概述
概念
是在群体的水平上研究某种暴露因素与疾病之间的关系,以群体为观察和分析的单位,通过描述不同人群中某因素的暴露状况与疾病的频率,分析该暴露因素与疾病之间的关系
特点
最基本特征:不以个体为欢察和分析的单位,而是以群体为单位
虽能通过描述不同人群中某因素的暴露情况与疾病频率来分析该因素与疾病的关系,但去法得知个体的暴露与效应(疾病)间的因果关系
从许多因素中探索病因线索的一种常用方法,但其提供的信息是不完全的,只是一种粗线条的描述性研究
用途
提供病因线索,产生病因假设
评估人群干预措施的效果
类型
生态比较研究
应用较多的一种
最简单的方法是观蔡不同人群或地区某种疾病的分布,然后根据疾病分布的差异,提出病因假设
生态趋势研究
是连续观察人群中某因素平均暴露水平的改变与某种疾病的发病率、死亡率变化的关系,了解其变动趋势;通过比较暴露水平变化前戶疾病率的变化情况,来判断某因素与某疾病的联系
资料收集(来源)
地理信息系统的应用
大数据的应用
优缺点
优点
1.生态学研究常可应用常规资料或现成资料(如数据库)来进行研究,因而节省时间、人力和物力,且可以较快得到结果。
2.生态学研究对病因未明的疾病可提供病因线索供深人研究,这是生态学研究最显著的特点。
3.对于个体的暴露剂量无法测量的情况,生态学研究是唯一可供选择的研究方法。
4.当研究的暴露因素在一个人群中变异范围很小时,很难测量其与疾病的关系。这种情况下,更适合采用多个人群比较的生态学研究
5.生态学研究适合于对人群干预措施的评价。在某些情况下,如果不是直接的个体水平上的危险因素的控制,而是通过综合方式(如健康教育与健康促进等)减少人群对危险因素的暴露,对此干预措施的评价只需在人群水平上进行,则生态学研究更为适合。
6.在疾病监测工作中,应用生态趋势研究可估计某种疾病发展的趋势。
缺点
生态学谬误
在生态学研究中,生态学谬误是此类研究最主要的缺点。它是由于生态学研究以各个不同情况的个体“集合”而成的群体(组)为观察和分析的单位,以及存在的混杂因素等原因而造成研究结果与真实情况不符。
生态学谬误是生态学研究的最主要缺陷。
生态学谬误的产生主要有以下几种原因
①缺乏暴露与结局联合分布的资料。研究者只知道每个研究人群内的暴露和非暴露人群量,发生研究结局和未发生数,但不知暴露,非暴露人群中各有多少个体发生了研究结局,即无法在个体水平确定暴露与研究结局联合分布的信息。
②无法控制可疑的混杂因素。由于它是在群体水平上进行观察分析的研究,因此无法对个体水平上混杂因素的分布不均进行控制。
③相关资料中的暴露水平只是近似值或平均水平,并不是个体的真实暴露情况,无法精确评价暴露与疾病的关系,造成对暴露与研究结局之间联系的一种曲解。
混杂因素往往难以控制
难以确定两变量之间的因果联系
特点
以观察为主要研究手段,不对研究对象采取任何干预措施,仅通过观察、收集和分析相关数据,分析和总结研究对象或事件的特点
暴露因素的分配不是随机的,且在研究开始时一般不设立对照组
暴露与结局的时序关系无法确定,对于暴露与结局间关系的因果推断存在一定的局限性,仅可做些初步的比较性分析,但可为后续的分析性或实验研究提供线索
用途
描述疾病或者健康状况的分布及发生发展的规律
获得病因线索,提出病因假没
队列研究 (前瞻性研究,发生率研究,随访研究,纵向研究)
概述
概念
队列研究
是将人群按是否暴露于某可疑因素及其暴露程度分为不同组,追踪其各组的结局,比较不同组之间结局频率的差异,从而判定暴露因素与结局之间有无因果关联及关联大小的一种观察性研究方法。这里观察的结局主要是与暴露因素可能有关的结局。
暴露
暴露是指研究对象接触过某种待研究的物质(如重金属)或具有某种待研究的特征(如年龄、性别及遗传性状等)或行为(如吸烟),同时,暴露一定是本研究需要探讨的因素,是与特定的研究目的密切相关的。
队列
表示一个特定的研究人群
出生队列
在某特定时期内出生的一组人群,具有某种共同暴露或特征的一组人群,可称为某暴露队列
危险因素(危险因子)
危险因素的反面称为保护因素,两者都可作为研究因素,可统称为决定因素或影响因素。
泛指能引起某特定不良结局(如疾病)发生,或使其发生的概率增加的因子, 包括个人行为、生活方式,环境和遗传等多方面的因素。
基本原理
队列研究的基本原理是在一个特定人群中选择所需的研究对象,根据目前或过去某个时期是否暴露于某个待研究因素(危险因素或保护因素),或其不同的暴露水平而将研究对象分成不同的组,如暴露组和非暴露组,高剂量暴露组和低剂量暴露组等,随访观察一段时间,检查并登记各组人群待研究的预期结局的发生情况(如疾病,死亡、或其他健康状况),比较各组结局的发生率,从而评价和检验研究因素与结局的关系。
如果暴露组某结局的发生率明显高于或低于非暴露组,则可推测暴露与结局之间可能存在因果关系,暴露是影响该结局发生的决定因素。在队列研究中,所选研究对象在随访开始时必须是没有出现所研究的结局,但在随访期内有可能出现该结局(如疾病)的人群。暴露组与非暴露组必须有可比性,非暴露组应该是除了未暴露于某因素之外,其余各方面都尽可能与暴露组相同的一组人群。
队列研究的一些基本特点
属于观察法
队列研究中的暴露不是人为给予的,不是随机分配的,而是在研究之前已客观存在的,不受研究者意志决定
设立对照组
研究设计阶段和资料分析阶段都需要设置对照组
由因及果
疾病发生之前就确立了研究对象的暴露状况,而后探求暴露因素与疾病的关系
检验暴露与结局的因果联系能力较强
研究者掌握了研究对象的暴露状况并随访了结局的发生,且结局的发生在确切数目的暴露人群中,所以能据此准确地计算出结局的发生率,估计暴露人群发生某结局的危险程度
研究目的
检验病因假设
一次队列研究可以只检验一种暴露与一种疾病之间的因果关联,或同时检验一种暴露与多种结局之间的关联
评价预防措施效果
当某些可能的预防措施(暴露)不是人为给予的,而是研究对象的自发行为 "人群自然实验"
研究疾病的自然史
临床只能观察单个病人从起病到痊愈或死亡的过程 而队列研究可以观察人群从暴露于某因素后,疾病逐渐发生、发展直至结局的全过程
新药的上市后监测
暴露是某新药的应用,研究结局多为各种不良反应 新药应用不是研究者选择性给予的,是暴露看自己选择的,用与不用是随机的
研究类型
前瞻性队列研究
研究对象的分组是根据研究对象现时的暴露状况而定的,此时研究的结局还没有出现,需要前瞻观察一段时间才能得到
研究者可以按要求直接获取关于暴露与结局的第一手资料,偏倚较小,结果可信
缺点:所需观察的人群样本很大,观察时间长花费大
历史性队列研究(非即时性或回顾性队列研究)
研究对象的分组是根据研究开始时研究者已掌握的有关研究对象在过去某个时点的暴露情况的历史材料做出的;研究开始时研究的结局已经出现,不需要前瞻性观察
省时,省力,出结果快
缺点:因资料积累时未受到研究者的控制,所以内容上未必符合要求
双向性队列研究(混合型队列研究)
在历史性队列研究的基础上,继续前瞻性观察一段时间(上边两种的结合)
不同研究类型的选用原则
前瞻性队列研究
①应有明确的检验假设,检验的暴露因素必须找准
②所研究疾病的发病率或死亡率应较高,如不低于 5%
③应明确规定暴露因素的测量,并且应有把握获得观察人群的暴露资料
④应明确规定结局变量,如发病或死亡,并且要有确定结局的简便而可靠的手段
⑤应有把握获得足够的观察人群,并将其清楚地分成暴露组与非暴露组
⑥大部分观察人群应能被随访到研究结束,并取得完整可靠的资料
⑦应有足够的人力、财力、物力支持该项工作
历史性队列研究
前瞻性队列研究的①~⑤点
考虑在过去某段时间内是否有足够数量的,完整可靠的,有关研究对象暴露和结局的历史记录或档案材料
双向性队列研究
当基本具备进行历史性队列研究的条件下,如果从暴露到现在的观察时间还不能满足研究的要求,如结局事件还没有发生或没有完全发生,还需继续前瞻性观察一段时间时,则选用双向性队列研究
研究设计与实施
确定研究因素
一般应对暴露因素进行定量,除了暴露水平以外,还应考虑暴露的时间,以估计累积暴露剂量。同时还要考虑暴露的方式,如间歇暴露或连续暴露,直接暴露或间接暴露、一次暴露或长期暴露等。暴露的测量应采用敏感、精确、简单和可靠的方法。
除了要确定主要的暴露困素外,还应同时确定需要收集的其他相关因素,包括各种可疑的混杂因素及研究对象的人口学特征,以利于在后续阶段对研究结果作深入分析。
确定研究结局
结局变量(结果变量,结局)指随访观察中将出现的预期结果事件,也即研究者希望追踪观察的事件
结局就是队列研究观察的自然终点
研究结局的确定应全面,具体,客观。结局不仅限于发病、死亡,也有健康状况和生命质量的变化;既可是终极的结果(如发病或死亡),也可是中间结局(如分子或血清的变化);结局变量既可是定性的,也可是定量的,如血清抗体的滴度、尿糖及血脂等;结局变量既可是负面的(如疾病发生),也可是正面的(如疾病康复)。
结局变量的测定,应给出明确统一的标准,并在研究的全过程中严格遵守。 既按国际或国内统一的标准判断结局,又按自定标准判断,准确记录下其他可疑症状 或现象供以后分析时参考
确定研究现场与研究人群
研究现场
由于队列研究的随访时间长,因此,队列研究的现场选择除要求有足够数量的符合条件的研究对象外,还要求当地的领导重视,群众理解和支持,最好是当地的文化教育水平较高,医疗卫生条件较好,交通较便利。能选择符合这些条件的现场,将使随访调查更加顺利,所获资料将更加可靠。当然,也要考虑现场的代表性。
研究人群
暴露人群的选择
暴露人群即暴露于待研究因素的人群
职业人群
如果要研究某种可疑的职业暴露因素与疾病或健康的关系,必须选择相关职业人群作为暴露人群
由于职业人群有关暴露与疾病的历史记录往往较为全面、真实和可靠,故在历史性队列研究中,所选择的暴露人群常为职业人群
特殊暴露人群
研究某些罕见的特殊暴露的唯一选择
由于对某些职业暴露和某些特殊暴露的危险多半不是一开始就认识到的,一旦认识到了,大多都采取了防护措施以减少暴露,所以一般不易或不允许进行前瞻性队列研究,而常使用历史性队列研究
一般人群
某一区域范围内的全体人群,选择其中暴露于欲研究因素的人做暴露组
①不打算观察特殊人群发病的情况,而着眼于一般人群及今后在一般人群中的防治,使研究结果具有普遍意义
②所研究的因素和疾病都是一般人群中常见的,不必要选择特殊人群或没有特殊人群可寻,特别是在研究一般人群的生活习惯或环境因素时
有组织的人群团体
该类人群可看作是般人群的特殊形式
选择这样的人群的主要目的是利用他们的组织系统,便于有效地收集随访资料。而且他们的职业和经历往往是相同的,可增加其可比性。
对照人群的选择
内对照:即先选择一组研究人群,将其中暴露于所研究因素的对象作为暴露组,其余非暴露者即为对照组。
在选定的一群研究对象内部既包含了暴露组,又包含了对照组。这样做的好处是,选取对照比较省事,并可以无误地从总体上了解研究对象的发病率情况,并且可比性较好。
外对照:当选择职业人群或特殊暴露人群作为暴露人群时,往往不能从这些人群中选出对照,而常需在该人群之外去寻找对照组。
选用外对照的优点是随访观察时可免受暴露组的影响,即暴露组的“污染”,缺点是需要费力去另外组织一项人群工作。
总人口对照:这种对照可认为是外对照的一种,是利用整个地区的现成的发病或死亡统计资料,即以全人群为对照,而不是与暴露组平行地设立一个对照组进行调查
优点是对比资料容易得到
缺点是资料比较粗糙,往往不十分精确或缺乏欲比较的详细资料, 可比性差。另外,对照中可能包含有暴露人群
总人口对照一般用于总人群中暴露者的比例很小的情形
当采用总人口做对照时,并不以暴露组和总人口的发病率直接作比较,而是采用标化比,如标化死亡比(SMR),即用暴露组的发病或死亡人数与用总人口率算出的期望发病或死亡数字求标化比
在用特殊暴露人群或职业人群做暴露组时,常采用总人口做对照。另外,在利用总人口作对照时,尽量应用与暴露人群在时间、地区及人群构成上相近的总人群为对照,以减少偏倚。
多重对照:或叫多种对照,即同时用上述两种或两种以上的形式选择多组人群作对照,以减少只用一种对照所带来的偏倚,增强结果的可靠性。但多重对照无疑增加了研究的工作量。
确定样本量
计算样本量时需考虑的问题
暴露组与对照组的比例:一般说来,对照组的样本量不宜少于暴露组的样本量,通常是等量的。只有当暴露组样本不够时,为了达到统计学要求,可考虑增加对照组样本。
失访率队列研究通常要追踪观察相当长一段时间,这期间内研究对象的失访几乎是难免的。因此在计算样本量时,需要预先估计一下失访率,适当扩大样本量,防止在研究的最后阶段因失访导致样本量不足而影响结果的分析。假设失访率为 10%,则可按计算出来的样本量再加 10%作为实际样本量。
影响样本量的因素
一般人群(对照人群)中所研究疾病的发病率(p0)
暴露组与对照组人群发病率之差(d)
d值越大,所需样本量越小。如果暴露组人群发病率p1不能获得,可设法取得其相对危险度(RR)的估计值,由式p1=RRXp0可求得p1
要求的显著性水平
即检验假设时的第Ⅰ类错误(假阳性错误)α值。要求假阳性错误出现的概率越小,所需样本量越大。通常取α=0.05 或 0.01,取 0.01 时所需样本量较取 0.05 时大。
效力
又称把握度(1-B),β为检验假设时出现第Ⅱ类错误(假阴性错误)的概率,而1-β 为检验假设时能够避免假阴性的能力,即效力。若要求效力(1-8)越大,即β 值越小,则所需样本量越大。通常取β为 0.10,有时用 0.20。
样本量的计算
子主题
资料的收集与随访
基线资料的收集
在研究对象选定之后,必须详细收集每个研究对象在研究开始时详细的基本情况,包括暴露的资料及个体的其他信息,这些资料一般称为基线资料或基线信息
这些信息一方面可作为判定暴露组与非暴露组的依据,也为今后仔细分析和调整其他影响研究结局的因素提供保证。
基线资料一般包括待研究的暴露因素的暴露状况,疾病与健康状况,年龄、性别、职业、文化、婚姻等个人状况,家庭环境,个人生活习惯及家族疾病史等。
获取基线资料的方式
①查阅医院、工厂、单位及个人健康保险的记录或档案
②访问研究对象或其他能够提供信息的人
③对研究对象进行体格检查和实验室检查
④环境调查与检测
随访
随访对象与方法
所有被选定的研究对象,不论是暴露组或对照组都应采用相同的方法同等地进行随访,并坚持追踪到观察终止期。对失访者需要进行补访,未能追访到的,应尽量了解其原因,以便进行失访原因分析。同时可比较失访者与继续观察者的基线资料,以估计可能导致的偏差。
随访方法包括对研究对象的直接面对面访问、电话访问、自填问卷,定期体检,环境与疾病的监测,医院医疗与工作单位的出勤记录的收集等。随访方法的确定应根据随访内容、随访对象及投入研究的人力、物力等条件来考虑。应该强调的是,对暴露组和对照组应采取相同的随访方法,且在整个随访过程中,随访方法应保持不变。
随访内容
一般与基线资料内容一致,但随访收集的重点是结局变量,其具体项目视研究目的与研究设计而不同。将各种随访内容制成调查表在随访中使用,并贯彻始终。有关暴露状况的资料也要不断收集,以便及时了解其变化
观察终点
指研究对象出现了预期的结果,达到了这个观察终点,就不再对该研究对象继续随访。这里强调的是出现预期结果。如果某对象猝死于脑卒中,尽管已不能对其随访,但仍不作为到达终点对待,而应当看作是一种失访,在资料分析时作为失访处理。
一般情况下,观察终点可以是疾病或死亡,但也可是某些指标的变化,根据研究的要求不同而不同。对观察终点的判断应在设计中定出明确的标准,规定明确的判断方法,这种规定自始至终不能改变,即使是实际医疗工作中已有所改变,但在本研究中也不能改变,以免造成疾病错分的误差。发现终点的方法要敏感、可靠、简单、易被接受。
观察终止时间
指整个研究工作截止的时间,也即预期可以得到结果的时间。
终止时间直接决定了观察期的长短,而观察期长短是以暴露因素作用于人体至产生疾病结局的时间,即潜伏期(或潜隐期)为依据的,还应考虑所需的观察人年数。
要在考虑上述两个因素的基础上尽量缩短观察期,以节约人力、物力,减少失访。观察时间过短,可能得不出预期的结果;但追踪时间越长,失访率越高,消耗越大,结果可能也受影响。
随访间隔
如果观察时间较短,在观察终止时一次搜集资料即可。但如果观察时间较长,则需多次随访,其随访间隔与次数将视研究结局的变化速度,研究的人力、物力等条件而定。一般慢性病的随访间隔期可定为1~2年。
随访者
根据随访内容的不同,调查员可以是普通的询问调查者,也可以是实验室的技术人员、临床医生等,但随访调查员必须认真进行培训。研究者可以参加随访,但最好是不亲 自参与,因为研究者随访易于带来主观的偏倚,而不知情的局外人士反而能够获取更客观的信息。
质量控制
1.调查员的选择
2.调查员培训
3.制定调查员手册
4.监督
资料的整理与分析
资料整理模式
人时的计算
队列研究由于时间跨度较长,观察对象经常处于动态之中,队列内对象被观察的时间可能很不一致,此时以人为单位计算率就不合理。较合理的办法是加入时间因素,引入人时的概念来描述观察对象的暴露经历,人时即观察人数与观察时间的乘积,常用的人时单位是人年。
以个人为单位计算人年(精确法)
即将每个人的精确的观察时间(精确到天)相加,最后折算成年。
该法结果精确,手工计算时资料处理麻烦,通常使用计算机程序处理。
用近似法计算人年
如果不知道每个队列成员进入与退出队列的具体时间(精确到天),就 不能用上述方法直接计算人年数;另外,如果样本量很大,对人年计算的精确性要求不高时,也没有必要应用精确法计算。
近似法即用每年观察的平均人数(一般取相邻两年的年初人口的平均数或年中人口数)作为该年的观察人年数,然后将各年的观察人年数相加即得到观察的总人年数。该法计算简单,但精确性较差。
用寿命表法计算人年
该法计算简单,并有一定的精确度。常用的计算方法是规定观察当年内进人队列的个人均作 1/2 人年计算,失访或出现终点结局的个人也作 1/2 人年计算。
率的计算
常用指标
累积发病率
如果研究人群的数量较大且比较稳定,则无论其发病强度大小和观察时间长短,均可用观察开始时的人口数作分母,以整个观察期内的发病(或死亡)人数为分子,计算某病的累积发病率(或累积死亡率)。累积发病率反映的是特定时间内的发病风险,累积发病率的量值变化范围为0~1,报告累积发病率时必须说明累积时间的长短,否则,其流行病学意义不明。
累积发病率(CI)=观察期内的发病人数/观察开始时的人数
发病密度
标化比
显著性检验
效应的估计
相对危险度(RR)
归因危险度(AR)
归因危险度百分比(AR%)
人群归因危险度(PAR)与人群归因危险度百分比(PAR%)
剂量效应关系的分析
如果某种暴露存在剂量-效应关系,即暴露的剂量越大,其效应越大,则该种暴露作为病因的可能性就越大。如果我们收集了研究对象的暴露剂量的信息,就可以做剂量效应关系的分析。具体的分析方法是先列出不同暴露水平下的发病率,然后以最低暴露水平组为对照,计算其他各暴露水平组的相对危险度和归因危险度。必要时,应对危险度(或率)的变化作趋势性检验。
常见偏倚极其控制
选择偏倚
信息偏倚
混杂偏倚
优缺点及其他实验类型
优点
1.由于研究对象的暴露资料是在结局发生之前收集的,并且都是按照设计由研究者亲自观察得到的,所以资料完整可靠,信息偏倚相对较小。
2.可以直接获得暴露组和对照组人群的发病或死亡率,可直接计算出 RR 和 AR 等反映疾病危险强度的指标,可以充分而直接地分析暴露的病因作用。
3.由于病因发生在前,疾病发生在后,因果现象发生的时间顺序是合理的,加之偏倚较少,又可直接计算各项测量疾病危险强度的指标,故其检验病因假说的能力较强,一般可证实病因联系。
4.有助于了解人群疾病的自然史,有时还可能获得多种预期以外的疾病的结局资料,可分析一因与多种疾病的关系。
局限性
1.不适于发病率很低的疾病的病因研究,因为在这种情况下需要的研究对象数量太大,前瞻性队列研究一般难以达到。
2.由于随访时间较长,对象不易保持依从性,容易产生失访偏倚。
3.在随访过程中,未知变量引人人群(如环境的变化,其他干预措施的引进等),或人群中已知变量的变化(如原有吸烟者戒烟了)等,都可使结局受到影响,使分析复杂化。
4.研究耗费的人力、物力、财力和时间较多,其组织与后勤工作亦相当艰巨。
其他实践类型
基于一个综合队列的队列研究
基于大数据的队列研究
病例对照研究
概述
基本原理
以当前已经确诊的患有某特定疾病的一组病人作为病例组,以不患有该病但具有可比性的一组个体作为对照组,通过询问、实验室检查或复查病史,搜集研究对象既往对各种可能的危险因素的暴露史,测量并采用统计学检验,比较病例组与对照组各因素暴露比例的差异是否具有统计学意义
如果病例组的暴露比例高于对照组,说明该暴露可能会增加疾病发生的危险,反之,病例组的暴露比例低于对照组,则该暴露可能会降低疾病发生的危险。
然后评估各种偏倚对研究结果的影啊,并借助病因推断技术,判断某个或某些暴露因素是否为疾病的危险因素,从而达到探索和检验病因假说的目的。
基本特点
观察性研究
研究对象分为病例组和对照组
由“果”溯“因”
因果关系的论证强度相对比较弱
研究类型
非匹配病例对照研究(成组病例对照研究)
在设计所规定的病例和对照人群中,分别抽取一定数量的研究对象进行组间比较,对照的选择没有其他任何限制和规定
一般对照的人数应等于或多于病例人数,不需呈严格的比例关系
比匹配法更容易实施,但方法本身控制混杂因素的能力较弱,应在统计分析中予以弥补
匹配病例对照研究
要求选择的对照在某些因素或特征上与病例保持一致,目的是使匹配因素在病例组与对照组之间保持均衡,从而排除这些因素对结果的干扰
可增加分析时的统计学检验能力,提高研究效率,但也增加了选择对照的难度,并且资料整理与统计分析较麻烦
衍生的几种主要研究类型
巢式病例对照研究
是队列研究与病例对照研究结合的设计形式
基本设计方法:在队列研究的基础上,在一定的观察期中,当所研究疾病的新发病例积累到一定数量,则可将全部病例集中组成“病例组”,在每个病例发病当时,从同一队列的未发病者中,按一定匹配条件随机选择对照,集中组成“对照组”;然后,抽取病例与对照的基线资料,并检测收集的生物学标本,按匹配病例对照研究的方法进行资料的统计分析。
病例-队列研究
一种队列研究与病例对照研究结合的设计形式
基本设计方法:队列研究开始时,在队列中按一定比例随机抽样选出一个有代表性的样本作为对照组;观察结束时,将队列中出现的所研究疾病的全部病例作为病例组,与上述随机抽取的对照组进行比较。
病例-队列研究与巢式病例对照研究的不同之处在于:①前者的对照是从基线纳人的全部队列成员中随机选取;而后者的对照是与病例按个体匹配的②前者的对照组可作为多种疾病结局的共用对照组;而在后者中,不同疾病结局的研究,对照组不同
病例-病例研究(单纯病例研究)
如果对一种疾病的两个亚型进行对比研究,例如出血性脑卒中与缺血性脑卒中、p53 突变阳性基因型的食管癌与 p53 突变阴性基因型的食管癌或者食管癌的鳞癌与腺癌的比较研究,可以不另外设对照组,而采取两个亚组的直接比较
适用于研究两组病因的差异部分,而其相同或近似的危险因素则将被掩盖或低估。 也可用于研究遗传与环境因素之间的交互作用。
病例交叉研究
对于突发事件如脑梗死、脑出血、心肌梗死、消化道出血等诱发因素的研究,可采用病例交叉研究,即以每个病例发病之前的一个或多个时间段作为“对照”时间段,疾病发生时的暴露情况和同一个个体“对照”时间段的暴露情况进行比较。
适用于研究暴露的瞬时效应,即暴露对发生急性事件的影响。此为自身对照,个体不同时间点上的可比性较好。只有少数情况适合病例交叉研究。首先,整个时间里个体的暴露必须是变化的,而不是恒定的;其次,暴露的诱导期和效应期都必须短暂,否则最近疾病发作可能是由遥远的过去的暴露造成
用途
用于疾病病因或危险因素的研究(某些潜伏期长以及罕见病)
用于健康相关事件影响因素的研究(如意外伤害、老年人生活质量、长寿、肥胖与超重等相关因素)
用于疾病预后因素的研究
用于临床疗效影响因素的研究
研究设计与实施
确定研究目的
明确研究类型
如果研究目的是广泛地探索疾病的危险因素,可以采用非匹配或频数匹配的病例对照研究方法
如果研究目的是检验病因假设,尤其对于小样本研究或者因为病例的年龄、性别等构成特殊,随机抽取的对照组很难与病例组均衡可比时,可以采用个体配的病例对照研究,以保证对照与病例在某些重要方面的可比性。
确定研究对象
病例的选择
病例的定义
病例应符合统一,明确的疾病诊断标准
尽量使用国际通用或国内统一的诊断标准,以便与他人的研究结果比较,并尽可能使用金标准
对于尚无明确诊断标准的疾病,可根据研究的需要自定标准,此时要注意均衡诊断标准的假阳性率及假阴性率,使诊断标准宽严适度
若研究者为了某个特殊的研究目的,可以对研究对象的某些特征作出规定或限制
病例的类型
新发病例(首选)
优点:新发病例包括不同病情和预后的病人,代表性好,另外,病人确诊不久即被调查,对有关暴露的回忆信息较为准确可靠,不受各种预后因素的影响,且病历资料容易获得
缺点:在一定范围或一定时间内较难得到预期的病例数,对于罕见疾病更是如此
现患病例
在应用现患病例时,要尽量选择诊断时间距离进行调查的时间间隔较短的病例
优点:弥补了新发病例的缺点,在较小范围或较短时间内得到足够的病例数
缺点:现患病例患病时间较长,对暴露史回忆的可靠程度要比新发病例差,难以区分暴露与疾病发生的时间顺序
死亡病例
暴露信息主要由其家属提供,准确性较差,但对那些主要靠亲友提供资料的疾病如儿童白血病的研究,也不排除应用死亡病例,只是在资料整理和分析时要充分考虑到可能的偏倚
病例的来源
从医院选择病例
即从一所或几所医院甚至某个地理区域内全部医院的住院或门诊确诊的病例中选择一个时期内符合要求的连续病例
优点:可节省费用,合作性好,资料容易得到,而且信息较完整、准确,但不同医院接收的病人具有不同的特征
缺点:如果仅从一所医院选择病例,代表性较差
为减少偏倚,病例应尽量选自不同水平,不同种类的医院
从社区人群中选择病例
以某一地区某一时期内某种疾病的全部病例或其中的一个随机样本作为研究对象。
可以利用疾病监测资料或居民健康档案选择合格的病例或从现况调查资料中获得,也可以选自人群队列中发生的某种疾病的病人。
优点:病例的代表性好,结果推及到该人群的可信程度较高
缺点:调查工作比较困难,且耗费人力物力较多
对照的选择
选择对照的原则
对照必须是以与病例相同的诊断标准确认为不患所研究疾病的人
对照应该能够代表产生病例的源人群(对照的暴露分布应该与病例源人群的暴露分布一致)
对照的来源
同一个或多个医疗机构中诊断的其他疾病的病人
优点:易于选取,比较合作,且可利用档案资料,因此实际工作中经常采用这种对照
缺点:这种来源的对照的暴露分布常常不同于病例的源人群
具有研究暴露的个体更有可能生病来医院就诊,进而成为对照组;这就导致医院对照的暴露水平高于病例源人群的暴露水平
为避免这种选择偏倚,选择医院对照时应遵循的原则
①因已知与所研究的暴露因素有关的病种人院的病人不能作为对照。这种排除标准是针对此次就诊的疾病而非疾病史。
②对照应由尽可能多的病种的病人组成,以避免因过多地代表某一个类病人,而该病种恰与所研究疾病具有共同的危险因素,从而影响研究结果的真实性。
社区人群或团体人群中非该病病例或健康人
不易出现上面医院对照可能面临的选择偏倚问题
实施难度大,费用高,所选对照不易配合
病例的邻居或同一住宅区内的健康人或非该病病例
有助于控制社会经济地位的混杂作用,用于匹配设计
病例的配偶、同胞、亲戚,同学或同事等
有助于排除某些环境或遗传因素对结果的影响,用于匹配设计
在实际工作中,可以选择多个对照,以弥补各自的不足。也应注意各种不同来源的对照可解决的问题不同,在下结论时一定要综合考虑。
选择对照的方法
匹配(配比)
要求对照在某些特征或因素上与病例保持一致,保证对照与病例具有可比性,以便对两组进行比较时排除匹配因素的干扰
目的主要是提高研究效率,其次是控制混杂因素的干扰
匹配变量必须是已知的混杂因素,或有充分的理由怀疑为混杂因素,否则不应匹配。 疾病因果链上的中间变量不应匹配。 只与可疑病因有关而与疾病无关的因素不应匹配。
在一个研究中,不应该选择很多的匹配因素,因为匹配变量越多,选择合格的对照就越困难;而且,把不起混杂作用的因素作为匹配变量进行匹配,试图使对照组与病例组在多方面都一致,结果导致所研究的因素也趋于一致,结果反而降低了研究效率。这种情况称为匹配过度。
一般除性别、年龄之外,对其他因素是否进行匹配,须持慎重态度,以防止匹配过度,且徒增费用和难度。
一定不能将研究者感兴趣的研究变量作为匹配因素,因为一旦病例与对照按照这些因素匹配,就使得病例与对照在这些变量方面一致,也就不能分析这些因素与疾病的关系了。
匹配的变量应当一致到什么程度,取决于变量的性质、必要性与可操作性。离散变量可以完全匹配;连续变量可以首先划分为若干组,再按组匹配。
据匹配的方式不同
频数匹配
频数匹配是指对照组具有某种或某些因素或特征者所占的比例与病例组一致或相近。
个体匹配
个体匹配是以对照与病例个体为单位进行匹配。
1 个病例可以匹配 1 个对照,这种情况叫配对,也可以 1 个病例匹配.多个对照.如 1:2,1:3……1:r匹配。病例与对照的比例要根据研究的具体情况而定。
一般情况下,总样本量一定时,如果病例和对照的来源都较充足,病例与对照之比为 1:1 时的统计学效率最高。但如果所研究的是罕见病或所能获得的合格病例数很少,为了达到较满意的研究功效,可以增加匹配的对照数,即采用 1:r匹配。随着r值的增加,效率逐渐增加,但增加的幅度越来越小,而工作量却显著增大,尤其超过 1: 4时。因此,实际应用时要权衡利弊选择匹配的比例。
非匹配
选择对照时没有任何限制和要求
确定样本量
影响样本量的因素
①研究因素在对照组或人群中的暴露率(P0)。
②研究因素与疾病关联强度的估计值,即比值比(OR)。
③希望著性水平,即第Ⅰ类错误(假阳性)概率(α),一般取α=0.05。
④希望达到的统计学检验假设的效能或称把握度(1-β),β为第Ⅱ类错误(即假阴性)概率,一般取β=0.1。
非匹配病例对照研究样本量估计
1:1 配对病例对照研究样本量估计
1:r匹配病例对照研究样本量估计
确定研究因素
应根据研究目的,确定研究因素(或暴露)。暴露因素可以多种多样,可以是宏观因素,如社会经济地位,生活方式等,也可以是微观的,如易感基因。
可以从暴露的数量和暴露持续时间评价暴露水平。
测量指标尽量选用定量或半定量指标,也可按明确的标准进行定性测定
资料收集方法
信息的收集主要靠询问调查对象并填写问卷,包括面访、信访,电话访问,网络调查、自填问卷等方式;
有时需辅以查阅档案,如疾病、死亡登记资料和医疗档案(门诊病历、住院病历)等
有时需要现场观察和实际测量某些指标,如体格检查或环境因素的测量、血液或其他生物标本的实验室检查等
资料的整理与分析
资料的整理
双录入的方法和录入后进行逻辑查错
资料的分析
描述性统计
一般特征描述
均衡性检验
推断性分析
非匹配设计资料的分析
1:1配对资料的分析
非匹配资料的分层分析
病例对照研究中的混杂因素可以用配比设计加以控制,但未被配比的混杂因素,需用分层分析的方法去识别,并估计和控制其作用。
分层分析是根据潜在混杂因素的有无或程度将研究对象分为不同的层,然后在各层中比较病例组和对照组暴露因素的分布。
剂量反应关系的分析
研究功效
偏倚及其控制
选择偏倚
人院率偏倚(伯克森偏倚)
当选择医院病人作为病例和对照时,病例只是该医院或某些医院的特定病例而不是全体病人的随机样本,对照是医院的某一部分病人而不是全体目标人群的一个随机样本,由于医院的医疗条件、病人的居住地区及社会经济文化等多方面因素的影响,病人对医院以及医院对病人都有一定的选择性,特别是因为各种疾病的院率不同可导致病例组与对照组在某些特征上的系统误差。
尽可能在社区人群中选择病例和对照,保证较好的代表性。如进行以医院为基础的病例对照研究,最好能在多个不同级别,不同种类的医院选择一定期间内连续观察的某种疾病的全部病例或其随机样本,在与病例相同的多个医院的多个科室、多病种的病人中选择对照,因已知与所研究的暴露因素有关的病种就诊的病人不宜作为对照,以便避免或减少人院率偏倚。
现患病例-新发病例偏倚(奈曼偏倚)
如果调查对象选自现患病例,即存活病例,特别是病程较长的现患病例,得到的一些暴露信息可能只与存活有关,而未必与该病的发病有关,从而错误地估计这些因素的病因作用
某病的幸存者由于疾病而改变了原有的一些暴露特征(如生活习惯),当他们被调查时容易误将这些改变了的暴露特征当作疾病前的状况,从而导致这些因素与疾病的关联误差
选择新发病例作为研究对象可避免或减少此类偏倚
检出症候偏倚(暴露偏倚)
某因素虽然不是所研究疾病的病因,但有该因素的个体容易出现某些症状或体征,并常因此而就医,从而提高了所研究疾病早期病例的检出率。如果病例对照研究中病例组包括了较多的这种早期病例,致使过高地估计了病例组的暴露程度,而产生的系统误差即为检出症候偏倚。
在医院中收集病例时,最好包括不同来源的早,中、晚期病人,以便减少这种偏倚
信息偏倚(观察偏倚或测量偏倚)
回忆偏倚
是由于研究对象对暴露史或既往史回忆的准确性和完整性存在系统误差而引起的偏倚
由于病例对照研究主要是调查研究对象既往的暴露情况,因此回忆偏倚是病例对照研究中最常见的信息偏倚。
回忆偏倚的产生与调查时间和事件发生时间的间隔长短,事件的重要性、被调查者的构成以及询问技术有关。
充分利用客观记录资料,问卷调查时重视提问方式,适当采用一些调查技巧,如选择一个与暴露史有联系的,不易被人们所忘记的重要指标进行调查来帮助研究对象联想回忆,有助于减少回忆偏倚。选择新发病例作为调查对象也可减少回忆偏倚的发生。
调查偏倚
可能来自于调查者或调查对象
病例与对照的调查环境与条件不同,或者调查者对病例与对照采取不同的询问方式,或者对暴露测量方法,采用的仪器设备或试剂不统一、不准确等均可产生调查偏倚。
做好调查员的培训,统一对病例和对照的提问方式和调查技术,尽可能使用量化或等级化的客观指标,由同一调查员调查病例和对照,调查环境尽量一致,可减少调查偏倚。
调查员向被调查者讲清调查的目的,尽量取得他们的信任与合作,可以减少报告偏倚。
使用的检查仪器,试剂应精良,统一,使用前应校准,并在使用过程中要经常进行检查,以减少测量偏倚。
混杂偏倚
当我们研究某个因素与某种疾病的关联时,由于某个既与疾病有关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系,造成的偏倚叫混杂偏倚。该外来因素叫混杂因素。位于研究的暴露与疾病病因通路上的因素不是混杂因素。在研究设计阶段可以对研究对象采取限制、配比等方法控制混杂偏倚;在资料分析阶段,可采取分层分析或多因素分析的方法控制混杂偏倚。
与队列研究优点和局限性的比较
实验流行病学
概述
历史回顾
定义
指研究者根据研究目的,按照预先确定的研究方案将研究对象随机分配到实验组和对照组,人为地施加或减少某种处理因素,然后追踪观察处理因素的作用结果,比较和分析两组人群的结局,从而判断处理因素的效果。
基本特征和用途
它是前瞻性研究
即必须直接跟踪研究对象,这些对象虽不一定从同一天开始,但必须从一个确定的起点开始跟踪
必须施加一种或多种干预处理,作为处理因素可以是预防某种疾病的疫苗、治疗某病的药物或干预的方法措施等。
研究对象是来自一个总体的符合纳入排除标准并签署知情同意的人群,通过随机分配形成实验组和对照组,从而保证实验开始时,两组在有关各方面相当近似或可比,这样实验结果的组间差别才能归之于干预处理的效应。如果不能保证严格的随机分组,就属于类实验。
由于实验流行病学中的干预措施由研究者所控制,实验现象由实验者亲自观察,研究人群又随机分组,从而对结局作解释时能够较好地排除那些外部因素的干扰作用,因此其检验因果关系假设的能力强于分析性研究,可以作为确证因果关系的最终手段。但在实践过程中,出于伦理学的考虑,不可能迫使人群暴露于某种危险因素,因此很少采用实验流行病学设计来确证危险因素的病因作用。
根据上述特征可以看出,实验流行病学不同于描述性和分析性流行病学,后者在研究实施中只是描述或分析人群中的某些现象,从中找出规律性的结论,这在科学方法分类中称之为观察法。而实验流行病学则属于实验法,即有人为给予的干预措施,并强调随机分配。
主要类型
临床试验
临床试验是随机对照试验或随机临床试验(RCT)的简称,强调以病人个体为单位进行试验分组和施加干预措施,病人可以是住院和未住院的病人。通常用来对某种药物或治疗方法的效果进行检验和评价。
原理
特点
①以病人作为研究对象
②研究多在医院进行
③多为治疗性试验
④研究对象应尽可能在基线特征方面一致
⑤随机分配治疗措施,并尽可能做到分配方案的隐藏。对分配的治疗不依从,应当测量其程度与原因
⑥尽可能采用盲法
⑦如果对于所研究的疾病没有接受的疗法,可以应用安慰剂作为比较
分为四期
Ⅰ期:通过耐受性试验与药代动力学研究,以确定新药的安全有效剂量范围及药物在人体内的吸收,代谢和排除的规律。通常在 20~80 个志愿者身上进行。
Ⅱ期:在一小部分特定病例中,在有对照的情况下进行严密的随机盲法临床试验,以进一步确定此药的安全性与有效性。通常不超过 200 人。
Ⅲ期:在更多数量的病例中进行,是随机化多中心临床试验。目的在于评价药物的安全性、有效性及最佳剂量。一般需要几百或几千人。
上述Ⅰ~Ⅲ期一般在药物上市前完成,因此又统称为上市前临床试验
TV期(上市后监测):进一步观察疗效,监测副作用。
因为上市前临床试验存在许多局限性,如观察对象样本量有限,观察时间短,病种单一,多数情况下排除老人、孕妇和儿童,因此一些罕见的不良反应,迟发反应和发生在某些特殊人群的不良反应难以发现;此外,药物在临床实际使用的效果也需要进一步研究,所以新药上市后仍需开展监测和药物流行病学研究,此即NV期,又叫上市后临床试验。
现场试验(人群预防试验)
是以尚未患病的人作为研究对象。与临床试验一样,现场试验中接受处理或某种预防措施的基本单位是个体,而不是亚人群。
原理
特点
①研究对象通常为非病人
②研究地点为社区、学校、工厂等现场
③多为预防性试验
④通常需要较多的研究对象
⑤需以个体为单位随机分配措施
⑥对分配的措施的不依从,应当测量其程度与原因
⑦尽可能应用盲法
社区试验(社区干预项目)
是以人群作为整体进行试验观察,常用于对某种预防措施或方法进行考核或评价。整体可以是一个社区,或某一人群的各个亚人群,如某学校的班级,某工厂的车间或某城市的街道等。
特点
①研究场所为社区
②以社区人群或某类人群组/亚组为单位分配干预措施
③常用于对某种预防措施或方法进行考核或评价
④一般采用整群随机分配措施的方法保证比较组之间应尽可能具有可比性
⑤如果研究只包含两个社区则要求,干预社区与对照社区间基线特征有类似的分布
研究设计与实施
明确研究问题
研究问题应根据 PICO 的框架进行构建,即对实际临床或公共卫生决策中所涉及的病人或人群、干预、对照、结局四个方面分别进行明确的定义
病人的定义不仅应包括疾病的诊断标准,还应考虑年龄,性别、病程,既往史,治疗史等方面的信息。干预和对照应考虑治疗的强度,频率,途径等。结局方面要定义测量的方法和时间。
确定试验现场
1.试验现场人口相对稳定,流动性小,并要有足够的数量
2.试验研究的疾病在该地区有较高而稳定的发病率,以期在试验结束时,能有足够的发病人数达到有效的统计分析
3.评价疫苗的免疫学效果时,应选择近期内未发生该疾病流行的地区
4.试验地区有较好的医疗卫生条件,卫生防疫保健机构比较健全,登记报告制度较完善,医疗机构及诊断水平较好等
5.试验地区(单位)领导重视,群众愿意接受,有较好的协作配合的条件等
选择研究对象(原则)
1.选择对干预措施有效的人群
2.选择预期发病率较高的人群
子主题
3.选择干预对其无害的人群
4.选择能将试验坚持到底的人群
5.选择依从性好的人群
所谓依从性是指研究对象能服从试验设计安排并能密切配合到底。
估计样本含量
影响样本量大小的主要因素
(1)实验组和对照组结局事件指标的数值差异大小:差异越小,所需的样本量越大
(2)显著性水平:即检验假设时的第Ⅰ类错误α 值
(3)把握度,即1-β,为拒绝无效假设的能力或避免假阴性的能力
(4)单侧检验或双侧检验:单侧检验比双侧检验所需样本量小。如果肯定实验组的效果好于对照组或只检验当实验组效果优于对照组时,就用单侧检验;当不能肯定是实验组和对照组哪一组效果好时,即可能实验组优于对照组或对照组优于实验组时,则用双侧检验
(5)研究对象分组数量:分组数量越多,则所需样本量越大
试验样本大小的计算
随机化分组与分组隐匿
随机化分组的方法
简单随机分组
研究对象以个体为单位用掷硬币(正、反两面分别指定为实验组和对照组)、抽签、随机数字表等方法进行分组
区组随机分组
当研究对象人数较少,而影响实验结果的因素又较多,简单随机分组不易使两组具有较好的可比性时,可以采用区组随机化法进行分组
其基本方法是将条件相近的一组受试对象(如年龄,性别,病情相近)作为一个区组,每一区组内的研究对象(通常 4~6 例)数量相等,然后应用单纯随机分配方法将每个区组内的研究对象进行分组
该法的优点是在分组过程中,任何时刻治疗组与对照组病例数保持相对一致,并可根据试验要求设计不同的区组。该法适用于样本量小的研究。
分层随机分组
简单随机分组有时无法保证影响预后的重要因素在组间可比,这时就需要考虑分层随机分组
基本方法是按研究对象特征,即可能产生混杂作用的某些重要因素(如年龄,性别、病程,病情等)先进行分层,然后在每一层内进行简单随机分组,最后再合并成实验组和对照组。
整群随机分组
按社区或团体分配,即以一个家庭、一个学校、一个医院、一个村庄或居民区等为单位随机分组。这种方法比较方便,但必须保证两组资料的可比性。
分组隐匿
虽然制定了完善的随机分组方案,但如果负责人组病人的研究者预先知道下一个(随机数字所对应的)病人的治疗方案时,研究者可能会根据下一个病人的特征和自己对不同治疗方案的好恶,人为地决定人选或排除该病人;病人也会因此人为地决定是否参与研究,由此会带来选择偏倚。
为了防止征募病人的研究者和病人在分组前知道随机分组的方案,一种防止随机分组方案提前解密的方法叫随机分组治疗方案的隐匿,或简称分组隐匿,采用分组隐匿的随机分组叫隐匿随机分组。
简单的分组隐匿可以采用信封法,就是将每个分组方案装人一个不透光的信封,信封外写上编码,密封好交给研究者。待有对象进人研究后,将调查对象逐一编号,再打开相应编号的信封,按照信封中的分配方案进行分组,并采取相应的干预措施。当然,也可以采用中央随机化语音交互系统实现分组隐匿。
没有分组隐匿的随机分组,是有缺陷的,不能起到预防选择偏倚的作用。
注意原则
:①随机数字的分配必须在确定纳人一个病人后才能进行
②随机分配方案必须隐匿
③一个病人随机数字的分配必须一次完成,一旦确定绝对不能更换
④一个病人的分组时间应尽可能接近其治疗开始的时间
设立对照
设立对照的必要性
不能预知的结局
大部分治疗决策所面对的临床结局都不那么容易预测。
由于个体生物学差异的客观存在,往往导致同一种疾病在不同个体中表现出来的疾病特征不一致,也就是疾病的发生、发展和结局的自然史不一致。不同病型或病情的病人,对治疗的反应可能也不同,如接受同一种有效药物治疗的一组病人的疗效好,可能与该组病人中轻型病例占的比例大有关。
对于一些疾病自然史不清楚的疾病,其“疗效”也许是疾病发展的自然结果,不设立可比的对照组,则很难与治疗措施的真实疗效区分开来
向均数回归
这是临床上经常见到的一种现象,即一些极端的临床症状或体征,有向均数回归的现象。
霍桑效应
在实验研究(干预研究)中,被研究者由于知道自己成为了特殊被关注的对象后,所出现的改变自己行为或状态的一种倾向,与他们接受的干预措施的特异性作用无关,是病人渴望取悦于他们的医师,使医师感到其医疗活动是成功的。
有时因厌恶某医生或不信任某医院也会产生负向效应。
安慰剂效应
某些疾病病人由于依赖医药而表现的一种正向心理效应。因此,当以主观症状的改善情况作为疗效评价指标时,其“效应”中可能包括有安慰剂效应在内。
安慰剂是一种无论在外观,颜色、味觉,嗅觉上均与积极治疗的药品无从辨别的物品,但没有特定已知的治疗成分。常用的安慰剂有甜药片或注射生理盐水等。目前已知的安慰剂可使三分之一的病人增强信心,减轻病情,减少不适症状(如术后疼痛,呕吐或瘙痒等),此一现象称为安慰剂效应。
安慰剂效应对研究者与医师有不同的意义。研究者更有兴趣确定特异并符合现有病因理论的效果,他们以安慰剂效应为测量特定治疗效果的基值。相反,临床医师会欢迎安慰剂效应,并愿意增强这一效果或任何有助于病人的方法。
潜在的未知因素的影响
人类的知识总是有局限性的,很可能还有一些影响干预效应的因素,但目前尚未被我们所认识。
对照类型
为了避免偏倚,在设置实验组和对照组时,要求除了实验组接受的干预措施外,两组在其他方面都必须是相似的。
根据对照措施来区分
(1)标准疗法对照(有效对照):是临床试验中最常用的一种对照方式,是以常规或现行的最好疗法(药物或手术)作对照。适用于已知有肯定疗效的治疗方法的疾病。
(2)安慰剂对照:在所研究的疾病尚无有效的治疗药物或使用安慰剂后对研究对象的病情无影响时才使用。
根据研究对象接受单一对照措施还是交替接受干预和对照措施
(1)平行对照:在实验过程中将研究对象随机分为 A 和 B 两组,分别给予干预措施和对照措施。中间不更换干预措施。
(2)交叉对照:即在实验过程中将研究对象随机分为 A 和 B 两组,在第一阶段,A组人群给予干预措施,B 组人群为对照组,经一段时间的干预后,两组对换,B 组接受干预措施,而A 组成为对照。这样一来,每个研究对象均兼作实验组和对照组成员,干预措施的效果可以汇总个体内的差异而得出。
由于个体内的变异通常小于个体间的差异,因此,要达到相同的精确度,交叉对照设计所需要的样本量小于平行对照。但这种对照必须有一个前提,即第一阶段的干预一定不能对第二阶段的干预效应有影响,这在许多试验中难以保证;而且由于每个对象要经历两段时期,需要的时间就比较长,反而易造成研究对象的退出;数据的分析也比较复杂,因此,这种对照的应用受到一定限制。
其他
自身对照是指试验前后以同一人群作对比
尚有历史对照,空白对照等非均衡对照,由于这类对照缺乏可比性,除某些特殊情况外,一般不宜采用。
盲法的应用
根据盲法程度分为
单盲指研究对象不知道自己是实验组还是对照组。
双盲指研究对象和研究实施人员都不了解试验分组情况,而是由研究设计者来安排和控制全部试验。
三盲指不但研究实施者和研究对象不了解分组情况,负责资料收集和分析的人员也不了解分组情况,从而较好地避免了偏倚。
目前在临床试验中认为盲法至少分为如下四个层次,而不是单纯使用单盲(病人)和双盲(病人 及研究实施者)等字眼来描述
1.负责分配病人到治疗组的人不知道病人接受什么治疗,才不会依照自己的意愿而是按顺序将病人选人试验。
2.病人本身不知道自己接受什么治疗,才不会改变自己的依从性或对症状的报告。
3.在研究中照顾病人的医师不知道每个病人接受什么治疗,才不会对他们(可能是潜意识地)作不同的处理。
4.研究实施者在评价结果时无法区别谁是治疗组,这样才不会影响测量。
未用盲法的试验,称为开放性试验
即研究对象和研究实施者均知道实验组和对照组的分组情况,试验公开进行。这多适用于有客观观察指标或难以实施盲法的临床试验
其优点是易设计和实施,研究实施者了解分组情况,便于对研究对象及时作出处理
其主要缺点是容易产生偏倚
确定结局变量及其测量方法
确定试验观察期限
收集资料
随访内容
①干预措施的执行状况
②有关影响因素(预后影响因素)的信息
③结局变量
资料整理和分析
资料的整理
排除
指在随机分组前研究对象因各种原因没有被纳人。
排除对研究结果的内部真实性不会产生影响,但可能影响研究结果的外推,被排除的研究对象愈多,结果推广的面愈小
为了观察并筛选出真正符合纳人标准的受试对象,研究者可在研究设计中加入试运行期。该方法是指在随机分组之前,通过短期的试验了解研究对象的合作、依从,不能耐受的不良反应等情况,从而排除不符合标准或可能无法坚持试验的研究对象,如对干预措施有禁忌者,无法追踪者,可能失访者,拒绝参加试验者。并在随后的试验中只选取能够参加试验者进行随机分组。
加入排除者后,很可能低估或掩盖真实的疗效。所以在未应用试运行期方法的 RCT 中,即使阴性结果也应引起人们高度重视。
退出
指研究对象在随机分配后从实验组或对照组退出。 这不仅会造成原定的样本量不足,使研究功效(或把握度)降低,且易产生选择偏倚。 退出的原因可能有以下几种
不合格的研究对象
一般要把不合格的研究对象剔除,包括不符合纳入标准者,一次也没有接受干预措施或没有任何数据者。
在试验研究时,研究者对实验组往往观察仔细,因此实验组中的不合格者比较容易发现,结果造成因不合格而被剔除的人数多于对照组。另外,研究者对某些研究对象的反应的观察与判断可能有倾向性,如对效果差者可能特别注意,造成更易于从中发现其不符合标准并将其剔除,而留在组内的往往是效果较好的研究对象,由此而得出的结论往往比实际的效果要好。
为了防止因对研究对象的剔除造成偏倚,有的学者主张在随机分配后发现不符合标准者,可根据人选标准将研究对象分为“合格者”和“不合格者”两个亚组分别进行分析,如果两者结果不一致,则在下结论时应慎重。另外,对不合格者也可以保留在原组采用意向治疗分析(YTT)。
不依从的研究对象
指研究对象在随机分组后,不遵守试验所规定的要求
实验组成员不遵守干预规程,相当于退出或脱落实验组,对照组成员不遵守对照规程而私下接受干预规程,相当于加入实验组。
研究对象不遵守试验规程的原因
①试验或对照措施有副作用
②研究对象对试验不感兴趣
③研究对象的情况发生改变,如病情加重等
为了防止和减少不依从者的出现,对研究对象要进行宣传教育,讲清试验目的,意义和依从性的重要性;要注意设计的合理性,试验期限不宜过长;要简化干预措施等,以便取得研究对象的支持与合作。对不依从者不能剔除,应采用 ITT 分析。此外,还要调查不依从的原因与程度并详细记录。
失访
指研究对象因迁移或与本病无关的其他疾病死亡等而造成失访。
在实验流行病学研究中应尽量设法减少失访,一般要求失访率不超过 10%,在试验中出现失访时,尽量用电话,通信或专门访视进行调查。调查失访的原因,详细记录失访发生的时间。资料分析时须对失访者的特征进行分析,还可采用生存分析的方法,充分利用资料。
资料的分析
意向治疗分析 (ITT) (实用试验或者项目效应分析)
概念
指所有病人被随机分人 RCT 中的任意一组,不管他们是否完成试验,或者是否真正接受了该组治疗,都保留在原组进行结果分析
ITT 的目的在于避免选择偏倚,并使各治疗组之间保持可比性。
在 TTT 中,随机化不仅决定治疗的分配,而且决定病人数据的分析。
ITT 是比较①+②组和③+④组。
效力分析(依从者分析,解释性试验或生物效力试验)是比较②组和③组,而忽略①组和④组。接受治疗分析是比较(①中转组者)+③组和②+(④中转组者)组。
三种分析方法各有用途,但在评价项的真实性时,ITT 是最有效的方法
分析方法
三种分析方法所得的结果并不一致。ITT 分析反映了两种治疗实际临床应用后的效果,包括病人在试验过程中的各种转归;但在评价治疗方法的真正疗效方面,如果试验方法确实有效,应用ITT分析会低估该试验的治疗效果。依从者分析是只对试验依从的人进行分析,并未完全遵循最初的随机分组。
应用及局限性
RCT 的两个基本目标是获得试验的效力和效果。试验的效力反映的是在一种理想状态下的治疗效果,即参加试验者真正接受并完成了该种治疗。试验的效果是指在一般的临床状态下治疗的实际效果,参加者可能会不依从,改变治疗方式或间断治疗等,TTT分析评价的就是这种结果,即给予某种治疗方式后病人的实际结局。
对于试验的效力来说,如果试验中失访,不依从的情况很少,或者各组之间的失访和不依从是均衡的,那么 ITT 分析可以得到试验效力的有效信息。但若不均衡,ITT 分析不能够完全评价试验效力,如果试验方法确实有效,ITT可能会低估治疗效果,而依从者分析和治疗者分析将高估治疗效果。因此,在评价试验的效力时,建议同时使用上述三种分析,以获得更全面的信息,使 RCT 结果的解释更为合理。
统计分析数据集
FAS集
PPS 集
SAS集
评价的指标
评价治疗措施效果的主要指标
其他原因死亡或失访,为了合理利用研究的资料信息,可用寿命表法进行分析
评价预防措施效果的主要指标
需治疗人数(NNT)
指为预防 1 例不良事件发生,临床医师在一段时间内应用某一疗法需治疗的病人数,从数学关系上讲,NNT等于绝对危险度的倒数。
假定一个 RCT,病人被随机分为治疗组和安慰剂对照组,追踪观察一段时间,看两组有害事件发生的情况。设治疗组事件发生率为 EER,对照组事件发生率为 CER
NNT 与其他指标的比较
这较之 AR=0.08 直观易懂、易被接受。此外,NNT 比相对效应评价指标优越之处还可以从轻、中度高血压病人的比较中看出。降压治疗对两型病人的保护率均为40%,似乎表明两组病人应该以同样的力量来治疗。然而为预防 1 例脑卒中发生,对中度高血压病人只需治疗 13 人,对轻度高血压病人却需要治疗 167人,显然这将导致不同的治疗决策。
实验流行病学研究的优缺点和应注意的问题
主要优点
1.研究者根据试验目的,预先制定试验设计,能够对选择的研究对象,干预因素和结果的分析判断进行标准化。
2.按照随机化的方法,将研究对象分为实验组和对照组,做到了各组具有相似的基本特征,提高了可比性,减少了混杂偏倚。
3.试验为前瞻性研究,在整个试验过程中,通过随访将每个研究对象的反应和结局自始至终观察到底,实验组和对照组同步进行比较,最终能作出肯定性的结论。
存在缺点
1.整个试验设计和实施条件要求高,控制严,难度较大,在实际工作中有时难以做到
2.受干预措施适用范围的约束,所选择的研究对象代表性不够,以致会不同程度地影响试验结果推论到总体
3.研究人群数量较大,试验计划实施要求严格,随访时间长,因此依从性不易做得很好,影响试验效应的评价
应注意的问题
类实验
一个完全的实验流行病学研究必须具备随机、对照、干预,前瞻四个基本特征,如果一项实验研究缺少其中一个或几个特征,这种实验就叫类实验或自然实验 根据类实验是否设立对照组可分为两类:
不设平行对照组
其对比是通过下列两种方式进行的
一是自身前后对照,即同一受试者在接受干预措施前后比较
二是与已知的不给该项干预措施的结果比较
设对照组
虽然设立了平行对照组,但研究对象的分组不是随机的。如在社区试验中,并不是总能获得随机对照的,如果只能对整个居民区人群实行预防,随机分组就不可能进行,可选择具有可比性的另一个社区人群作为对照组。
类实验常用于研究对象数量大、范围广而实际情况不允许对研究对象作随机分组的 情况。
伦理道德问题
实验流行病学研究以人作为对象开展研究是一项十分严肃谨慎的工作,为了确保研究对象的人身安全,防止在试验中自觉或不自觉地发生不道德行为,必须在试验中遵循伦理道德,在开始人群试验前,必要时应先做动物实验,初步验证此种实验方法合理、效果良好,无危害性。特别是设置对照时,必须以不损害受试者身心健康为前提。在一般情况下,研究者应将试验目的,方法、预期效果以及危险告知受试者及其家属,征得他们的同意,此即知情同意。
预试验
在正式试验前,应先在小范围作一次少量人群的预试验,其目的是检验试验设计的科学性和可行性,以免由于设计不周,盲目开展试验而造成人力、物力和财力的浪费。以往的经验证明,预试验也必须像正式试验一样地认真进行才具有科学的意义,如果随便选择一个地方和人群作预试验,不具备试验设计方案中的基本条件,是不可行的。反之,若给预试验以多种特殊条件,使之得天独厚,以证明试验设计的正确可行,则更是错误的。只有在避免了各种主观因素干扰,经过认真的预试验后,如果取得成功,才能按设计方案进行正式的大规模试验。
研究注册问题
结果报告的完整透明问题
研究实例
筛检
概述
概念
是针对临床前期或早期的疾病阶段,运用快速、简便的试验,检查或其他方法,将未察觉或未诊断疾病的人群中那些可能有病或缺陷、但表面健康的个体,同那些可能无病者鉴别开来的一系列医疗卫生服务措施。
筛检一般是由国家或地区政府主导,动员全社会参与的系统工程,又称为“三早”预防,包括对目标疾病的早期发现、早期诊断、对各阶段阳性者的处理(早期治疗)及阴性者医学随访的一系列医疗和卫生服务实践活动。
筛检的目的及类型
筛检的目的
1.发现隐匿的病例
2.发现高危人群
3.了解疾病的自然史,揭示疾病的“冰山现象”
4.指导合理分配有限的卫生资源
筛检的类型
按照筛检对象的范围分为整群筛检和选择性筛检
整群筛检指在疾病患(发)病率很高的情况下,对一定范围内人群的全体对象进行无差异普遍筛检
选择性筛检又称为高危人群筛检,是指选择疾病的高危人群进行筛检。
依照筛检项目的多少分为单项筛检、多项筛检和多病种筛检
单项筛检指用一种筛检试验筛查一种疾病
多项筛检是指用多个筛检试验筛查一种疾病
多病种筛检则是同时在一个人群中开展多种疾病筛查
依照筛检的目的分为治疗性筛检和预防性筛检
如大肠癌或乳腺癌的筛检,可发现和治疗早期病人,为治疗性筛检
高血压的筛检可预防脑卒中,为预防性筛检
按筛检组织的方式分为主动性筛检和机会性筛检
前者是采取“主动出击”,通过有组织的宣传介绍,动员群众到筛检服务地点进行检查
后者属于一种被动性筛检,是将日常性的医疗服务与筛检结合起来,在病人就医过程中,对非专科就诊的人群进行筛检
筛检的实施原则
一项筛检计划应包括:①选择筛查疾病的依据;②明确的目标人群;③合理的筛查程序,包括起始筛查年龄,筛查间隔,不同阶段的筛检试验和确诊试验;④干预和随访方案
筛检的疾病
首先,所筛检疾病或相关健康状态应是该地区现阶段的重大公共卫生问题,能对人群健康和生命造成严重危害,现患率或死亡率较高,是人群的主要死因之一。
其次,目标疾病的自然史清晰,有足够长的临床前期和可被识别的疾病标识,有早诊断的方法,且早期干预能显著降低死亡率。
再次,对疾病不同阶段的干预效果及其不良反应有清楚的认识。
筛检试验
选择合适的筛检试验是整个筛查程序设计的关键部分。
首先,筛检试验应准确,简单、经济、安全、且容易被受检者接受。
其次,应有符合不同经济发展和卫生资源水平的筛检方法可供选择。
疾病治疗
对筛查出的不同阶段结局均有行之有效的干预方案,且确保早期治疗的效果应优于晚期治疗。
筛检项目实施计划及评价
WHO 制定的新的 10 条标准中,特别强调了应从项目最初即开始项目的评价。评价内容包括:目标人群是否明确;筛查-治疗程序是否有效,是否有卫生经济学价值,是否符合公平性,可及性以及伦理学原则,人群获益是否超过伤害。此外,还需对筛查的质控,经费保障及项目风险应对机制等方面进行评估。
筛检试验的评价
筛检试验的定义
是用于识别外表健康的人群中那些可能患病个体或具有患病风险个体的方法。
它既可是问卷、体格检查、内镜与X 线等物理学检查,也可是细胞学或生物大分子标志物检测技术。
一项好的筛检试验应具备良好的真实性、可靠性和预测度,还应具有五个特征
①简单性:指易学习,易操作,即便是非专业人员经过适当的培训也会操作。
②廉价性:原则上在健康收益一定的情况下,筛检试验的费用越低越好。
③快速性:指能很快得到结果。
④安全性:指不会给受试者带来创伤。原则上初筛方法不宜采用可能造成创伤的检查手段(如组织活检、内镜等)。
⑤可接受性:指易于被目标人群接受。
筛检试验的评价方法及指标
真实性
亦称效度,指测量值与实际值相符合的程度,故又称准确性
研究设计
真实性评价采用对比研究的思路,比较筛检试验与疾病的标准方法,即“金标准”判断结果的一致程度。
研究设计一般有以下两种
①以医院为研究现场的病例-非病例(对照)设计,即先用“金标准”确定某病的患病和非患病人群;随机选择病例组和非病例组,再用待评价的筛检试验盲法检测两组对象
(1)确定金标准:“金标准”是指当前临床医学界公认的诊断疾病的最准确可靠的方法。使用金标准的目的就是准确区分受试对象是否为某病病人。最佳的金标准有病理诊断、活检、手术发现,微生物培养、尸检或特殊检查。但由于筛检试验的对象(尤其是非病例组)包含健康人,难以对所有研究对象进行上述检查,因此金标准也可以是准确性较高的影像诊断、临床综合判断,结合短时间内重复测量或随访,尽量减少确诊方法的误诊和漏诊。
(2)选择研究对象:受试对象应能代表筛检试验可能应用的目标人群,并尽量满足随机化抽样原则。筛查的目的是发现临床前期或早期的病人,病例选择应包括早期病症状轻微的病例,还应考虑疾病的各种临床类型(不同病情程度,不同病程,典型和不典型,有无并发症,是否治疗过)。非病例组为金标准证实未患有目标疾病者,包括非病人和(或)与目标疾病易产生混淆的疾病病人。
(4)确定筛查结局分类标准或截断值:筛检试验的结果需明确的、有明显区分度的阳性和阴性判断标准。对筛检试验为分类或等级指标的,可根据专业知识判断阳性或阴性;对检测值为连续性指标的,如蛋白、氨基酸,抗体水平或者筛查问卷得分,需确定判断阳性结果具体取值,即截断值
(5)盲法测量:保证病例和对照在整个检查流程,包括建档、生物材料采集,检测程序,结果分析报告中各环节所得到的处理一致。一般采用盲法来控制信息偏倚。
②以社区为研究现场的横断面设计,即抽取一个目标人群的代表性样本,同时用金标准和筛检试验盲法检测所有研究对象,事后根据金标准检测判断病例组和非病例组。
两种研究设计最终均可计算一系列真实性指标,来评价筛检试验对目标疾病的预判价值。以社区为现场的研究,样本对筛检的目标人群更有代表性,还可直接估计预测值指标。但要筛查出足够的病例,往往所需的样本量较大,研究成本较高。病例-非病例设计较为经济,操作简便,且适用范围较宽,但需特别注意病例组和非病例组对筛检目标人群的代表性。此外,病例-非病例设计不能直接计算预测值。
资料整理及真实性评价指标
(1)资料整理:经金标准诊断的病人,被筛检试验判断阳性者,称为真阳性(TP);判断为阴性者,称为假阴性(FN)。非病人被筛检试验判断为阳性者,称为假阳性(FP);判断为阴性,称为真阴性(TN)。
(2)真实性评价指标:评价真实性的指标有灵敏度与假阴性率,特异度与假阳性率、正确指数和似然比。
①灵敏度与假阴性率
灵敏度(真阳性率),即实际患病且被筛检试验标准判断为阳性的百分比,它反映了筛检试验发现病人的能力。
假阴性率(漏诊率),指实际患病但被筛检试验确定为阴性的百分比,它反映的是筛检试验漏诊病人的情况。
灵敏度与假阴性率之间为互补关系,灵敏度=1-假阴性率。
②特异度与假阳性率
特异度(真阴性率),即实际无病且被筛检试验标准判断为阴性的百分比。它反映了筛检试验鉴别排除病人的能力。
假阳性率(误诊率),即实际无病,但被筛检试验判断为阳性的百分比。它反映的是筛检试验误诊病人的情况。
特异度与假阳性率之间为互补关系,特异度=1-假阳性率。
③正确指数
正确指数也称约登指数,是灵敏度与特异度之和减去 1,表示筛检方法识别真正病人与非病人的总能力。 正确指数的范围在 0~1 之间。指数越大,真实性越高。
正确指数=(灵敏度+特异度)-1
④似然比
是同时反映灵敏度和特异度的综合指标,根据筛检结果阳性与阴性,可计算阳性似然比(+LR)和阴性似然比(-LR)。
阳性似然比是筛检结果的真阳性率与假阳性率之比。比值越大,试验结果阳性时为真阳性的概率越大。
阴性似然比是筛检结果的假阴性率与真阴性率之比。比值越小,试验结果阴性时为真阴性的概率越大。
在选择筛检试验时应选择阳性似然比高,阴性似然比较低的方法,此时试验的准确性最佳。
可靠性(信度、精确度或可重复性)
指在相同条件下用某测量工具(如筛检试验)重复测量同一受试者时结果的一致程度。 可信度评价与金标准诊断是否患病的结果无关。
可靠性评价研究通常的做法是与真实性评价同时开展。由两名或多名检查者采取同样的检查程序对研究人群进行同时盲法检查,例如,多人同时读一批X线片;或者对同一人群用相同方法多次检测,如血压重复测量三次,再比较重复检查结果的一致情况。在样本量计算方面,Bland-Altman法推荐对连续性变量(如癌蛋白、代谢产物等)进行一致性评价,所需的样本量应不少于 100 例。如果真实性研究的样本量较大(1000 以上),可随机抽取 5%~10%样本进行重复检测。
信度指标
连续性测量的资料
①对同一样品或一组同质性样品(个体差异较小的样品)进行多次重复测量,可用标准差和变异系数来反映可靠性,两个指标的值越小,表示方法的精密度越高。
②对一批不同质样品(对象)进行两次重复测量,可用两次测量值的相关系数(r)来评价一致程度。一般地,r≥90%,可认为筛查方法的一致性较好。此外,也可以用配对t检验分析重复测量结果的一致性,若两组差异无统计学显著性也可以认为重复测量的一致性较好。
分类测量的资料
一般整理成配对四格表形式,注意是格子内的数字表示两次检测结果一致/不一致的频数。评价指标有符合率和 kappa 指标;分布差异检验可用配对X²检验。
影响筛查试验可靠性的因素
⑴受试对象生物学变异:由于个体生物周期等生物学变异,使得同一受试对象在不同时间获得的临床测量值有所波动
(2)观察者:由于测量者之间,同一测量者在不同时间的技术水平不一,判断尺寸掌握差异,预期偏倚等均可导致重复测量的结果不一致,如不同的阅片者报告的 X 线片检查结果不同。
(3)实验室条件:重复测量时,测量仪器不稳定,试验方法本身不稳定,不同厂家,同一厂家生产的不同批号的试剂盒的纯度,有效成分的含量,试剂的稳定性等均有不同,由此可能引起测量误差。
预测值
是应用筛检结果的阳性和阴性来估计受检者为病人和非病人可能性的指标。该类指标反映了筛检试验实际应用到人群筛查后,获得的收益大小。
直接计算法
在社区开展的,基于横断面设计的筛查试验评价,样本人群的疾病现患率与目标人群的现患率一致,如前所述,经金标准和筛检试验同时盲法判断的结果有:真阳性(TP),假阴性(FN),假阳性(FP)或真阴性(TN)。
间接计算法
在医院开展的,基于病例-非病例设计的筛查试验研究,病例组和非病例组的构成比不能代表目标人群的现患与未患比例,因此不能直接计算预测值。此时,可以根据灵敏度,特异度、现患率与预测值的关系式(Bayes 公式)来估算预测值。
预测值与真实性指标、现患率的关系
(1)现患率对预测值的影响
当灵敏度与特异度一定,疾病患病率降低,阳性预测值降低,阴性预测值升高。
(2)灵敏度、特异度对预测值的影响
当人群患病率不变时,灵敏度升高,特异度降低,此时,由于自然人群中非病人群的基数总是远远大于患病人群,其中假阳性人数增加幅度会远远大于真阳性人数。因此,分母较分子增大更显著,则阳性预测值下降,阴性预测值升高。同理,筛检试验的灵敏度降低,特异度升高,则阳性预测值升高,阴性预测值降低
确定连续性测量指标的阳性截断值
筛查试验的结果是连续性指标时,需要确定阳性/阴性结果的判定标准——截断值。假设病人的测量值总体上大于非病人,日为病人的最低值,X 为非病人的最高值。两组人群测量值分布可能呈现三种状态:①独立双峰分布;②部分重叠双峰分布;③单峰连续分布。
(1)独立双峰分布:总人群分布呈独立分布的双峰型,病人和非病人分布曲线完全无重叠。原则上把截断值选在病人中的最小值H处,筛检试验的判断准确度可达 100%,但在实际检测中,人们是很难穷尽病人的最小值的。通常的做法是根据非病人检测值的 99%~-99.9%CI 上限来确定截断值。具体可信限值取决于疾病的发生率的大小。对发病率极低(<10/10 万)的疾病,可选择99.9%上限值,这样既可保证灵敏度达 100%,又避免过高的假阻性检出率。
(2)部分重叠双峰分布:总人群分布呈双峰型,病人和非病人分布曲线小部分重叠。此时,在H和X 之间既有病人又有非病人,形成一个重叠区。在日至 X 之间,当截断值向非病人的最高值方向(X)移动,特异度升高,灵敏度降低;反之,当截断值向病人的最低值方向(H)移动时,灵 敏度增大,特异度降低。
(3)单峰连续分布:总人群分布呈单峰型,病人和非病人的分布相互交错,区分度较差,此时无论截断值如何选取都可能有较大的误判率。这类指标通常用作初筛方法,截断值可选择图形中的拐点,此时尽管误诊率较高,但可尽量避免漏诊。如果病人的测量值完全包含于非病人的 范围内且分布较宽,则不宜采用该类型指标开展疾病筛检。
筛检试验阳性结果的截断值选择在何处,可从以下几方面进行考虑
1)如疾病的预后差,漏诊病人可能带来严重后果,且目前又有可靠的治疗方法,则微断值应向提高灵敏度的方向移动,尽可能多地发现可疑病人,但会使假阳性增多。
2)如疾病后续诊疗方法不理想,则截断值应向提高特异度的方向移动,尽可能将非病人鉴别出来,减少假阳性对参加者造成的心理压力,如肝癌的筛检。
3)一般而言,筛检试验应综合考虑灵敏度和特异度达到平衡,此时将临界点定在非病人与病人的分布曲线的交界处。实际操作时一般采用受试者工作特征曲线(ROC)来决定最佳截断值。
ROC 曲线基本原理:将病人和非病人的测量值从小至大排序,即可划分一系列截断值。对应每个截断值可计算相应的灵敏度和特异度。绘制 1-特异度为横坐标,灵敏度为纵坐标的坐标轴,每个截断值对应的灵敏度和 1-特异度值构成坐标点,多个坐标点相连即 ROC 曲线。距离坐标轴左上角最近的坐标点,可同时满足筛检试验的灵敏度和特异度相对最优,它所对应的取值即最佳截断值。
ROC 曲线与对角线构成的曲面面积(AUC)也可以反映检测方法的真实性,AUC 越接近 1.0,检测方法真实性越高;等于 0.5 时,则真实性最低,无应用价值;此外,还可以利用AUC 曲线下面积直接比较两种以上筛检试验的真实性的优劣。
筛检效果的评价
筛检效果评价阶段及研究方法
根据筛检实施的不同阶段可能获得的成效,可将筛查效果评价分为近期收益、早中期疾病中间结局改善,以及长远期人群终末结局风险(死亡)降低这三个人群获益阶段。
1.第一阶段(现场干预研究)
2.第二阶段(筛检示范区建设阶段)
3.第三阶段(验证和应用阶段)
筛查项目评价内容及指标
筛查效果评价内容包括①收益;②生物学效果指标;③卫生经济学评价;④安全性和伦理学评价;⑤项目可持续性评价。
收益
收益
收益也称收获量,指经筛检后能使多少原来未发现的病人(或临床前期病人、高危人群)得到诊断和治疗。
该类指标反映人群在短期内因筛查得以早诊早治的获益情况。
常用的指标有
①阳性预测值,这是最常用的收益指标。该指标高,说明筛查出的阳性者中,真病人的比例高,筛查具有较高的效率。
②转诊率或筛查阳性率,即筛查阳性人数占筛查目标人群数的比例。转诊率与筛检试验的灵敏度高或特异度低有关,如果目标人群基数较大,该指标不宜太高,否则不符合卫生经济学原则。
③早诊/早治率,即早期病例在筛查所发现的全部病例中所占的比例,如果筛查的早诊率显著高于正常医疗程序发现的早诊率,则可认为筛查收益较好。
提高筛检收益的方法
(1)高危人群策略:疾病在某些年龄、性别、种族及主要危险因素暴露特征人群中有较高的患病率,在这些高危人群中开展筛检,可提高阳性预测值,也更符合低成本高效益的原则。
(2)选择合理的筛查方案:包括选择高灵敏度筛检试验,应用联合试验和设置合理的筛查起始及间隔时间。
1)选择高灵敏度方法。如果所筛查的疾病早期诊断意义重大,筛查的目的是尽可能不漏诊病例,应尽量选择高灵敏度的方法。
2)采用联合试验。在实施筛检时,可采用两种或两种以上筛检试验检查同一受试对象,以提高筛检的灵敏度或特异度,增加筛检的收益,这种方式称为联合试验。根据联合的形式,分为串联试验与并联试验。
串联试验,也称系列试验,即一组筛检试验按一定的顺序相连,初筛阳性者进入下一轮筛检,全部筛检试验结果均为阳性者才定为阳性。该法可以提高特异度,但会使灵敏度降低。因此,初筛的方法尽量选择灵敏度高的方法,第二轮的筛查则尽可能选择特异度较高的方法。
并联试验,也称平行试验,即全部筛检试验同时平行开展,任何一项筛检试验结果阳性就可判定为阳性。该方法的优点是可以弥补两种方法灵敏度都不足的问题,提高筛查整体的灵敏度,但会降低特异度。在设计并联筛查方案时,应充分考虑筛查方法的成本-效益比。
3)筛查起始年龄和时间间隔。筛查的起始年龄和筛查间隔应根据人群最大获益的时点来确定。
生物学效果评价
生物学效果评价,是根据筛查能改善疾病的中间或终末结局状态(发病或预后)的观察终点来设定的,通常采用率为指标,另外,筛查效果一般都是通过对比研究来体现,故需要计算相对比指标。
结局测量指标
(1)归因死亡率:是评价筛查人群长远期获益的终点结局指标,可通过比较参加筛检人群与未筛检人群之间的死亡率差异来说明筛查效果。
(2)治愈率,复发率,病死率,生存率和生存时间:这些是评价筛查人群早期或中期获益的中间结局指标。如果经筛检的病例较未经筛查的复发率或病死率更低,生存率较高或者生存时间更长,则说明筛查可能有效,常用 1 年,3 年,5 年生存率来评价癌症的筛检计划。但要注意,应用这类指标时应注意领先时间,病程长短等时间相关偏倚的影响。
关联指标
(1)随机对照试验中,常用指标有效果指数(IE),保护率,归因危险度或绝对危险度降低(AR)
(2)观察性研究中,队列研究多用参加筛检人群和未参加人群的归因死亡危险率比(RR)。病例对照的指标是死亡病例与对照组参与筛查的优势比(OR)。
需要筛检人数(NNBS)
是实验流行病学指标“需治疗人数(NNT)”在筛检项目效果评价中的具体应用。在筛查研究中,以目标疾病的死亡率作为结局指标,随访一定期限后,计算对照组和筛检组的疾病归因死亡率之差(AR),将 AR 取倒数值,得NNBS=1/AR,该指标表示减少一例目标疾病病例的死亡,需要筛检多少人,这个数值越小越好。
卫生经济学评价
筛查成本
是提供卫生服务过程中所消耗的资源。筛查成本包括项目成本(项目培训,管理、组织的费用),个人直接成本(诊治和交通陪护等)和个人间接成本(生产力损失)等。
成本-效果分析
效果指在筛检项目开展后,健康改善方面所取得的生物学效果,如复发率、死亡率等下降,生存期的延长。
成本-效果的指标为成本效果比(CER),如每延长一年生存期所消耗的成本。
成本-效用分析
效用是综合了生物学效果和人们对结果主观感受和功能状况的指标。简单地说,它不仅关心病人能存活多久,还关心存活的质量。如以寿命年作为观察指标,考虑到疾病对病人生命质量的影响,则应测量质量调整寿命年(QALY)。成本-效用分析的指标为成本效用比(CUR)。
成本-效益分析
效益是指将健康改善的结局用货币价值来衡量。成本-效益比(CBR)是公共卫生项目经济学评价中最佳的评价指标。需注意的是,货币价值可能随时间变化而改变,因此需考虑货币的贴现和利率的变化。
卫生经济学模型
现代的决策分析要求对不同卫生服务方案对应的过程和终点结局的概率进行系统、量化地综合,并结合成本和健康产出量化指标进行分析,最终确定最优的方案。
筛查的安全性、伦理问题及可持续性评价
安全性及伦理问题
严格地说,筛检作为一项医学干预措施,没有绝对的安全。安全性评估即评价人群获益是否远超过伤害,以及伤害可接受的程度。评价伤害的指标为过度诊断/治疗率,不良事件发生率。
筛检相关的伤害包括三个方面
①筛查方法本身造成的伤害。
②筛查的假阳性者可能面临过度诊断的问题,可能会经历确诊前的焦虑情绪困扰。
③如果早期诊断的病例是所谓的“惰性病例”,随之而来的过度治疗可能会损伤其健康。
筛查研究作为一种医学实践对受试者的影响可能存在不确定性,必须遵循“赫尔辛基宣言”的医学伦理学准则,即尊重个人意愿,有益无害,公正等一般伦理学原则。
政策、经济及人力支持环境
人群接受度
筛查效果评价中常见的偏倚
领先时间偏倚
领先时间是指临床前筛查诊断的时点(年龄)至常规临床诊断时点(年龄)之间的时间间隔。
该间隔是疾病的自然病程阶段,如果筛查只提前了发现疾病的时点,而并未改变筛查人群的死亡时点(年龄),也会观察到筛查人群比不筛查人群生存时间更长的假象,即领先时间偏倚。因此,在以生命年为指标评价筛查效果时,应扣除领先时间,否则会高估了筛查效果。
病程偏倚
疾病被检出的可能性和疾病的进展速度有关。
如果筛查组中疾病进展缓慢的病人(肺癌腺癌)占较大比例时,可能观察到筛查组较未筛查组生存概率更高或生存时间更长。此时,筛查的效果被高估了,即产生了病程长短偏倚
志愿者偏倚
健康行为可能决定筛查意愿,参加筛查者与不参加者相比可能有更高的受教育程度,个人经济状况更好,更关注自身的健康,不良行为习惯的发生率较低,因此参加筛查的人群总的发病或死亡风险可能低于不参加筛查人群;此外,主动参与筛查者对后续的治疗的顺应性更高。这些因素都可能使筛查人群的死亡风险低于不参与人群,导致筛查效果被高估,即产生了健康志愿者偏倚。
过度诊断偏倚
如果筛查出的病变正处在良性阶段,可能逆转至正常状态,如宫颈癌的 CIN 1 阶段可自行康复;或者病人病程停滞或进展缓慢,如用 PSA 蛋白阳性筛查前列腺癌,但该指标异常的病例可能终身疾病无进展(即“惰性病例”),病人可能在出现临床症状前就死于其他竞争性疾病。筛查发现过多的早期病例而增加了诊断治疗的负担,这种现象称为“过度诊断”。
因为筛检,这些惰性病例被发现、确诊患病、并被计人病人的病人有较多的生存者或较长的平均生存期,从而高估了筛查效果,即产生了过度诊断偏倚。它也是病程偏倚的一种极端形式。
病因及其发现和推断
寻找和控制病因是预防疾病的前提,也是流行病学发展的开端,病因和因果关系的理论是流行病学理论和实践的重要基础。
病因的基本概念
病因及其与流行病学的关系
病因就是引起疾病发生的原因,即能够影响未来疾病发生的因素或事件。
流行病学起源于对传染性疾病病因的研究,认识病因是预防的前提,没有病因研究就没有预防的可能,因此病因研究是预防医学发展的前提,也就是公共卫生发展的前提。
现代科学的病因观主要是从认识传染病开始的。
在 20 世纪中叶以前漫长时间里,人类的主要疾病是传染病,有关传染病的病因有两个著名的学说:瘴气说和后来居上的微生物说。
广义的瘴气说认为传染病的流行与环境有关,尤其是空气。
19 世纪细菌等病原微生物的发现使人类对传染病的病因有了新的认识,使疾病病因的微生物说得到了验证,该学说认为传染病的病因是微生物。微生物说的出现使瘴气说显得原始、粗糙、笼统、荒谬,不得要领。
随着微生物实验室研究的蓬勃发展,微生物说及其衍生的领域(如微生物学,免疫学,抗生素、疫苗)成为以瘴气说为病因理论基础的流行病学和公共卫生的强大对手,人类对病因认识的重点移向了人体内部,微观和机制。
到了 20 世纪中叶,慢性病开始取代传染病成为人类健康的主要杀手,在研究慢性病病因和预防策略方面,微生物说显得捉襟见肘,无所适从,而注重从外部寻找病因的流行病学又一次发挥了作用,并进而迎来了新的全面的发展,演变成在人群中研究疾病和健康一般规律的方法论,与生物医学基础研究分庭抗礼,成为人类研究和认识健康和疾病的两个核心阵营。
病因与因果关系
病因和疾病的关系,属于哲学上讲的因果关系
什么样的关系才是因果关系?首先因事件必须发生在果事件之前。
时间顺序,是因果关系的第一个基本特征
依时间顺序先后发生的事件之间不一定都是因果关系。
要成为因果关系,这个关系还必须具有可重复性。可重复性指当因事件发生时,果事件一定或经常会发生。
即使是有固定先后时间顺序的可重复的两事件间的关系,也不都是因果关系。
关联关系是因果关系可观察的第二个特征。
因变性是因果关系的第三个基本特征
因果关系必须同时满足这三个基本条件,缺一不可 在流行病学研究里,时间顺序和关联关系是直接可以观察的, 因变性可通过排除其他因素的可能性来间接证明。
医学实践中重要的因果关系主要包括:①病因和疾病的关系;②治疗和效果的关系;③治疗和副作用即不良反应的关系
因果关系的多样性
单因单果:即一种因素只引起一种疾病,一种疾病只由一种因素引起,该病因既是必要的又是充分的
单因多果:即一个因素可引起多种疾病,单因多果的现象是常见的。 单因多果的关系揭示了病因的多效应性,指出了阻断或控制某个病因可以预防多种不同疾 病的可能性。
多因单果:即多种因素可以引起一种疾病,多因单果的现象也是常见的。 多因单果的关系揭示了疾病的多因性,指出了控制某种疾病的发生和发展可多管齐下的可能性。
多因多果:由于单因多果和多因单果的存在,多因多果的现象必然存在。 不同疾病的多个病因可以完全相同,但多数情况下只是部分相同。 多因多果的病因现象增加了病因研究的复杂性和不确定性, 同时也揭示了多种途径预防疾病的可能性。
因果关系的多样性,复杂性还体现在,不管是上述哪一类因果关系,在因和果的通路上,都存在直接和间接病因:即有些病因可直接引起疾病的发生,而另一些病因则需通过作用于一个或多个其他病因,并由后者直接引起疾病的发生。
最后引起疾病的病因叫做直接病因或,直接病因以前的病因都叫做间接病因。
直接病因和间接病因的现象预示病因链的存在,也提示了切断病因链的任何环节都可以达到预防疾病的目的,预示了更多的预防疾病方略的可能性。
病因学说与病因模型
传染性疾病病因的三角模型
该模型明确提出,影响传染病在人群中发生和发展的因素是多重的,并将它们归结为三个方面,即宿主、病原体和环境,三者对传染病流行缺一不可,其关系可用一个等边三角形的平衡关系来描述,表明它们之间相互平等,相互关联和相互制约的关系。
在一定的时间框架里,三者相互作用,相互制约,保持动态平衡,使人群疾病的发病率维持一个常态,一旦三者中的一个或一个以上的因素发生了变化,破坏了这个平衡状态,人群疾病的发病率就会下降或者上升,甚至消失或引起暴发流行。
流行病学的主要任务就是寻找可以用来切断该三角中任何一条(或多条)链索的措施,阻断任何两个因素之间的联系,以此就可以控制疾病的流行。
病因的轮状模型
轮状模型把可患病的人或动物放到了中心的位置,周围是他们生活的物理、化学,生物和社会环境,而传染病的致病因子只是生物环境的一个部分。
该模型用新的方式描述了宿主、致病因子和环境的关系,认为环境、宿主和病原体不是对等和分离的关系,它们的重要性也有主次分别,并提示了直接病因和间接病因的存在,以及远端病因和近端病因的区别。同时,轮状模型也扩充了环境的概念,提示更多的环境因素可以致病,指出了更多的干预靶点,为预防疾病提供了更多的选择。
轮状模型较流行病学三角模型更接近于病因之间以及病因与疾病的实际关系,为研究复杂的慢性疾病的病因打开了新的窗口。
健康决定因素的生态模型
该模型的中心仍是人体,包括一个人的性别,年龄、遗传等特征,然后将其他病因归类,并分成不同的层次,每层又有包含很多相关但不同的因素,并强调各种因素的相互作用对健康的影响。
该模型具有早期疾病轮状模型的基本特征,但是“健康决定因素”生态模型还意味着那些可影响健康但不影响发病的因素也可以被利用,进一步拓宽了“病因”的范围和领域,揭示了更多可以用来提高健康、预防疾病的因素。
病因的生态模型认为,个体特征是疾病发生的根本。
生物环境因素如细菌、病毒及其他微生物、寄生虫、动物传染源和媒介节肢动物等是传染性疾病的重要因素。
从物理化学环境角度看,营养素、天然有毒动植物、微量元素、气象、地理、水质,大气污染、电离辐射、噪声,天灾人祸都与健康有关。
从社会环境角度看,社会制度、人口、经济、家庭、医疗服务体系、文化、职业、宗教、风俗等都会影响健康和疾病的发生和流行。
这些因素相互影响、相互作用,共同决定一个人群的健康水平。
生态病因模型也表明了直接和间接病因的存在。直接病因和间接病因只是相对疾病的“远近”而言。
生态病因模型最大限度地拓展了人类对各种可能病因的认识,从而也揭示了更多新的促进健康,预防疾病的方法,尤其强调人们共同暴露的社会生态因素,指出了改善社会生态环境对预防疾病的作用。但是,在呈示病因之间的关系上,生态模型还是笼统的,不完善的。
病因链
时间上先后发生的互为因果的病因之间,以及这些病因与最终疾病之间的关系可以用病因链来描述。
在一个病因链上,去除任何一个病因,就可以切断整个病因链,从而预防疾病通过此病因链发生。而且这也是最有效的方法,因为不需要针对一个病因链上的所有因素进行干预,就能够达到预防的效果。
一个疾病可能有多个独立作用或相互影响的病因链。
病因网
很少疾病只有一个单一的病因链,事实上一个疾病往往存在多个独立的或相互关联的病因链,同一疾病不同病因链相互连结,相互交错,形成一个更为复杂的完整的病因关系网,麦克马洪把这个从病因到发病的联系的整体网状结构叫做病因网。
如果说轮状模型指出了更广泛的病因的存在,病因网则试图更详尽地描述它们之间的关系。
病因网的概念可以从理论上更清楚地解释疾病预防中的很多现象。
1.去除一条病因链中的任何一个因素就可以完全切断整个病因链,从而预防疾病通过此病因链发生,这使得阻断病因链有了多种选择,增加了预防的方法和可能性。
2.不同的病因链对疾病发生的作用的大小可能不同,有效的预防应切断主要的病因链。
3.不同的病因链可能独立地影响疾病的发生,同时切断多个病因链必然可以预防更多的病例。
病因模型的比较
充分病因-组分病因模型
新的病因观
判断病原体和疾病关系的科赫法则是微生物说的代表性理论,该法则认为疾病的病因是单一的,即一个疾病只有一个病因(即病原体),如果一个疾病的发生只需要一个病因,所有患该病的病人必然都会具有这个病因。 该法则还认为,有了病因疾病必然会发生。
同一个结果可以由多个不同的原因引起,而且单一原因多不足以引起结果的发生,还需其他因素的协同作用,结果才能发生。原因和结果的这种复杂关系可以用充分病因-组分病因模型来解释。
充分病因和组分病因
该模型首先认为,疾病的发生必须是由一个充分病因引起的。 充分病因是疾病发生的充分条件,其形成就等于疾病的发生。
一个充分病因可以由一个或多个组分组成,而且它们缺一不可,任何一个组分病因缺失,疾病就不会发生。
严格地讲,组分病因就是充分病因的一个组成成员或亚单位,充分病因是疾病发生所需要的最低条件或需要的组分病因的最少组合。
最少的意思是,少一个则疾病不会发生,多一个对疾病发生也不必要。
一个疾病可以由一个或多个充分病因引起,一个组分病因可以出现在一个疾病的一个或多个充分病因里。
组分病因对充分病因缺一不可,但这不等于说所有组分病因必须同时存在,更可能的情况是,它们需要按照一定的时间顺序逐次发生,当最后一个组分病因发生或出现时,充分病因完成,疾病发生。
能引起一个疾病发生的充分病因往往不止一个,或者说疾病的发生可以通过多个不同的 充分病因实现,同一疾病的充分病因也彼此互为互补病因。
组分病因 B 是所有三个充分病因都需要的组分,这样的组分病因叫必要病因,因为如果此组分病因不存在,该疾病的任何一个充分病因就不会实现,疾病就不会发生,如果疾病已经发生了,该病因必然存在。
最典型的必要病因就是传染病的病原体。比如,一个人从来都没有感 染过乙型肝炎病毒,他就不会得病毒性乙型肝炎。对于预防传染病来说,疫苗之所以效果很好,就是因为疫苗阻断了必要病因。
即使在必要病因未知的情况下,还是可以通过阻断多个组分病因从而阻断与其相关的充分病因来有效地预防传染病。
充分病因-组分病因模型的应用
充分病因-组分病因模型回答了病因学说的两个重要的悖论,一是为什么没有某个病因疾病却发生了,二是某个病因存在疾病却没有发生。
发现和验证病因
发现病因的法则与方法
时间顺序、关联关系和因变性是因果关系的三个必要特征,因此也是寻找因果关系的理论基础。
在如何观察因果关系三个条件存在与否的问题上,1843 年英国哲学家约翰·穆勒提出了研究因果关系的 5 个逻辑归纳法则,简称穆勒法则,它们分别是求同法,求异法,同异共求法,剩余法和共变法,这些法则是依据因果关系的基本特征提出的,为现实中发现和验证因果关系提供了可依的法则。
穆勒的因果关系推论法则
求同法
求同法认为,考察某现象出现的不同场合,如果各个不同场合除一个条件相同外,其他条件都不同,那么,这个相同的条件可能就是某研究现象的原因。
求异法
求异法认为,比较某现象出现的场合和不出现的场合,如果这两个场合除一点不同外,其他情况都相同,那么这个不同点就是这个现象的原因。
在病因研究中,如果未患某病的个体与患有某病的个体相比,除了某一因素以外,其他因素均相同,那么这个因素可能是该病的病因。
求同法关注的是患某病的人是否都具有某共同特征,求异法则是通过比较病人和非病人在某特征上的差异。
同异共求法
同异共求法(或简称共求法)认为,如果某被考察的现象出现的各种场合只有一个共同的因素(求同),而这个被考察的现象不出现的各个场合都没有这个共同的因素(求同),那么,这个共同的因素(多次求异)就是被考察现象的原因。
在病因研究中,当患病个体中均具有而且只具有一个共同因素,非患病个体中均没有该因素,即患病组和非患病组相比,唯一区别就是该因素,那么该因素有可能是该病病因。
共求法不是求同法和求异法简单的联合使用,它是围绕同一个可疑因素的两次求同和多次求异的联合使用。共求法是在同一个研究中引人对照的逻辑基础,大大提高了求同法或求异法初步锁定的原因的可能性。
共变法
共变法认为,当某一现象存在一种变异或发生一种变化时,另一现象相应存在变异或随之发生变化,且不论后者的变异和变化是什么,那么二者间可能存在因果关系。
最简单的变化是从无到有或从有到无,这是共求法里已经解决的问题。因此,共变法强调的是对剂量-反应关系的考量,当剂量-反应关系存在时,因果关系存在的可能性更大。
剩余法
剩余法认为,如果某一复合现象已确定是由某种复合原因引起的,把其中已确认有因果联系的部分减去,那么,剩余部分也必有因果联系。
在病因研究中,剩余法很少可用作直接发现病因的逻辑指导,但对于判断是否已经发现了一个疾病的主要病因却有帮助。如果发现一个疾病的多个已知病因的累积归因百分比很低(如低于10%),说明不能由这些已知病因解释的“剩余”病例占大多数,由此可推测该疾病的重要病因还没有被发现,探索新病因的研究是有意义的。相反,如果发现一个疾病的多个已知病因的累积归因百分比接近 100%,说明不能由这些病因解释的“剩余”病例已经很少,由此可推测已发现的病因是该疾病的主要病因,如果它们又都是容易干预的因素,探索新病因的研究的意义已经不太大了。
剩余法也可以用于推测个案事件发生的原因。
穆勒法则与流行病学研究设计
穆勒法则是流行病学研究设计的逻辑基础,也提示了不同研究设计的使用顺序,求同法(如由此衍生的病例系列研究)可用于形成病因假设。共求法和共变法(如由其衍生的病例对照研究)可以用来初步验证病因的存在。对照来自求异法,也是共求法和共变法必然包含的一个概念,是研究因果关系不可缺少的准则。队列研究和随机对照试验有机融合了穆勒的四个法则,并同时考证了因和果的时间顺序和因变性,是在人群验证因果关系最可靠的方法。
推论因果关系三个条件存在与否的穆勒法则就是寻找病因的逻辑法则,收集这三个条件存在的证据的方法就是寻找病因的研究,依据研究结果判断这三个条件存在与否的程序就是病因推论的过程。流行病学研究就是按照穆勒法则的原理,在人群中收集病因三个条件的证据,并以此推论医学中因果关系的存在。
因果关系推论
根据研究设计和研究过程的特征,对研究中误差及其大小进行评估,并利用现有其他证据和知识进一步判断研究结果的合理性,最后对因果关系存在的可能性做出判断,这就是流行病研究推论因果关系的程序。
科学推论的一般原则
科学推论是依据科学研究的结果对事物的本质或普遍规律进行的推断。
评价单个研究的真实性
真实性和研究质量
这里的真实性特指一项研究的内部真实性,即在研究条件下观察的结果与真实的接近程度。
研究的目的在于求得真实,观察与真实之间的差别叫偏倚或系统误差。一项研究的偏倚与其结果的内部真实性成反比。
决定研究结果内部真实性的是研究的方法学质量,或简称研究质量。研究质量是对研究偏倚控制程度的总体衡量。因此,研究质量决定研究结果的真实性,质量越高,偏倚就越小,结果的真实性就越高,结论正确的可能性就越大。
决定研究质量的因素
1.研究的质量由研究的偏倚控制措施决定。研究设计是一项研究控制偏倚最基本的方法,一项研究的质量首先取决于研究设计的种类。
2.研究的质量进一步取决于流行病学研究的一般偏倚控制措施,如收集资料的准确性、组间测量的一致性,样本的代表性,减少失访、足够的观察时间等。
3.研究的质量还取决于一类研究设计特有的偏倚控制措施,比如临床试验可使用随机分组,分组隐匿、盲法、维持原随机分组分析等偏倚控制措施。但一项研究不一定采取所有这些措施。使用得越多,偏倚控制就越好,质量就越高。
4.样本量决定抽样误差的大小,决定结果估计的精确性,本质上也是研究结果与真实接近程度的决定因素之一。
评价研究质量的方法
队列研究上面还有随机对照试验
综合所有证据的推论:希尔的病因推断准则
因果关系推断包括两个层面,一是两个事件之间是否存在因果关系,二是该因果关系的强弱,前者是对定性结论的推断,后者是对定量结论的推断,相对更难。
时间顺序
时间顺序指因必须先于果发生的时间关系,是判断因果关系的必要条件。时间顺序是任何一项流行病学研究必须提供的证据,它寓于研究设计之中。
在时间顺序的可信度上,临床试验、队列研究、病例对照研究和横断面研究依次降低。
关联强度
关联强度是用来评价病因和疾病之间关联度高低的指标,一般用相对危险指标衡量,如相对危险度和比值比。
两个因素间关联强度越高,该结果完全由于偏倚产生的可能性就越小,二者间存在因果关联的可能性就越大。
剂量-反应关系
指疾病的发生率随可疑病因的强度或数 量的变化而变化的现象。
剂量-反应关系的存在进一步支持因果关系的存在。
存在关联(包括剂量反应关系)以及关联的时间特征是判断因果关系的必要条件和特异条件。必要的意思是它们必须存在,如果不存在,就可以否定因果关系的存在;特异的意思是这两个条件是确立因果关系特有的条件,是每一项病因研究必须提供的信息,但不是论证其他问题的必要条件,如论证诊断的推确性时则不需要。
结果的一致性
指同类研究结果的一致性,一致性越高,因果关系的可能性就越大。评估一致性需要比较不同的研究,不能在一个研究内得出一致性的结论
一致性又叫可重复性,是不同时间,不同地点,不同人群、不同研究者使用类似的研究方法可重复获得相同或类似结果的可能性。被重复的次数越多,一致性越高,因果关系存在的可能性就越大。
实验证据
实验证据指关于某关联的实验性研究证据。
在人群中的病因研究都属于观察性研究,观察性研究的结论可能出错,可以用更可靠的实验性研究加以确证。
生物学合理性
生物学合理性指某病因假设与该疾病有关的事实、知识和理论相符合或一致的程度,或前者与后者不相悖的程度。生物学合理性越高,因果关系的可能就越大。
生物学—致性
生物学一致性指某病因假设与现有更一般的生物医学事实,知识和理论相符合或一致的程度,或前者可以被后者解释的程度。生物学一致性越高,因果关系的可能就越大。有人认为,生物学合理性和生物学一致性十分近似,可以合二为一。
特异性
特异性指病因和疾病之间的排他性或特异程度。
如果一种病因只能引起一种疾病,或只在某特殊人群引起疾病,且该疾病只有一种病因,该病因与疾病的关系具有高度特异性。特异性越高,因果关系的可能就越大。
相似性
相似性指存在已知的类似的病因和疾病的因果关系,由于可以类比的因果关系的存在,将加强新的因果关系的可能性
预测力
在科学上,对一个理论检验最有力的方法就是评估它的预测能力,简单地说,就是利用该理论提出一个对未来或是过去的预测,然后再收集数据评估预测的正确性。
是有关研究之间的信息或流行病学研究之外的知识,是非特异的条件,是科学推论中使用的一般性标准,其中结果的一致性最为重要。它们又是非必要的条件,即缺乏任一项或所有 7 项,都不足以否定因果关系的存在。
所有 10 项条件都不是充分条件,即使两个事件的关系满足了所有 10 项条件,也不能百分百肯定它是因果关系。
希尔准则存在几个明显的重要的缺陷
第一,没有考虑收集的原始研究是否全面和完整。
第二,对原始研究证据的真实性(即原始研究的方法学质量)没有考评。如果两个因素之间符合所有 10个条件,提示二者很可能存在因果关系,但是如果关于这些条件的证据是不可信的,则没有理由相信该因果关系的存在。
第三,希尔准则将一个研究内提供的信息以及可在研究间观察到的信息和流行病学研究以外的信息混为一谈,认为它们是同等重要的。显然,在判断因果关系上,存在关联(或剂量反应关系)以及关联的时间顺序是特异的和必要条件,是判断因果关系的基本条件,是特异的准则。在非特异性准则中,与生物学合理性,生物学一致性,特异性和相似性比较,研究的一致性,实验 证据和预测能力则更具有因果关系的判定能力。
第四,在非特异的标准中,一致性是最关键的条件,但是希尔对什么是一致性没有量化的界定,因此很难判断。况且,缺乏一致性可能是交互作用造成的,交互作用的存在支持了病因推断的特异性的标准,因此一致性不好不一定是因果关系不存在,甚至很可能相反,不可一概而论。
综合所有证据的推论:系统综述
系统综述加强了对原始研究收集的系统性以及对结果定量的推论,并在原始研究结果真实性、精确性和一致性方面,系统地提出了一套统一的定量评估方法。
meta分析