导图社区 流病总结(1)(第一章~第八章)
这一部分是流病病学最重点的部分,属于流行病学的理论框架的搭建,还有一些流行病学的专业术语和研究的基本方法!
编辑于2023-04-14 17:54:47 广东社区模板帮助中心,点此进入>>
带读重点
第一章 绪论
流行病学的定义及定义的诠释
定义:流行病学是研究人群中疾病与健康状况的分布及其影响因素,并研究防制疾病及促进健康的策略和措施的科学
诠释
研究内容的三个层次
疾病
伤害
意外、残疾、智障、身心损害
健康
身体生理生化的各种功能状态、疾病前状态、长寿
任务的三个阶段
揭示现象
描述流行病学方法,揭示流行与分布的现象
找出原因
分析性流行病学方法,检验病因假说
提供措施
找出预防和控制的策略和措施,用实验流行病学方法验证
三种基本方法
观察法
实验法
数理法
三大要素
原理
方法
应用
流行病学的应用
疾病预防和健康促进
根本任务之一:预防疾病
疾病预防
策略
第九章
战略性、全局性
措施
第十一章~十五章、第十九章~二十六章
战术性、局部的
疾病的监测
第十章 健康监测
疾病病因和危险因素的研究
第八章 病因与因果关系推断
流行病学工作不拘泥于非找到病因不可,可以找到一些关键的危险因素
疾病的自然史
疾病在个体中的自然发展
亚临床期、症状早期、症状明显期、症状缓解期、恢复期
传染病
潜伏期、前驱期、发病期、恢复期
疾病防治的效果评价
流行病学的基本研究方法
(按设计类型分)
观察法
按是否有事先设立对照组分
描述流行病学
现况研究
监测
生态学研究
产生假设
分析流行病学
病例对照研究
队列研究
检验假设
实验法
实验流行病学
临床试验
现场试验
个体试验
社区试验
验证假设
数理法
理论流行病学
流行病学的特征
群体的特征
对比的特征
核心
概率论和数理统计学特征
流行病学强调的是概率
社会心理的特征
预防为主的特征
发展的特征
总结
补充
现代流行病学的基本原理
疾病与健康在人群中的分布
疾病的发病过程
人与环境的关系
病因论
疾病防制的原则和策略
疾病发展的数学模型
流行病学面临的挑战和展望
宏观与微观并举
传染病与非传染病并重
健康保护与健康促进并存
发展现场流行病学
重视流行病学研究中的伦理学问题
强化流行病学在询证浪潮中的作用
流行病学简史
流行病学与临床医学的不同点
第二章 疾病的分布
概述
1、疾病的分布既反映了疾病本身的生物学特性,也集中体现了与疾病有关的各种内外环境因素的效应及其相互作用的特点
2、疾病的分布是描述性研究的核心,分析性研究的基础,制定疾病防制策略和措施的依据
疾病频率测量指标的定义、公式、应用
疾病频率常用的测量指标
率和比
率(rate)
表示在一定条件下某现象实际发生的例数与可能发生该现象的总例数之比,来说明单位时间内某现象发生的频率或强度。
比(ratio)
两个数相除所得的值,说明两者的相对水平,常用倍数或百分比表示
构成比(proportion)
说明某一事物内部各组成部分所占的比重或分布,常以百分数表示
不要以比代率
分子部分包含在分母部分之内
常用来表示疾病或死亡的顺位、位次或所占比重
发病频率测量指标
发病率
是指一定期间内,一定范围人群中某病新发生病例出现的频率
一定时期内、同时期
一般为一年
某病新发病例数
新发病时间、初次诊断时
一人多次发病则记多次
暴露人口数
是指在观察期内某地区人群中可能发生某种疾病的人
不计入
因已经患病而在观察期间不可能再成为新发病例者
罹患疾病或预防接种获得持久免疫力者不应计入
如果不易获得,用该时期的平均人口数
年初与年末人口之和除以2
年终人口
发病专率:按照不同人口学特征(年龄、性别等)分别计算
不同人群发病率比较:应进行标准化处理
应用
疾病流行强度的指标,反映对人群健康影响的程度
了解疾病流行特征
探讨发病因素
提出病因假说
评价防治措施的效果
评价病因预防效果
罹患率
适用
某一局限范围,短时间内的暴发的发病率
特点
根据暴露程度精确测量发病频率
观察时间较短
日、周、旬、月
食物中毒、职业中毒、传染病暴发流行中使用
续发率(二代发病率) SAR
在一个集体中第一个病例发生后,在该病最短与最长潜伏期之间受其传染而发生的病例
应将原发病例从分子及分母中去除
即分子和分母都不包含首发病例
用途
评价传染力指标,比较传染病传染力的强弱
分析流行因素
评价防治效果,采取措施后,看是否有效抑制
比如:在一次传染病的暴发期间,通过采取某一种措施,如戴口罩来阻止传播,若续发率降低,说明这一措施有效?
患病频率测量指标
患病率
指某特定时间内总人口中某病新旧病例所占的比例
新旧病例数
该时期内新发生的
以前发病但未痊愈的
分母不包括在该时点前已经死亡的人数
分母不考虑死亡数(分母:在时期内存在过的都算不管死没死,在时期之前死了的不算)分子:在时期之内患病但是死了的也算
分类
时点患病率:观察时间为一个时点,一般不超过一个月
期间患病率:观察时间为一段时间,通常为几个月,应尽可能短
影响患病率的因素
患病率升高
新病例增加
治疗水平提高,未治愈者的寿命延长
病程延长
病例迁入
健康者迁出
易感者迁入
诊断水平提高
报告率提高
患病率降低
新病例减少
病死率增高
病程缩短
病例迁出
健康者迁入
治愈率提高
主要是从病程、病例数、易感者、健康者、诊断水平、报告率、治愈率、寿命等方面叙述
患病率与发病率、病程的关系:患病率=发病率✖️病程
前提:发病率和病程在相当长的时间内保持稳定
可由患病率和发病率估算疾病病程
应用
反映疾病的现患状况
表示病程较长的慢性病的流行情况
为合理计划卫生设施、人力物力及卫生资源提供依据。
研究疾病流行因素,监测慢性病的控制效果
感染率
是指某时间内被检人群中某病原体现有感染者人数所占的比例
应用
通常用于研究某些传染病或寄生虫病的感染情况和防治工作的效果
隐性感染、病原携带者、轻型和不典型病例的调查
评价健康人群健康状况的常用指标
研究疾病防制效果
估计某病流行态势
为防制措施提供依据
患病率与发病率的比较
死亡或生存指标
死亡率
在一定时期内,某人群中总死亡人数在该人群中所占的比例
测量人群死亡危险最常用的指标
粗死亡率:死于所有原因的死亡率
死亡专率:按疾病种类、年龄、性别、职业、种族等计算的死亡率。
与分子应该是相对应(时间、地域、人口特征等)的人口
应用
用于衡量某一时期,一个地区人群死亡危险性大小的指标
反映一个地区不同时期人群的健康状况和卫生保健工作的水平
为该地区卫生保健工作的需求和规划提供科学依据
探讨病因和评价防治措施
作为疾病发生风险的指标:病死率高生存时间短时,反映发病率。eg胰腺癌
病死率
表示一定时期内因某病死亡者占该病病人的比例
表示某病病人因该病死亡的危险性
应用
表示某确诊疾病的死亡概率
可表明该疾病的严重程度
反映医疗水平和诊断能力
通常多用于病程短的急性病,较少用于慢性病
注意:受疾病严重程度、诊治及治疗水平和病原体毒力影响
婴儿死亡IMR率
是反映一周岁以内婴儿死亡水平的指数
是指婴儿出生后不满周岁死亡人数与出生人数的比率
分子
上一年出生本年死亡的未满周岁的婴儿数
本年出生本年死亡的未满周岁的婴儿数
反映一个国家或地区医疗卫生条件、社会经济实力、人民生活水平以及科技发展水平的重要指标
衡量人口素质的重要依据之一
表明该地区人口的健康状况及生活质量,特别是妇幼保健水平
生存率
指接受某种治疗的病人或某病病人中,经n年随访尚存活的病人数所占比例
该指标与时间有关
应用
用于评价某些病程较长疾病的远期疗效
反映疾病对生命的危害程度
应用该指标时,应确定随访开始日期和截止时间
疾病负担指标
潜在减寿年数(PYLL)
potential years of life lost,PYLL
某病某年龄组人群死亡者的期望寿命与实际死亡年龄之差的总和,死亡造成的寿命损失
计算时考虑到死亡发生的年龄因素
强调了早亡对健康的损害。
应用
人群疾病负担测量的一个直接指标
评价人群健康水平的一个重要指标
比较不同疾病所致的寿命减少年,衡量某种死因对人群的危害程度,确定重点疾病,明确重点卫生问题
为不同年龄组重点疾病提供依据
用于防治措施效果的评价和卫生政策的分析
可综合衡量估计导致某人群早死的各种死因的相对重要性
伤残调整寿命年(DALY)
disability adjusted life year,DALY
指从发病到死亡所损失的全部健康寿命年,包括因早死所致的寿命损失年 (YLL) 和疾病所致伤残引起的健康寿命损失年 (YLD) 两部分。
应用
反映疾病对人群寿命损失的综合指标
比较地区间的卫生健康状况
了解干预措施的有效性
确定不同病种的疾病负担
为防治重点提供重要信息
进行卫生经济学评价
用于成本效果分析
注意:不同地区的疾病频率指标的比较,均需要进行标化
疾病流行强度指标的定义、特点
疾病流行强度:在一定时期内疾病在某地区人群中发病率的变化及其病例间的联系程度
疾病长期流行可以用散发、暴发、流行、大流行来描述流行强度
疾病流行强度以发病率描述某种疾病在某地区人群单位时间内新发病例数量的变化特征,以便确定采取常规防制对策还是启动应急预案
指标
散发
指发病率呈历年的一般水平,各病例间在发病时间和地点上无明显联系,表现为散在发生
范围较大的地区,与当地近三年该病的发病率比较
常见情况
当疾病预防与控制有效时
病后免疫力持久的疾病或因预防接种使人群维持一定免疫水平的疾病
麻疹
以隐性感染为主的疾病
脊髓灰质炎、乙型脑炎
传播机制不容易实现的传染病
斑疹伤寒、炭疽
长潜伏期的传染病
麻风
暴发
是指局部地区或集体单位,短时间内突然发生很多症状相同病人的现象
在特定人群短时间内发生同一疾病叫暴发(√)
有相同的传染源或传播途径
大多数病人常同时出现在该病的最短和最长潜伏期之内
暴发的疾病可以是传染病,也可以是非传染病
暴发时病例发病日期不同可能是由于个体特征或接触致病因子的时间不同
暴发有几种同时的暴发,也有持续、蔓延的暴发(√)
流行
某些地区某病的发病率显著超过该病发病率水平,各病例之间呈现明显的时间和空间联系
提示当地可能存在共同的传播因素
大流行
某病发病率显著超过该病历年发病率水平,疾病蔓延迅速,涉及地区广,在短期内跨越省界、国界甚至洲界形成世界性流行
疾病流行强度的定义及举例
疾病年龄分布的分析方法
横断面分析和出生队列分析的数据转换
横断面研究
分析同一时期不同年龄组或不同年代各年龄组的发病率、患病率或死亡率的变化
多用于某时期传染病或潜伏期较短疾病的年龄分布分析
局限:对于慢性病,由于暴露时间距发病时间可能很长,致病因子在不同时间的强度也可能发生变化,而同一年代出生的群体对致病因素暴露的时间和强度具有一定的相似性,所以不能显示致病因子与年龄的关系
可能是由于较早的出生队列,其早年各个时期的暴露经历不同于出生较晚的人群,早期可能致病因子比较弱,从而导致了在横断面研究中,高年龄组的人的发病率有下降的趋势(假象)
看图分析
不同时代的同一年龄组的发病率比较,可以提示病因作用
出生队列研究
出生队列:同一时期出生的一组人群,对其随访若干年,以观察发病情况
出生队列资料→【年龄分布】+【时间分布】
出生队列研究:利用出生队列资料将疾病年龄分布和时间分布结合起来描述的方法
用途
用于评价疾病的年龄分布长期变化趋势
提供病因线索
明确呈现致病因子与年龄的关系,有助于探明年龄、所处时代暴露特点及经历在疾病的频率变化中的作用
判断疾病是否属于地方性疾病的依据
定义:局限于某些特定地区内相对稳定并经常发生的疾病。经常存在于某一地区或人群,并有相对稳定的发病率,由于自然地理环境中人体正常代谢所需的某些微量元素过多或缺乏所致的疾病
判断依据
该地区的居民发病率高
其他地区居住的人群发病率低,甚至不发病
迁入该地区一段时间后,其发病率和当地居民一致
迁出该地区后,发病率下降,患病症状减轻或自愈
当地的易感动物也可发生同样的疾病
疾病时间分布指标的定义、特点
短期波动
定义:一般是指持续几天、几周或几个月的疾病流行或疫情暴发。与暴发含义相近,区别在于暴发常用于少量人群,而短期波动常用于较大数量的人群
一般具有比较确定的原因
季节性
定义:疾病在一定季节内呈现发病率增高的现象
严格的季节性
以虫媒传播的传染病发生有严格的季节性
北方乙脑——夏秋季
季节性升高
一年四季均发病,但仅在一定月份发病率升高
肠道传染病——夏秋季
周期性
定义:是指疾病频率按照一定的时间间隔,有规律地起伏波动,每隔若干年出现一个流行高峰的现象。由于易感者积累使人群易感性增加,形成发病率增高的现象
呼吸道传染病
原因
人口密集、交通拥挤和卫生条件差等因素利于疾病的传播
传播机制容易实现的疾病,当感染者积累到足够的数量便可迅速传播
病后可形成稳固免疫的疾病,一度流行后发病率可迅速下降
周期性的发生还取决于病原体变异及其变异的速度,其时影响疾病周期性的重要因素
长期趋势
定义:是指在一个比较长的时间内,通常为几年或几十年,临床特征、分布状态、流行强度等方面所发生的变化。
胃癌
出现原因
病因或致病因素的变化
病原体的变异
机体免疫状况的改变
医疗和防制水平的提高
报告及等级制度完善程度
移民流行病学研究遵循的原则
若某病发病率或死亡率的差别主要是由环境因素作用的结果,则该病在移民人群中的发病率或死亡率与原住国(地区)人群不同,而接近移居国(地区)当地人群的发病率或死亡率
若该病发病率或死亡率的差别主要与遗传因素有关,则移民人群与原住国(地区)人群的发病率或死亡率近似,而不同于移居国(地区)当地人群
知识陷阱
影响患病率的因素
主要是从病程、病例数、易感者、健康者、诊断水平、报告率、治愈率、寿命等方面叙述
病死率与死亡率的区别
分子/分母是否保留死亡数
时点患病率:考虑死亡数(分母:在时点之后发病也算,健康的算,在时点之前死了的不算)
期间患病率:不考虑死亡数(分母:在时期内存在过的都算不管死没死,在时期之前死了的不算;分子:在时期之内患病但是死了的也算)
发病率:分子(在规定时间之后发病的不算,在规定时间之前发病且死亡的不算;规定时间内新发算)、分母(包含新发病例数,规定时间之后发病的算,一直健康的算;在规定时间之前的发病且属于患病状态的不算,在规定时间之前发病且死亡的不算)
死亡率计算时分母为平均人口数,包括了所研究疾病的病人和非病人。而病死率的计算只与所研究疾病的病人有关。使用病死率、死亡率几发病率可从不同侧面把握疾病的特征,正确分析发病与死亡的关系。
死亡率是频率,病死率是比例
患病率与发病率的区别
分子不同:新病例 VS 新旧病例
分母不同:暴露人口或平均人口 VS 调查人数或平均人口
发病率:动态指标,发病报告或队列研究获得,各种疾病,衡量疾病的流行强度,观察时间1年或更长
患病率:静态指标,横断面调查获得,慢性病,衡量疾病的现患状况,观察时间较短
当某地某病的发病率和该病的病程在相当长时间内保持稳定时,患病率、发病率和病程三者的关系是:
患病率(P)=发病率(I)×病程(D)
出生队列分析和横断面分析的区别
移民流行病学研究遵顼的原则
补充
疾病的分布
人群分布
年龄
性别
职业
职业是劳动者所处的作业环境、社会经济地位、卫生文化水平、体力劳动强度和精神紧张程度等因素的综合指标
疾病的职业分布与作业环境致病因子暴露有关
职业相关致病因子的暴露及其作用与劳动条件、防护设备有关
不同职业人群疾病种类不同,防制重点各异
职业暴露时间及既往职业史对疾病发生的影响
种族和民族
黑种人镰刀状细胞贫血
婚姻与家庭
已婚妇女宫颈癌发病率高
行为生活方式
吸烟→肺癌、食管癌
流动人口
具有生活和卫生防病条件差、人群免疫水平低、预防医疗组织不健全、流动性强的特点
对传染病在城乡间的传播起纽带作用
是疾病暴发的高危人群
疟疾、鼠疫
宗教信仰
犹太教→宫颈癌、阴茎癌
地区分布
国家间及国家内不同地区的分布
疾病在不同国家间的分布
艾滋病→全球;霍乱→印度
疾病在同一国家内不同地区的分布
鼻咽癌→广东;食管癌→河南
城乡分布
城市:呼吸道传染病
农村:肠道传染病
地区聚集性
定义:某地区发病及患病等疾病频率高于周围地区的情况,该地区疾病频率超过了随机概率
分类
地方性
不要过度纠结地方性疾病与地区聚集性的区别,一般认为地区聚集性是地方性疾病的表现
统计地方性
由于生活条件、卫生条件和宗教信仰等社会因素使某一地区某些疾病发病率长期显著高于其他地区,与该地自然环境关联甚微
自然地方性
某些疾病受自然环境的影响,只在某一特定地区存在的情况
自然疫源性
某些疾病的病原体在繁衍种属的过程中不依赖于人,而在野生动物或家畜中传播,人是偶尔介入该环节时受到感染
输入性疾病:外来的,凡本国或本地区不存在或已消灭的传染病,从外地传入(艾滋病)
小总结
地方性疾病
地方性氟中毒
时间分布
短期波动
季节性
周期性
长期趋势
疾病在人群、地区和时间分布的综合描述
移民流行病学
第三章 描述性研究
描述性研究的概述
概念:利用常规监测记录或通过专门调查获得的数据资料(包括实验室检查结果)按照不同地区、不同时间及不同人群特征,进行分组,描述人群中有关疾病或健康状态以及有关特征和暴露因素的分布状况,在此基础上进行比较分析,获得疾病三间(人群、地区和时间)分布的特征,进而获得病因线索,提出病因假设。
种类
现况研究
定义:是在一个特定时点或时期内,在特定范围内的人群中,对某种(些)疾病或健康状况以及相关因素进行调查的的一种方法。
意义
(1)描述所研究疾病或健康状况以及相关因素在该调查人群中的分布
(2)为建立病因假设提供证据
病例报告
定义:对临床上某种罕见病的单个病例或少数病例的详细介绍
定性研究
意义
重点探究罕见病产生的原因(研究涉及少数个案,通过对个案特征的把握得出结论。无需描述事物集中趋势和离散程度,为研究者提供分析和决策的线索)
通常是针对个别现象的探讨,判断一个病例是否为罕见病例需要进行全面的文献检索
病例系列分析
定义:对一组(几例、几十例、几百例或几千例)相同疾病的病人临床资料进行整理、统计、分析、总结并得出结论
意义:分析某种疾病的临床表现特征,评价预防、治疗措施的效果
个案研究
=个案调查,是指到发病现场对新发病例的接触史、家属及周围人群的发病或健康状况以及可能与发病有关的环境因素进行调查,
目的
(1)以达到查明所研究病例的发病原因和条件
(2)控制疫情扩散及消灭疫源地,防止再发生类似疾病的目的
对象:一般为传染病病人,也可以是非传染病病人或病因未明的病例等
意义
(1)是医疗卫生及疾病预防部门日常处理病例报告登记工作的组成部分
(2)可以获得有关疾病发病的第一手资料
(3)为地区疾病控制提供了分析基础
(4)为探索病因提供线索
举例
对个别发生的麻疹患者进行调查
一次因会餐引起的事物中毒调查
历史资料分析
定义:研究者通过回顾性调查,提取和利用相关机构的日常工作的记录、登记、各类日常报告、统计表格、疾病记录档案等历史资料,进一步开展统计分析,最终获得研究结果
意义
(1)是研究疾病的三间分布特征、疾病危险因素和评价疾病防制措施效果的重要资料和信息来源
(2)属于基础资料范畴
随访研究
定义:通过定期随访,观察疾病、健康状况或卫生事件在一个固定人群中随着时间推移的动态变化情况。
对研究对象进行连续观察
意义
(1)疾病自然史的研究
(2)提供病因线索
(3)提出或检验某种病因学假设
生态学研究
=相关性研究。是在群体的水平上研究暴露于疾病之间的关系,观察和分析的单位是群体。
粗线条的研究
仅能提供一定的病因线索
特点
以观察为主要研究手段,不对研究对象采取任何干预措施。
观察、无干预
暴露因素的分配不是随机的,且在研究开始时一般不设立对照组
暴露分配非随机、研究开始不设对照
暴露与结局的时序关系无法确定,因果推断具有一定的局限性,仅可做一些初步的闭角型分析,但可为后续的分析性或实验研究提供线索
暴露时序不定,因果受限,仅初步分析,提供线索
用途
描述疾病或者健康状况的分布及发生发展的规律
疾病危险因素的发现
高危人群的确定
疾病病人的早发现、早诊断、早治疗
人群疾病防制策略措施的提出
卫生政策和医疗卫生计划的制定提供基础资料,具有启示作用
获得病因线索,提出病因假设
比较差异
现况研究
概念=横断面研究、患病率研究
定义:对特定时点(或期间)和特定范围内人群中的疾病或健康状况和有关因素的分布情况的资料收集、描述,从而为进一步的研究提供病因线索。
特点
现况研究一般在设计阶段不设对照组
研究设计阶段,根据研究目的确定研究对象,然后调查研究对象在某一特定时点上的暴露(特征)和疾病的状态,而不是根据暴露状态或疾病状态先进行分组
但是在资料分析阶段,则可根据暴露(特征)的状态或是否患病的状态来分组比较
现况研究的特定时间
1、某一特定时点上或某一特定时期内
2、特定时点并不强调必须是某年某月的某一特定时间,如调查高血压的患病情况时,对每一个个体来说,特定时点是指测量血压、诊断是否为高血压的时间
3、这些不同的具体时点持续太久,就会对调查结果产生影响
4、所调查的疾病是急性的,且随着时间的变化,其发病率也有不同,此时结果就很难解释
5、理论上,时点患病率较期间患病率更为准确,因此这个时间应该越集中越好
现况研究在确定因果联系时受到限制
在现况研究中,研究对象一般都是存活期较长的病人,而某些病程较短的疾病病人(如迅速痊愈或很快死亡),则很难包括在一个时点或一个短时期的研究中。但存活期长与存活期短的病人,在许多特点上可能会很不一样,这种情况下,就很可能将影响存活的因素当作影响发病的因素
可能把疾病的保护因素当作发病的危险因素
现况研究一般揭示的是某一时点或时期暴露(特征)与疾病的关系,而不能确定暴露与疾病的时间顺序关系
无法知道是因为影响因素的出现导致的疾病还是疾病的出现导致影响因素的出现
对研究对象固有的暴露因素可以作因果推断
如性别、种族、血型、基因型等因素,在发病之前就存在,且不会因是否患病而发生改变,则在排除和控制了可能存在的便宜的情况下,在现况研究可以提供相对真实的暴露和疾病的时间先后时序关系,从而进行因果推断
现况研究用现在的暴露(特征)来替代或估计过去的情况的条件
1、现在的暴露或暴露水平与过去的情况存在着良好的相关关系,或已被证明变化不大。如职业性暴露
2、已知研究因素的暴露水平的变化趋势或规律,以此趋势或规律来估计过去的暴露水平
3、回忆过去的暴露或暴露水平极不可靠,而现在的暴露资料可以用来估计过去的暴露情况
现况研究定期重复进行可以获得发病率资料
1、该时期的发病率=两次现况研究的现患率之差/两次现况研究之间的时间间隔
2、要求:两次现况研究之间的时间间隔不能太长,在该时间范围内发病率的变化不大,且疾病的病程稳定。
3、避免了需要长期随访监测研究对象来获得发病率资料的研究方法的弱点。
类型
普查
抽样调查
用途
掌握目前群体中疾病或健康状况的分布
提供疾病病因研究的线索
确定高危人群
例如,为了预防与控制冠心病和脑卒中的发生,需要将目标人群中这类疾病的高危人群鉴别出来。现有的知识认为高血压是这类疾病的一个重要危险因素,据此,可应用现况研究找出该目标人群中的全部高血压病病人,将其确定为高危人群。
描述性研究的用途
评价疾病监测、预防接种等防治措施的效果。
优点
现况研究常开展的是抽样调查。其研究结果有较强的推广意义,以样本估计总体的可信度较高。
现况研究是在资料收集完成之后,将样本按是否患病或是否暴露来分组比较的,即有来自同一群体自然形成的同期对照组,使结果具有可比性。
现况研究往往采用问卷调查或实验室检测等手段收集研究资料,故一次调查可同时观察多种因素,其在疾病病因探索过程中,为不可或缺的基础工作之一。
缺点
现况研究与分析性研究的一个明显区别是其对特定时点即某一时间横断面和特定范围的规定,收集的信息通常只能反映调查当时个体的疾病与暴露状况,难以确定先因后果的时相关系
现况研究调查得到的是某一时点是否患病的情况。故不能获得发病率资料,除非在一个稳定的群体中连续进行同样的现况调查。
在一次现况研究中,如果研究对象中一些人正处于所研究疾病的潜伏期或临床前期,则其极有可能会被误定为正常人。使研究结果发生偏倚,低估该研究群体的患病水平。
普查和抽样调查
普查
定义:在特定时点或时期内、特定范围内的全部人群(总体)作为研究对象的调查。
1、这个特定时间应该较短
2、特定范围是指某个地区或某种特征的人群
目的
早期发现、早期诊断、早期治疗病人。eg.宫颈癌普查
了解慢性病的患病及急性传染性疾病的的疫情分布
了解当地居民健康水平
了解人体各类生理生化指标的正常值范围
优点
不存在抽样误差
可以同时调查目标人群中多种疾病或健康状况的分布情况
能发现目标人群中的全部病例,在实现三早预防的同时,全面地描述疾病的分布与特征,为病因分析提供线索
缺点
不适用于患病率低且无简便易行诊断手段的疾病
工作量大,因此不易细致,难免存在漏查
调查工作人员涉及面广,掌握调查技术和检查方法的熟练程度不一,对调查项目的理解往往很难统一和标准化,较难保证调查质量
耗费人力、物力资源一般较大,费用往往较高
抽样调查
定义:指通过随机抽样的方式,对特定时点、特定范围内人群的一个代表性样本进行调查,以样本的统计量来估计总体参数所在的范围。即通过对样本中的研究对象的调查研究来推断其所在总体的情况
优点
具有节省时间、人力和物力资源等优点
由于调查范围小,调查工作易于做得细致
缺点
抽样调查的设计、实施与资料分析均比普查要复杂
资料的重复或遗漏不易被发现
不适用于抽样调查
对于变异过大的研究对象或因素和需要普查普治的疾病
很难抽到有代表性的样本
患病率太低的疾病(因为需要很大的样本量,如果抽样比大于75%。则不如进行普查)
抽不到病例
影响样本量的因素
预期现患率(p)
精确性:容许误差d↑,样本量↓
显著性水平(α):α↓,样本量↑
求样本量
当α=0.05,d=0.1×p,Z=1.96≈2时,n=400×q/p
p为预期的现患率,q=1-p
总结
因为需要很大的样本量,如果抽样比大于75%→普查。抽样调查的基本要求是能将从样本获得的结果推论到整个群体(总体),抽样必须随机化,样本量要足够
随机抽样方法
单纯随机抽样
定义:从总体N个对象中,利用抽签或其他随机方法(如随机数字)抽取n个,构成一个样本
重要原则:总体中每个对象被抽到的概率相等(均为n/N)
样本量的估计
若已知总体率
则无限总体抽样公式如下,δ为容许误差,π为总体率
若总体均数已知
无限总体的样本量计算公式如下,
有限总体需在其基础上进行校正
标准误计算
均数的标准误
率的标准误
s为样本标准差,p为样本率,N为总体含量,n为样本量,n/N为抽样比,若小于5%可忽略不计
最简单,最基本的抽样方法。是其他抽样方法的基础。
系统抽样
定义:又称机械抽样,是按照一定顺序,机械地每隔若干单位抽取一个单位的抽样方法。
优点
可以在不知道总体单位数的情况下进行抽样
在现场人群中较易进行
样本是从分布在总体内部的各部分的单位中抽取的,分布比较均匀,代表性较好
缺点
假如总体各单位的分布有周期性趋势,而抽取的间隔恰好与此周期或其倍数吻合,则可能是样本产生偏性
计算:系统抽样标准误的计算可用单纯随机抽样的公式代替。
分层抽样
定义:是指先将总体按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本
层内变异越小越好,层间变异越大越好
优点
可以提高总体指标估计值的精确度。(它可以将一个内部变异很大的总体,分成一些内部变异较小的层(次总体))
分层抽样比单纯随机抽样所得的结果精确度更高。组织管理更方便,而且它能够保证总体中每一层都有个体被抽到
除了能估计总体的参数值,还可以分别估计各个层内的情况
分类
按比例分配
各层内抽样比例相同
最优分配
各层抽样比例不同,内部变异小的层抽样比例小,内部变异大的层抽样比例大,此时获得的样本均数或样本率的方差最小。
计算
估算总体率所需样本量:
Wi=Ni/N为第i层的例数、pi阳性率、qi阴性率、N总例数、v为估计总体率的方差,δ为容许误差
第i层样本量:
估计总体均数所需样本量
第i层的样本量:
整群抽样
定义:是将总体分成若干群组,抽取其中部分群组作为观察单位组成样本。
分类
单纯整群抽样:被抽到的群组中的全部个体作为调查对象
二阶段抽样:通过再次抽样后调查部分个体
特点
易于组织,实施方便,可以节省人力、物力
群间差异越小,抽取的群越多,则精确度越高
抽样误差较大,故通常在单纯随机抽样样本量估计的基础上再增加1/2
多阶段抽样
定义:将抽样过程分阶段进行,每个阶段使用的抽样方法往往不同。即将以上抽样方法结合使用,其在大型流行病学调查中常用
优点
充分利用各种抽样方法的优势,克服各自的不足,并能节省人力物力
缺点
在抽样之前要掌握各级调查单位的人口资料及特点
现况研究的偏倚及控制
偏倚:指从研究设计与实施得到数据处理和分析的各个环节中产生的系统误差,以及结果解释、推断中的片面性导致的研究结果与真实情况之间出现的倾向性的差异,进而导致对暴露与疾病之间联系的错误描述。
研究设计➡️数据处理➡️结果解释
研究结果不等于真实情况
产生原因
主观选择研究对象。即选择研究对象具有随意性,将随机抽样当做随意抽样。
任意变换抽样方法,如原本根据出院号来随机选择抽样,之后又改用入院号等其他方法来抽样。
无应答偏倚:调查对象因不愿意合作或其他种种原因,不能或不愿意参加调查,从而降低了应答率。如果应答率低于70%,就难以用调查结果来估计整个研究总体的情况
幸存者偏倚:所调查到的对象均为幸存者,使得调查结果有一定的局限性和片面性,不能全面反映实际情况
选择偏倚:导致研究样本缺乏代表性,而使研究结果不能外推。
报告偏倚:询问调查对象有关问题时,由于种种原因回答不准确
回忆偏倚:调查对象对过去的暴露史或疾病史等回忆不清,特别是健康的调查对象,由于没有疾病的经历,而容易将过去的暴露情况等遗忘
调查偏倚:调查员有意识的深入调查某些人某些特征。而不重视或马虎对待其他人的这些特征。
测量偏倚:在资料收集过程中,测量工具、检验方法不正确,化验操作不规范等。
混杂因素的存在也可以导致偏倚的发生
控制
有效的质量控制的前提:研究设计时要反复论证,尽量设计严密。并要考虑到调查中或调查结束时对资料进行质量评价的方法和指标。
重点强调以下几个方面
严格遵照抽样方法的要求,确保抽样过程中随机化原则的切实实施
提高研究对象的依从性和受检率
正确选择测量工具和测量方法,包括调查表的编制等
组织好研究工作,调查员一定要经过培训,统一标准和认识
做好资料的复查,复核等工作
选择正确的统计分析方法,注意辨析混杂因素及其影响。
生态学研究的概念、类型、特点、用途
定义:在群体的水平上研究某种暴露因素与疾病之间的关系,以群体为观察和分析的单位,通过描述不同人群中某因素的暴露状况与疾病的频率,分析该暴露因素与疾病之间的关系。
特点
在收集病和健康状况以及某暴露因素的资料时,不是以个体为观察和分析的单位,而是以群体为单位的(如国家,城市,学校等),这是生态学研究最基本的特点。
该类研究虽然能通过描述不同人群中某因素的暴露情况与疾病频率来分析该因素与疾病的关系,但无法得知个体的暴露与效应(疾病)间的因果关系。
生态学研究是从许多因素中探索病因线索的一种常用方法,然而喜提供的信息是不完全的,只是一种粗线条的描述性研究。
用途
提供病因线索,产生病因假设
被广泛应用于慢性病的病因学研究,或环境变量与人群疾病(健康)状态关系的研究。为研究假设建立提供依据。
评估人群干预措施的效果
在疾病监测工作中,可应用生态学研究来估计监测疾病的发展趋势,为制定疾病预防与控制的策略和措施提供依据。
总结
类型
生态比较研究
定义:是指观察不同人群或地区某种疾病的分布,然后根据疾病分布的差异提出病因假设
是生态学研究中应用较多的一种方法
其中最为简单的方法是:观察不同人群或地区某种疾病的分布,然后根据疾病分布的差异提出病因假设。
一般情况下,这种研究不需要暴露情况的资料,也不需要复杂的资料分析方法。如描述胃癌在全国各地区的分布,发现沿海地区的胃癌死亡率较其他地区高,从而提出沿海地区环境或饮食结构等可能是胃癌的危险因素之一。
常用:比较在不同人群中某因素的平均暴露水平和某疾病频率之间的关系。即比较不同暴露水平的人群中疾病的发病率或死亡率的差别。了解这些人群中暴露因素的频率或水平,并与疾病的发病率或死亡率作对比分析,从而为病因探索提供线索。
环境流行病学研究中常采用生态比较研究的方法
此法也可应用于评价社会设施,人群干预以及在政策、法令的实施等方面的效果
生态趋势研究
定义:连续观察人群中某因素平均暴露水平的改变与某种疾病的发病率、死亡率变化的关系,了解其变动趋势,通过比较暴露水平变化前后疾病频率的变化情况,来判断某因素与疾病的联系。
由于在生态学研究中一般可获得疾病的发病率,故在生态学研究资料分析中也可引入相对危险度(RR)、人群归因危险度(PAR)等评价指标来进行分析。
来源
地理信息系统的应用
大数据的应用
优缺点
优点
1、生态学研究常可应用常规资料或现成资料(如数据库)来进行研究。因而节省时间、人力和物力,且可以较快得到结果。
2、生态学研究对病因未明的疾病可提供病因线索供深入研究。这是生态学研究最显著的特点
3、对于个体的暴露剂量无法测量的情况,生态学研究是唯一可供选择的研究方法
4、当研究的暴露因素在一个人群中变异范围很小时,很难测量其与疾病的关系。这种情况下更适宜采用多个人群比较的生态学研究。如研究饮食结构与若干癌症的关系研究等。
5、生态学研究适用于对人群干预措施的评价。例如通过综合方式(如健康教育与健康促进等)减少人群对于危险因素的暴露,对此干预措施的评价只需在人群水平上进行
在疾病监测工作中,应用生态趋势研究可估计某种疾病发展的趋势。
缺点
生态学谬误
混在因素往往难以控制
存在多重共线性问题
难以确定两变量之间的因果联系
生态学谬误
在生态学研究中,生态学谬误是此类研究最主要的缺点
原因:他是由于生态学研究以各个不同情况的“个体”集合而成的“群体"(群组)为观察和分析的单位,以及存在的混杂因素等原因而造成研究结果与真实情况不符。
生态学研究提示的病因线索既可能是疾病(或其他卫生事件)与某因素之间真实的联系,也可能是由个体到群体观察后所造成的一种虚假联系,反之亦然。
产生原因
1、缺乏暴露与结局联合分布的资料。研究者只知道每个研究人群内的暴露和非暴露人群量,发生研究结果和未发生数,但不知暴露、非暴露人群中各有多少个体发生了研究结局,即无法在个体水平确定暴露与研究结局联合分布的信息
2、无法控制可疑的混杂因素。由于它是在群体水平上进行观察分析的研究,因此无法对个体水平上混杂因素的分布不均进行控制。
3、相关资料中的暴露水平只是近似值或平均水平,并不是个体的真实暴露情况,无法精确评价暴露与连疾病的关系,造成对暴露与研究结局之间关系的一种曲解。
现况研究的设计与实施
明确研究的目的
了解健康状况分布or开展群体健康调查
明确研究的类型
普查or 抽样
确定研究对象
儿童/就诊个体/特殊人群
确定样本含量和抽样方法
样本量
决定因素
预期患病率(p)
对调查结果精确性的要求:即容许误差(d)越大,所需的样本量越小
要求的显著性水平(α):α值越小,即显著性水平要求越高,样本量要求越大
计数资料的计算
(一般的,在做某病的现患率调查时,样本量可用该式估计)
(经转换,可得该式)
(q=1-p)
以上样本量估计公式仅适用于n×p>5的情况,如果n×p≤5则宜用Poisson分布的办法来估算样本量
计量资料的计算
如抽样调查的分析指标为计量资料,则应按计量资料的样本估计公式来计算(s为总体标准差的估计值)
计算题只要求记住:N=400✖️q/p(p=预期患病率)
适用条件:a=0.05时,d=0.1p,Z=1.96=2时
抽样方法
非随机抽样
eg.典型调查
典型抽样仅能反映调查地区/人群的情况,难以推广
随机抽样
随机抽样的样本获得须遵循随机化原则,即保证总体中每个对象都有已知的、非零的概率被选为研究对象。以保证样本的代表性
若样本量足够大,调查数据可靠,分析正确。则可以把调查结果推论到总体
资料收集
确定拟收集资料的内容
个人的基本情况:年龄,出生日期,性别,民族,文化程度,婚姻状况,家庭人口数及结构组成、家庭经济状况等
职业情况:具体工作性质,种类,职务,从事该工作的年限,与职业有关的特殊情况等。
生活习惯及保健情况:饮食情况,吸烟史及量,饮酒史及量,个人对自我保健的重视程度及开展情况,医疗保健条件,体育锻炼情况等
妇女生育情况:月经史,生育史,使用避孕药物及激素的情况等。
环境资料:生活环境和工作环境的某些数据,最好用客观的、数量化的指标表示。
人口学资料
调查员培训
资料的收集方法
三种
1、通过实验室测定或检查的方法来获得
2、制调查表后对研究对象进行调查,进而获得暴露或疾病的资料
3、利用常规资料
具体
常规登记和报告:利用疾病报告登记,体检记录,医疗记录或其它现有有关记录的资料
专题询问调查与信函调查:根据调查目的和疾病种类制定调查表。调查中应注意调查对象的“无应答率”,一般不得超过30%,否则样本的代表性差,可能影响结果的真实性。
临床检查及其他特殊检查的有关资料:收集各种医学检查数据和为特殊目的进行的检查。
数据整理与分析
1、仔细检查这些原始资料的完整性或准确性,对原始资料进行检查与核对,并进行逻辑检错,以提高原始资料的正确性。
2、按照卫生统计学和流行病学的专业需要,进行原始资料的整理。如:划分组别、制定整理表和统计表等
3、对于连续变量的数据,了解数据的分布类型;非正态分布的数据,进行适当的数据转换,以求转换后数据呈正态或近似正态分布。如果数据人称非正态分布,可以考虑将数据转换成分类变量进行统计分析,或者用非参数统计分析方法
4、计算各种率,常用现患率、阳性率、检出率等,定量资料还可以计算平均数等
5、计算标化率,即分析结果时,为了便于不同地区的比较,常采用率的标准化方法。
6、应用流行病学的原理与方法,采用分类、分析、综合、比较和各种归纳推理方法,通过单因素分析和多因素分析的技术来研究分析疾病或健康状况的规律性。
两种思路
以是否暴露为分组依据进行比较分析研究
以是否患病为分组依据来进行比较分析研究
知识陷阱
普查和抽样调查的优缺点
现况研究的偏倚与控制
随机抽样方法
现况研究与生态学研究的优缺点
第四章 队列研究
队列研究的概念、原理、目的、类型
概念
队列研究:是将人群按是否暴露于某可疑因素及其暴露程度分为不同组,追踪其各组的结果,比较不同组之间结局频率的差异,从而判定暴露因素与结局之间有无因果关系联及关联大小的一种观察性研究方法
暴露:研究对象接触过某种待研究的物质(如重金属)或具有某种待研究的特征)如年龄,性别及遗传性状等)或行为(如吸烟)
队列分类
出生队列:某特定时期内出生的一组人群
暴露队列:具有某种共同暴露或特征的一组人群
固定队列:人群都在某一固定时间或一个短时期之内进入队列,之后对他们进行随访观察,直至观察期终止,不再加入新的成员
动态队列:在某队列确定之后,原有的队列成员可以不断退出,新的观察对象可以随时加入
危险因素、危险因子:泛指能引起某特定不良结局(如疾病)发生,或使其发生的概率增加的因子,包括个人行为、生活方式、环境和遗传等方面的因素。
基本原理
在一个特定人群中选择所需的研究对象,根据目前或过去某个时期是否暴露于某个待研究因素,或其不同的暴露水平,而将研究对象分成不同的组,如暴露组和非暴露组,高剂量暴露组和低剂量暴露组等,随访观察一段时间,检查并记录各组人群待研究的预期结果的发生情况,比较各组结局的发生率,从而评价和检验研究因素与结局的关系。
选择→分组→随访→检查并登记→比较结局的发生率→评价和检验因果
基本特点
属于观察法
队列研究中的暴露不是人为给予的,不是随机分配的,而是在研究之前以客观存在的不受研究者意志决定。
设立对照组
通常在研究设计阶段就设立对照组。当然也可以在资料分析阶段根据需要设置对照组,对照组与暴露组来自同一人群,也可以来自不同人群。
由“因”及“果”
符合时间顺序
检验暴露与结局的因果联系能力较强
研究目的
检验病因假设
一次队列研究可以只检验一种暴露与一种疾病之间的因果关联
或同时检验一种暴露与多种结局之间的关联
评价预防措施效果
当某些可能的预防措施不是人为给予的,而是研究对象的自发行为时,对这种预防措施的效果评价即可采用队列研究
比如大量的蔬菜摄入可预防肠癌的发生,戒烟可减少吸烟者发生肺癌的危险等。对蔬菜摄入多者和少者,戒烟者和未戒烟者进行随访研究,可评价这些暴露的预防效果,这种现象也被称为“人群自然实验”。
研究疾病的自然史
队列研究可以观察人群从暴露于某因素后,疾病逐渐发生、发展直至结局的全过程,包括亚临床阶段的变化与表现,从人群的角度研究疾病发生和发展的自然规律。
新药的上市后检测
在这列研究中,暴露是某新药的应用,研究结局多为各种不良反应。注意,这里的新药应用不是研究者选择性给予的,是暴露者自己选择的,用与不用是非随机的。
研究类型
前瞻性(即时性)队列研究
定义:研究对象的分组是根据研究对象现实的暴露状况而定的,此时研究的结局还没有出现,需要前瞻观察一段时间才能得到。
是队列研究的基本形式
优点:资料的偏倚较小,结果可信。
缺点:所需观察的人群样本很大,观察时间长,花费大
历史性队列研究
设计模式:研究对象的分组是根据研究开始时,研究者已掌握的有关研究对象在过去某个时点的暴露状况的历史材料作出的。研究开始时研究的结果已经出现,不需要前瞻性观察
历史性队列研究中,虽然研究是现在开始的,但研究对象是在过去某个时点进入队列的。暴露与结局的资料是过去积累的。暴露与结局虽然跨时较长,但资料收集及分析却可以在较短的时间内完成。
尽管搜集资料暴露与结局资料的方法是回顾性的。但究其性质而言,仍是从因到果的。
优点:省时,省力,出结果快
缺点:资料积累时未受到研究者的控制,所以内容上未必符合要求
双向性队列研究
设计模式:也称混合型队列研究,即在历史性队列研究的基础上,继续前瞻性观察一段时间,它是将前瞻性队列研究与历史性队列研究结合起来的一种设计模式,兼具两者的优点。
不同研究类型的选取原则
前瞻性队列研究
1、有明确的检验假设,检验的暴露因素必须找准。
2、所研究疾病的发病率或死亡率应较高,不应低于5‰。
3、应明确规定暴露因素的测量,并且应有把握获得观察人群的暴露资料
4、应明确规定结局变量,如发病或死亡,并且要有确定结局的简便而可靠的手段
5、应有把握获得足够的观察人群,并将其清楚的分成暴露组与非暴露组。
6、大部分观察人群应能被随访到研究结束,并取得完整可靠的资料。
7、应有足够的人力,财力,物力支持该项工作
历史性队列研究
上述的1~5项
考虑在过去某段时间内是否有足够数量的、完整可靠的、有关研究对象的暴露结局的历史记录或档案材料
双向性队列研究
当具备进行历史性队列研究的条件下,如果从暴露到现在的观察时间,还不能满足研究的要求,如结局事件还没有发生或没有完全发生,还需继续前瞻性观察一段时间时,选用双向性队列研究
研究设计与实施
确定研究因素
在描述性研究和病例对照研究的基础上确定
在研究中要考虑如何选择、定义和测量暴露因素
暴露因素需要考虑暴露水平、时间、方式
一般应对暴露因素进行定量,除了暴露水平以外,还应考虑暴露的时间,以估计累积暴露剂量
同时还要考虑暴露的方式,如间歇暴露或连续暴露、直接暴露或间接暴露、一次暴露或长期暴露等
暴露的量的应采用敏感,精确,简单和可靠的方法
要考虑主要暴露因素与可能影响结局的因素(混杂、人口学因素)
确定研究结局
结局变量(结果变量):是指随访观察中将出现的预期结果事件,也即研究者希望追踪观察的事件。
研究结局的确定应全面,具体,客观
结局变量的测定应给出明确、统一的标准,并在研究的全过程中严格遵守
考虑疾病的断标准时要注意一种疾病往往有多种表现,因此,妥善的解决方法是即按国际或国内统一的标准判断结局,又按自定标准判断,准确记录下其他可疑症状或现象供以后分析时参考。
队列研究的优点之一是一次可以同时收集到多种结局资料,以研究一因多果的关系,故在队列研究中,除确定主要研究结果外,还可考虑同时收集多种可能与暴露有关的结局,提高一次研究的效率。
确定研究现场与研究人群
研究现场
要求有足够数量的符合条件的研究对象
当地领导重视、群众理解和支持
当地的文化教育水平较高
医疗卫生条件较好,交通较便利
现场的代表性
研究人群
总体要求
从目标人群中抽出具有代表性的人
未患所研究疾病
分为非暴露人群和暴露人群
暴露人群的选择
职业人群
研究某种可疑的职业暴露因素与疾病或健康的关系时
由于职业人群有关暴露与疾病的历史记录往往较为全面,真实和可靠,故在历史性对列研究中,所选择的暴露人群常为职业人群。
特殊暴露人群
研究某些罕见的特殊暴露的唯一选择
比如选择原子弹爆炸的受害者,接受过放射线治疗的人,以研究射线与白血病的关系
由于对某些职业暴露和某些特殊暴露的危险多半不是一开始就认识到的,一旦认识到了,大多都采取了防护措施以减少暴露。所以一般不易或不允许进行前瞻性队列研究,而常使用历史性队列研究。
一般人群
某一区域范围内的全体人群,选择其中暴露于欲研究因素的人做暴露组
考虑两点
不打算观察特殊人群发病的情况,而着眼于一般人群及今后在一般人群中的防治,使研究结果具有普遍意义
所研究的因素和疾病都是一般人群中常见的,不必要选取特殊人群或没有特殊人群可寻,特别是在研究一般人群的生活习惯或环境因素时
有组织的人群团体
该类人群可看作一般人群的特殊形式,比如医学会会员、工会会员、机关、社会团体、学校或部队成员等
选择这样的人群的主要目的是利用他们的组织系统,便于有效的收集随访资料。
他们的职业和经历往往是相同的,可增加其可比性
对照人群的选择
基本要求:尽可能保证其与暴露组的可比性,即对照人群除未暴露于所研究的因素外,其他各种影响因素或人群特征,都应尽可能的与暴露组相同或相近。
常用形式
内对照
定义:先选择一组研究人群,将其中暴露于所研究因素的对象作为暴露组,其余非暴露者即为对照组。
选定的一群研究对象内既包含了暴露组,又包含了对照组。
当研究的暴露变量不是定性变量而是定量变量时,可按暴露剂量分成若干等级。如高剂量暴露可增加疾病危险性,则以最低暴露水平的人群为对照组。
优点:选取对照比较省事,并可以无误的从总体上了解。研究对象的发病率情况,并且可比性较好
外对照
定义:当选择职业人群或特殊暴露人群作为暴露人群时,往往不能从这些人群中选出对照,而常须在该人群之外去寻找对照组
比如以放射科医生为研究射线致病作用的暴露对象时,可以不接触射线或接触射线极少的五官科医生为外对照。
优点:随访观察时可免受暴露组的影响,即暴露组的“污染”
缺点:需要费力去另外组织一项人群工作
总人口对照
定义:这种对照可认为是外对照的一种,是利用整个地区的现成的发病或死亡统计资料,即以全人群为对照,而不是与暴露组平行地设立一个对照组进行调查
优点:对比资料容易得到
缺点
资料比较粗糙,往往不十分精确或缺乏欲比较的详细资料,可比性差。
对照中可能包含有暴露人群
适用·
总人群中暴露者的比例很小的情形
在用特殊暴露人群或职业人群做暴露组时,常采用总人口做对照
注意
当采用总人口做对照时,并不以暴露组和总人口的发病率直接做比较,而是采用标化比,即用暴露组的发病或死亡人数与总人口率算出的期望发病或死亡数字求标化比
详见第三章
在利用总人口做对照时,尽量应用与暴露人群在时间,地区及人群构成上相近的总人群为对照,以减少偏移
多重对照
=多种对照:同时用上述两种或两种以上的形式选择多组人群做对照,以减少只用一组一种对照所带来的偏倚,增强结果的可靠性
确定样本量
计算样本量时需要考虑的问题
暴露组与对照组的比例
对照≥暴露
一般来说,对照组的样本量不宜少于暴露组的样本量,通常是等量的
只有当暴露组样本不够时,为了达到统计学要求,可考虑增加对照组样本
失访率
适当扩大样本量
在计算样本量时,需要预先估计一下是否适当扩大样本量,防止在研究的最后阶段因失访导致样本量不足而影响结果的分析
假设失访率为10%,则可按计算出来的样本量再加10%作为实际样本量
影响样本量的因素
一般人群(对照人群)中所研究疾病的发病率(p0)
暴露组与对照组人群发病率之差(d)
d值越大,所需样本量越小。如果暴露组人群发病率p1不能获得,可设法取得其相对危险度(RR)的估计值,由p1=RR×p0求得
要求的显著性水平(α)
α越小,所需样本量越大
效力(1-β)
效力越大,样本量越大
样本量的计算
在暴露组与对照组样本量相等的情况下,可用下式计算出各组所需的样本量。
一般只要已知α、β、p0和RR四个基本数据即可算出
资料的收集与随访
基线资料的收集
内容:待研究的暴露因素的暴露状况,疾病与健康状况,年龄,性别,职业,文化,婚姻等个人状况,家庭环境个人生活习惯及家族疾病史等
暴露的资料+个体的其他信息
方法
查阅医院,工厂,单位及个人健康保险的记录或档案
访问研究对象或其他能够提供信息的人
对研究对象进行体格检查或实验室检查
环境调查与检测
随访
随访的对象与方法
所有被选定的研究对象,不论是暴露组或对照组,都应采用相同的方法,同等的进行随访,并坚持追踪到观察终止期。
随访观察的期限必须也一致
对失访者需要进行补访,未能追访到的,应尽量了解其原因,以便进行失访原因分析。
同时可比较失访者与继续观察者的基线资料,以估计可能导致的偏差
随访方法:对研究对象的直接面对面访问、电话访问,自填问卷,定期体检,环境与疾病的监测、医院医疗与工作单位的出勤记录的收集等。
随访内容
一般与基线资料内容一致,但随访收集的重点是结局变量,其具体项目视研究目的与研究设计而不同
有关暴露状况的资料也要不断收集,以便及时了解其变化
随访期间关于暴露和疾病结局有关的全部资料都需要收集
观察终点
定义:是指研究对象出现了预期的结果,达到了这个观察终点,就不再对该研究对象继续随访。
对观察终点的判断,应在设计中定出明确的标准规定,明确的判断方法,这种规定自始至终不能改变,即使是实际医疗工作中已有改变
发现终点的方法要敏感,可靠,简单,易被接受
观察终止时间
定义:是指整个研究工作截止的时间,也即预期可以得到结果的时间。
终止时间直接决定了观察期的长短,而观察期长短是以暴露因素作用于人体至产生疾病结局的时间,即潜伏期(或潜隐期)为依据的。
还应考虑所需观察的人年数。
随访间隔
观察时间较短,在观察终止时一次收集资料即可
观察时间较长,需多次随访,其间隔与次数将是研究结果的变化速度、研究的人力、物力等条件而定。
随访者
根据随访内容的不同,可以是普通的询问调查者,也可以是实验室的技术人员、临床医生等
随访调查员必须认真进行培训
研究者可以参加随访,但最好不是亲自参与,因为研究者随访易于带来主观的偏移
质量控制
调查员的选择
严谨的工作作风和科学态度,诚实可靠(基本品质)
一般应具有高中或大学毕业文化程度,并具有调查所需的专业知识
调查员的年龄,性别,种族,语言,社会经济地位等最好与研究对象相匹配,这样更具有亲和力。
调查员培训
将直接影响调查结果的真实性和可靠性
在资料收集前应对所有参加调查者进行严格的培训,掌握统一的方法和技巧,并要进行考核。
制定调查员手册
全部操作程序
注意事项
调查问卷的完整说明
监督
由另一名调查员做抽样重复调查
人工或用计算机及时进行数据检查或逻辑检错
定期观察每个调查员的工作
对不同调查员所收集的变量分布进行比较
对变量的时间趋势进行比较
在访谈时使用录音,或使用其他多媒体技术
注意将监督结果及时反馈给调查员
资料的整理与分析
分析前应的步骤
1、对资料进行审查,了解资料的正确性与完整性
2、对资料做描述性统计,描述研究对象的组成、人口学特征、随访时间及失访情况等,分析两组的可比性及资料的可靠性
3、如果为了质量控制做了抽样重复调查,则还需要比较重复调查的符合率
资料分析
资料整理模式
固定队列
动态队列
人时的计算
人时的概念:队列研究由于时间跨度较长,观察对象经常处于动态之中,队列内对象被观察的时间可能不一致,此时以人为单位计算率就不合理。到合理的方法是加入时间因素,引入人时的概念来描述观察对象的暴露经历,人时是观察人数与观察时间的乘积。
计算方法
1、以个人为单位计算人年(精确法)
即将每个人的精确的观察时间(精确到天)相加,最后折算成年
结果精确,但计算时资料处理麻烦
2、用近似法计算人年
适用
不知道每个队列成员进入与退出队列的具体时间(精确到天)
样本量很大,对人年计算的精确性要求不高时
近似法:用每年观察的平均人数(一般取相邻两年的年初人口的平均数或年中人口数)作为该年的观察人年数,然后将各年的观察人年数相加,即得到观察的总人年数
计算简单,但精确性较差
举例
在一项队列研究中,35~44岁这一年龄组的观察人数如下,计算其暴露人年数
暴露人年数=【(3000+3020)/2×1年】+【(3020+2980)/2×1年】=4010 人年
3、用寿命表法计算人年
利用简易寿命表方法计算人年
计算:这规定观察当年内进入队列的个人均作1/2人年计算,失访或出现终点结局的个人也做1/2人年计算。
该法计算简单,并有一定的精确度
率的计算
常用指标
累积发病率(CI)
适用条件:研究人群的数量较大且比较稳定
累积发病率反映的是特定时间内的发病风险
报告累计发病率时必须说明累计时间的长短,否则流行病学意义不明
发病密度(ID)
适用条件
观察的时间比较长,研究人口不稳定
研究对象进入队列的时间可能先后不一
在观察截止前,可能由于迁移、竞争性死亡或其他原因退出,造成各种失访
研究对象出现终点结局的时间不同等原因,可造成每个对象被观察的时间不一样
此时以总人数为单位计算发病率是不合理的,因为提前退出研究者若能坚持到随访期结束,仍有发病可能
带有瞬时频率性质
发病密度反映的是速率
标化比
适用条件:当研究对象数目较少,结局事件的发生率比较低时
标化比虽然是在特殊情况下用来代替率的指标,但实际上不是率,而是以全人口的发病(死亡)率作为对照组计算出来的比,流行病学意义与效应指标(RR)类似。
标化死亡比(SMR)
标化死亡比适用条件是结局事件的发生率低,样本量小,不宜直接计算率时,其意义是被研究人群死于某病的危险是标准人群的多少倍
最常用的指标为标化死亡比(SMR),这一指标在职业流行病学研究中常用
注意
不同标准率算得的SMR不可以相互比较
即使是根据统一标准人群死亡率计算的SMR,也只有在各队列的年龄构成相似时才可比
标化比例死亡比(SPMR)
适用:某单位的一年人口资料不能得到,而仅有死亡人数、原因、日期和年龄。
预期死亡数:全人口中某病因死亡占全部死亡的比例乘以某单位实际全部死亡数
两者的区别是预期死亡数的计算:标化死亡比中标准人口死亡率中的死亡率的分母是包括活着的人数的,所以预期死亡数=死亡率×人数(包括活着的);而标化比例死亡比的预期死亡数的比例的分布是只有死亡例数嗯,所以预期死亡数=比例×死亡总数
总结
显著性检验
队列研究多为抽样研究,当发现两组率有差别时,首先要考虑抽样误差的可能性,需要进行统计学显著性检验
1、U检验
适用:当研究样本量较大,p和1-p都不太小,如np和n(1-p)均大于5,样本率的频数分布近似服从正态分布。
Pc为合并样本量
查u界值表得P值
2、其他检验方法
直接概率法、二项分布检验,泊松分布检验
率比较低,样本较小时
四个表资料的卡方检验
率稍大,样本稍大时
检验或计分检验
对SMR和SPMR的检验
实质上是对所得结果值偏离1的检验
效应估计指标
队列研究的最大优点就在于它可以直接计算出研究对象的结局的发生率,直接评价暴露的效应
1、相对危险度(RR)
类型
危险度比
固定队列
是暴露组的危险度与对照组的危险度之比
测量指标是累积发病率
率比
动态队列
暴露组与对照组的发病密度之比
测量指标是发病密度
同一研究的危险度比和率比的数值是不一样的
RR流行病学意义
都是反映暴露与发病(死亡)关联强度最有用的指标。
表明暴露组发病或死亡的危险是对照组的多少倍
RR值越大,表明暴露的效应越大,暴露与结局关联的强度越大
RR与AR流行病学的意义不同
RR:暴露者发生相应疾病的危险是非暴露者的多少倍。病因学意义
AR:暴露人群与非暴露人群比较,所增加的疾病发生数量,如果消除该因素,可以减少这个数量的疾病发生。疾病预防与公共卫生学意义
RR的95%CI
算出的相对危险度是RR的一个点估计值,是一个样本值
应考虑到抽样误差的存在,所以需要计算其可信区间
常用方法
Woolf法
简单易行
建立在RR方差的基础上
lnRR的95%CI
RR的95%CI
取反自然对数
Miettinen法
2、归因危险度(AR)
=特特异危险度,危险度差(RD)、超额危险度
是暴露组发病率与对照组发病率相差的绝对值
流行病学意义
表示危险特异地归因于暴露因素的程度
RR与AR都是表示关联强度的重要指标
RR:说明暴露者发生相应疾病的危险是非暴露者的多少倍
病因学的意义
AR:暴露人群与非暴露人群相比,所增加的疾病发生数量,如果暴露因素消除,就可减少这个数量的疾病发生
疾病预防和公共卫生学上的意义
3、归因危险度百分比(AR%)
=病因分值(EF)
是指暴露人群中的发病或死亡归因于暴露的部分占全部发病或死亡的百分比
说明暴露人群中发生某疾病百分之多少可归因于该暴露
说明暴露的生物学效应,即暴露的致病作用有多大
4、人群归因危险度(PAR) 人群归因危险度百分比(PAR%)
定义
PAR=人群病因分值(PEF)
PAR:指总人群发病率中归因于暴露的部分
PAR%:PAR占总人群全部发病(或死亡)的百分比
计算公式
一定要记得谁减谁,这里没有Ie
It代表全人群的率
I0为非暴露组的率
Pe为人群中某种暴露者的比例
可以看出PAR%与相对危险度及人群中暴露者的比例的关系
流行病学意义
说明暴露对全人群的危害程度,以及消除这个因素后该人群中的发病率或死亡率可能降低的程度
说明在全人群某病的死亡中,有百分之几归因于该暴露
说明暴露对全人群的危害程度,以及消除这个因素后该人群中的发病率或死亡率可能降低的程度
5、剂量效应关系的分析
如果某种暴露存在剂量-效应关系,即暴露的计量越大,其效应越大,则该种暴露作为病因的可能性就越大
具体方法:先列出不同暴露水平下的发病率,然后以最低暴露水平组为对照,计算其他暴露各水平组的相对危险度和归因危险度,必要时,应对危险度(或率)的变化做趋势性检验
常见偏倚及控制
偏倚:=错误,是一种系统误差,队列研究在设计、实施和资料分析等各个环节都可能产生偏倚
类型
选择偏倚
定义:由于研究对象的选择不当,如缺乏代表性(暴露组不能代表暴露人群,对照组不能代表非暴露人群)和暴露组与对照组没有可比性等,而导致的研究结果偏离真实的情况。
常见情况
1、最初选定参加研究的对象中,有人拒绝参加
2、在进行历史性队列研究时,有些人的档案丢失了或记录不全
3、研究对象由志愿者组成,他们往往或是较健康的,或是有某种特殊倾向或习惯的
4、错误分类偏倚:早期病人在研究开始时未能发现的
区别错分偏倚
在抽样方法正确的基础上仍可能出现的偏倚
5、抽样方法不正确或执行不严格,则可能导致严重的选择偏倚
6、失访偏倚
失访:在一个长的随访期间,暴露组和对照组成员中总会有些人或对参加该研究不感兴趣,或因身体不适不便继续参加研究,或移居外地,或其他原因死亡等原因而退出研究
难以避免
失访偏倚:如果暴露组和对照组的是访人数相等,而且各组中失访者和未失访者的发病率相同,则可认为失访对研究结果没有大的影响,否则暴露与结局之间的关系可能因失访而被歪曲。
控制
难以精确估计,不能有效处理,重在预防
要有一个正确的抽样方法,尽可能遵循随机化的原则
严格按规定的标准选择对象
要尽量提高研究对象的应答率和依从性
在进行历史性队列研究时,要求目标人群的档案资料齐全,丢失或不选的记录必须在一定的限度之内,否则应谨慎选用
如果有志愿者参加或有选定的研究对象拒绝参加,则应了解他们的基本情况后,与正常选择参加的人群进行比较。如果两者之间在一些基本特征上没有差异,则可认为导致的选择偏倚可能很小
失访偏倚的补救
查询失访者是否已经死亡及其死亡的原因。如果失访者与未失访者所研究疾病的死亡率相同,则可推测他们之间的发病率也可能相近
比较失访者和未失访者基线调查时获得的某些特征的资料。两者的基线特征越相似,则出现不同疾病发病率的可能性越小
只是对失访者和未失访者间发病率差异的一种推测,而不是测量。最好的方法还是尽可能的减少失访,主要靠尽可能提高研究对象的依从性。
失访率>20%,研究的真实性值得怀疑
信息偏倚
定义
在获取暴露结局或其他信息时所出现的系统误差或偏差
=错分偏倚:如判断有病为无病,判断有暴露为无暴露等
非特异性错分:错分偏倚若以同样的程度发生于观察的各组,则结果只会影响诊断的准确性,而不太影响两组或多组之间的相对关系,他们的相对危险度一般会比实际情况更趋近于1.
特异性错分:错分偏移若发生于一组而不发生于另一组,或两组错分的程度不同,这结果可能比实际的相对危险度低或高
产生原因
使用的仪器不精确
测量方法不稳定
询问技巧不佳
检验技术不熟练
医生诊断水平不高
标准不明确
记录错误,甚至造假
控制
一旦产生,难以发现,难以估计和处理,重在预防
选择精确稳定的测量方法
调准仪器
严格实验操作规程
同等的对待每个研究对象
提高临床诊断技术
明确各项标准
严格按规定执行
认真做好调查员培训,提高询问调查技巧,统一标准,并进行有关责任心和诚信度的教育
估计信息偏倚:通过对一个随机样本进行重复的调查与检测,将两次检测的结果进行比较,以估计信息偏倚的可能与大小。
混杂偏倚
定义:由于某个第三变量的作用,致使研究因素与结果的联系被歪曲,这个第三变量就叫混杂变量或混杂因子
混杂因子一定是疾病的一个影响因素,又与所研究的因素有联系,他在暴露组与对照组的分布是不均衡的
性别、年龄是最常见的混杂因素
控制
在研究设计阶段
可对研究对象做某种限制(如某一年龄层、某性别),以获得同质的研究样本
在对照选择中可采用匹配的方法,以保证两组在一些重要变量上的可比性
在资料分析阶段
首先应根据混杂的判断标准来判断混杂存在的可能性,比较分层调整前后的两个效应测量值的大小以估计混杂作用的大小
有关混杂偏倚的处理一般可采用
分层分析
标准化
多因素分析
优缺点
优点
1、由于研究对象的暴露资料是在结局发生之前收集的,并且都是按照设计由研究者亲自观察得到的,所以资料完整可靠,信息偏倚相对较小
2、可以直接获得暴露组和对照组人群的发病或死亡率,可直接计算出RR和AR等反应疾病危险长度的指标,可以充分而直接的分析暴露的病因作用
3、由于病因发生在前,疾病发生在后,因果现象发生的时间顺序是合理的,加之偏倚较少,又可直接计算各项测量疾病危险强度的指标,故其检验病因假说的能力较强,一般可证实病因联系。
4、有助于了解人群疾病的自然史,有时还可能获得多种预期以外的疾病的结局资料,可分析一因与多种疾病的关系
缺点
1、不适于发病率很低的疾病的病因研究,因为在这种情况下需要的研究对象数量太大,前瞻性队列一般难以达到
2、由于随访时间较长,对象不易保持依从性,容易产生失访偏倚。
3、在随访过程中,未知变量引入人群(如环境的变化,其他干预措施的引入等),或人群中已知变量的变化(如原有吸烟者戒烟了)等都可此结局受到影响,使分析复杂化
4、研究耗费的人力、物力、财力和时间较多,其组织与后勤工作应相当艰巨
其他实践类型
1、基于一个综合队列的队列研究
多个队列研究的综合体
特点
在研究开始时没有明确特定的研究因素,没有分组,但收集了大量的可疑因素信息
最终分析时,研究者按照自己的兴趣,每次选择一个研究因素,按照基线调查时该研究因素的有无将对列人群分为暴露组和对照组,比较各组的结局发生率
是前瞻性的,是从因求果的,暴露也是自然发生的
适用
对某一类疾病进行综合病因研究,特别是当病因还不十分明确时,各种疾病可能有一些共同病因或复杂关系
研究多因多病的关系,能降低单个研究的成本,提高了研究效率,有效的克服了传统队内研究的某些局限性
2、基于大数据的队列研究
基本思路
1、先提出研究问题(如肥胖与高血压的关系)
2、从大数据中找出暴露组和对照组(如10年前血压正常有肥胖者为暴露组,同期血压和体重均正常者为对照组)
3、查阅两组人群目前的结局(血压信息)
4、分析暴露与局的关系
优点:我们将可以非常方便快速的开展我们感兴趣的任何的对立研究,而且完全克服了人力、物力、财力和时间的限制
知识陷阱
队列研究的优缺点
累计发病率与发病密度的区别
各类队列研究的对比
队列研究效应指标及其意义
第五章 病例对照研究
概述
基本原理
1、以当前已经确诊的患有某特定疾病的一组病人作为病例组,以不患有该病但具有可比性的一组个体作为对照组
2、通过询问、实验室检查或复查病史,收集研究对象既往对各种可能的危险因素的暴露史
3、测量并采用统计学检验,比较病例组与对照组各因素暴露比例的差异是否具有统计学意义
4、评估各种偏倚对研究结果的影响,并借助病因推断技术,判断某个或某些暴露因素是否为疾病的危险因素,从而达到探索和检验病因假说的目的。
5、是一种由果及因的分析性研究方法,是在疾病发生之后去追溯假定的病因因素的方法,可在一定程度上检验病因假说
基本特点
1、观察性研究
研究对象的暴露情况是自然存在而非人为控制的,故病例对照研究属于观察性研究
2、研究对象分为病例组和对照组
研究对象是按是否具有研究的结局分成病例组和对照组
3、由“果”溯“因”
病例对照研究是在结局发生之后追溯可能原因的方法
4、因果联系的论证强度相对较弱
病例对照研究不能观察到由因到果的发展过程,故因果联系的论证强度不及队列研究
研究类型
1、非匹配病例对照研究
=成组病例对照研究:在设计所规定的病例和对照人群中分别抽取一定数量的研究对象进行组间比较,对照的选择没有其他任何限定与规定
一般对照的数应等于或多于病例人数,但病例与对照的数量不需成严格的比例关系
这种方法叫匹配法更容易实施,但方法本身控制混杂因素的能力较弱,应在统计分析中予以弥补
2、匹配病例对照研究
要求选择的对照在某些因素或特征上与病例保持一致,目的是使匹配因素在病例组与对照组之间保持均衡,从而排除这些因素对结果的干扰
选择对照的方法详见本章第二节。
这种方法可增加分析时的统计学检验能力,提高研究效率
增加了选择对照的难度,并且资料整理与统计分析较麻烦
3、衍生的几种主要研究类型
巢式病例对照研究
队列研究+病例对照研究
基本设计方法
队列研究的基础上,在一定的观察期中
所研究疾病的新发病例累积到一定数量,则可将全部病例集中组成“病例组”
开始的研究节点
每一个病例发病当时,从同一队列的未发病者中,按一定匹配条件随机选择对照,集中组成对照组
抽取病例与对照的基线资料,并检测收集的生物学标本,按匹配病例对照研究的方法进行资料的统计分析
与传统的病例对照研究对比
病例-队列研究
队列研究+病例对照研究
基本设计方法
队列研究开始时,在队列中按一定比例随机抽样,选出一个有代表性的样本作为对照组
开始研究的节点
观察结束时,将队列中出现的所研究疾病的全部病例作为病例组,与上述随机抽取的对照组进行比较
二者的不同之处
1、前者的对照者与病例按个体匹配,而后者的对照是从基线纳入的全部队列人群中随机选取
2、前者不同的疾病结局的研究,对照组不同;后者的对照组可作为多种疾病结局的共用对照组
病例-病例研究
在病例对照研究中,有时选择合适的对照颇为不易,特别是在分子流行病学研究中,从无疾病的对照中去获取某种生物标本也会受到医学伦理方面的制约
如果对一种疾病的两个亚型进行对比研究,例如出血性脑卒中与缺血性脑卒中,可以不另外设对照组,而采取两个亚组的直接比较
由于比较的两组均为病例,故称为病例-病例研究,也称为单纯病例研究
适用
研究两组病因的差异部分,而其相同或近似的危险因素则将被掩盖或低估
研究遗传与环境因素之间的交互作用
病例交叉研究
定义:每个病例发病之前的一个或多个时间段,作为“对照”时间,疾病发生时的暴露情况和同一个个体“对照”时间段的暴露情况进行比较
优点:以自身为对照,个体不同时间点上的可比性较好
应用条件
整个时间里个体的暴露必须是变化的,而不是恒定的
暴露的诱导期和效应期都必须短暂,否则最近疾病发作可能是由遥远的过去的暴露造成
适用
对诱发因素的研究
研究暴露的瞬时效应,即暴露对发生急性事件的影响
用途
1、用于疾病病因或危险因素的研究
特别适合于研究某些潜伏期长及罕见的疾病
可以广泛探索病因或危险因素,也可在述说或探索性病例对照研究初步形成病因假说的基础上,检验某个或某几个病因假说
2、用于健康相关事件影响因素的研究
可采用病例对照研究方法对于健康相关的医学事件或公共卫生问题的影响因素进行研究,为制定相应的卫生决策提供依据
3、用于疾病预后因素的研究
用于筛选和评价影响疾病预后的因素
可以指导临床实践
4、用于临床疗效影响因素的研究
将发生和未发生某种临床疗效者分别作为病例组和对照组进行病例对照研究,可以分析不同疗效的影响因素
研究设计与实施
确定研究目的
是制定整个研究计划的核心和指导思想
明确研究类型
然后根据研究目的确定适宜的研究类型
广泛的探索疾病的危险因素
非匹配或频数匹配的病例对照研究方法
检验病因假设,尤其对于小样本研究,或者因为病例的年龄、性别等构成特殊,随机抽取的对照组,很难与病例组均衡可比时
个体匹配的病例对照研究
确定研究对象
对照的选择是病例对照研究成败的关键之一
1、病例的选择
病例的定义
病例应符合统一、明确的疾病诊断标准
尽量使用国际通用或国内统一的诊断标准,以便与他人的研究结果比较,并尽可能使用金标准
对于尚无明确诊断标准的疾病,可根据研究的需要制定标准,此时要注意均衡诊断标准的假阳性率及假阴性率,使诊断标准宽严适度
若研究者为了某个特殊的研究目的,可以对研究对象的某些特征做出规定或限制
病例的类型
病例的来源
2、对照的选择
选择对照的原则
对照必须是以与病例相同的诊断标准确认为不患所研究疾病的人
对照应该能够代表产生病例的源人群,即对照的暴露分布应该与病例源人群的暴露分布一致
对照的来源
同一个或多个医疗机构中诊断的其他疾病的病人
优点
易于选取,比较合作,且可利用档案资料
实际工作中经常采用
缺点
对照的暴露分布常常不同于病例的源人群
具有研究暴露的个体,更有可能生病来医院就诊,进而成为对照组;这就导致医院对照的暴露水平高于病例源人群的暴露水平
选择原则
因已知与所研究的暴露因素有关的病种入院的病人不能作为对照 (当研究吸烟与白血病之间的关联,当时用医院对照时,因心血管疾病,呼吸系统疾病等与吸烟有关的病种入院的病人不能作为对照,但是对于有心血管疾病或呼吸系统疾病史,但本次因为外伤入院者,仍为合格的对照。)
仅针对此次就诊的疾病而非疾病史
对照应有尽可能多的病种的病人组成,以避免因过多的代表某一类病人,而该病种恰与所研究疾病具有共同的危险因素,从而影响研究结果的真实性
社区人群或团体人群中非该病病例或健康人
优点:不易出现上述医院对照可能面临的选择偏倚问题
缺点:实施难度大,费用高,所选对照不易配合
病例的邻居或同一住宅区内的健康人或非该病病例
优点:有助于控制社会经济地位的混杂作用
适用:匹配设计
病例的配偶、同胞、亲戚、同学或同事等
优点:有助于排除某些环境或遗传因素对结果的影响
适用:匹配设计
在实际工作中可以选择多个对照,以弥补各自的不足
选择对照的方法
非匹配
选择对照时没有任何限制和要求
匹配
定义:要求对照在某些特征或因素上与病例保持一致,保证对照和病例具有可比性,以便对两组进行比较时排排除匹配因素的干扰
目的:提高研究效率,控制混杂因素的干扰
匹配注意事项
1、匹配因素必须是已知的混杂因素,或有充分的理由怀疑为混杂因素
2、疾病因果链上的中间变量不应匹配
3、对与可疑病因有关而与疾病无关的因素不应匹配
4、在一个研究中不应该选择很多的匹配因素,因为匹配变量越多,选择合格的对照就越困难
5、一般除性别,年龄之外,对其他因素是否进行匹配须持慎重态度,以防止匹配过度,徒增费用和难度
6、一定不能将研究者感兴趣的研究变量作为匹配因素,因为一旦病例与对照按照这些因素匹配,就使得病例与对照在这些变量方面一致,也就不能分析这些因素与疾病的关系了
匹配过度:把不起混杂作用的因素作为匹配变量,进行匹配,试图使对照组与病例组在多方面都一致,结果导致所研究的因素也趋于一致,结果反而降低了研究效率。
匹配的变量应当一致到什么程度,取决于变量的性质、必要性与可操作性
离散变量:可以完全匹配
连续变量:可以首先划分为若干组,再按组匹配
匹配的方式
频数匹配
对照组具有某种或某些因素或特征者所占的比例与病例组一致或相近
个体匹配
以对照与病例个体为单位进行匹配
1个病例可以匹配一个对照,这种情况叫配对
一般情况下,总样本量一定时,如果病例和对照的来源都较充足,病例与对照之比为1:1时的统计学效率最高
如果所研究的是罕见病或所能获得的合格病例很少,为了达到较满意的研究功效,可以增加匹配的对照数,即采用1:r匹配
超过1:4时工作量显著增大,实际应用时要权衡利弊
确定样本量
影响样本量的因素
研究因素在对照组或人群中的暴露率(P0)
研究因素与疾病关联强度的估计值,即比值比(OR)
希望达到的统计学检验角色的显著性水平(α)
希望达到的统计学检验假设的效能或称把握度(1-β)
基本
采取匹配设计,估计样本量时,还需要考虑病例和对照的比例
非匹配病例对照研究样本量估计
Z分别为α和1-β对应的标准正态分布临界值
P1和P0分别为病例组和对照组的暴露率
P1可根据P0与OR推算:
1:1匹配病例对照研究样本量估计
个体配对时,病例与对照暴露状态不一致的对子,对于所研究的问题才有意义
具体做法
先求病例与对照暴露状态不一致的对子述(m)
再按下式求需要调查的总对子数(M)
P0和P1分别代表源人群中对照组合病例组的估计暴露率
1:r匹配病例对照研究样本量估计
病例数与对照数不等时,病例对照研究所需的病例数(n),对照数为r×n
注意
以上样本含量估计只有相对意义,并非绝对精确的数值
样本量估计是有条件的,而这种条件在重复研究中不是一成不变的
实际研究中,往往需要同时探索,几个因素与所研究疾病的关系,而每个因素都有各自的OR和P0,因此,需要根据每个因素的参数估计所需要本量,然后选择最大的样本量,以便使所有的因素都能得到较高的检验效率
样本量越大,结果的精确度越好
但样本量过大,常会影响调查工作的质量,增加负担和费用
确定研究因素
应根据研究目的确定研究因素
暴露因素可以多种多样
可以是宏观因素,如社会经济地位、生活方式等
可以是微观的,如易感基因
来源
通过描述性研究不同地区和人群中进行的病例对照研究,临床观察或其他学科领域提出的研究线索,帮助确定研究因素
尽可能采取国际或国内统一的标准,对每项研究因素的暴露与否或暴露水平做出明确而具体的规定,以便交流和比较
评价暴露水平
暴露的数量
暴露持续时间长和(或)暴露的剂量大,发生某疾病的危险度会增高,因此累积的总暴露情况很重要,最好由适宜的变量加以评价
暴露持续时间
对于隐匿期长的发病过程,暴露的时间非常重要
除了包括与病因假设有关的暴露外,还需包括可能的混杂因素,以便在资料分析时排除其对结果的干扰
测量指标
尽量选用定量或半定量指标
也可按明确的标准进行定性测定
研究因素并不是越多越好,应以满足研究目的的需要为原则,即与研究目的的有关变量不可缺少,而且应当尽量细致和深入;反之,与研究目的无关的内容则不要列入
资料收集方法
主要靠询问调查对象并填写问卷,包括面访,信访,电话访问,网络调查,自填问卷等方式
有时需辅以查阅档案
有时需要现场观察和实际测量某些指标
收集资料是否准确可靠关系到研究结果和结论的真实性,因此无论什么方法,都应实行质量控制,对调查员进行培训,对调查工作要做好监督和检查,尽量减少调查和测量偏倚,以保证调查质量
特别注意,应采用可比的方法对病例和对照进行信息收集
要保证比较的不同组别之间信息应该具有相似的质量,即要求病例和对照搜集信息的方式、资料来源、暴露测量时间和标准应一致,资料的准确性要可比,以便减少偏倚
资料的整理与分析
中心内容
比较病例与对照中暴露的比例
并由此估计暴露与疾病之间是否有关联及其关联强度
也可进一步分析暴露与疾病的剂量反应关系等
可通过分层分析、多因素分析控制混杂偏倚对研究结果的影响
1、资料的整理
原始资料的全面检查与核实,确保资料尽可能完整和准确
对原始资料进行分组、归纳或编码后输入计算机,建立数据库
目前大多采用双录入的方法和录入后进行逻辑检错
2、资料的分析
描述性统计
一般特征描述
即对研究对象的一般特征,如年龄,性别,职业,居住地等及病例的临床分型等的分布频率进行描述
均衡性检验
比较病例组与对照组某些基本特征是否相似或齐同
目的是检验两组的可比性
推断性分析
非匹配设计资料的分析
整理表格
暴露与疾病关联性分析
检验病例组某因素的暴露率或暴露比例(a/a+c)与对照组(b/b+d)之间的差异是否具有统计学意义
两组暴露率差异的统计学检验可用四格表的卡方检验
当四格表中的一个格子的理论数≥1但<5,总例数>40时
关联强度分析
一般情况下,病例对照研究中,没有暴露组和非暴露组的观察人数不能计算发病率,因此不能直接计算RR,但可用比值比(OR)来近似估计RR
比值比:=比数比、优势比,为病例组与对照组两组暴露比例比
比值或比数是某事物发生的可能性与不发生的可能性之比
OR的计算
病例组的暴露比例
对照组的暴露比例
比值比
OR又称交叉乘积比
OR的含义
与RR相同,均指暴露者疾病的危险性是非暴露者的多少倍
OR>1,说明暴露与疾病成“正”关联,即暴露可增加疾病的危险性,暴露因素是疾病的危险因素
OR<1说明暴露与疾病成“负”关联,即暴露可降低疾病的危险性,暴露因素是保护因素
OR=1,表明暴露因素与疾病之间无统计学联系
计算OR的95%CI
Miettinen法
方法简单,较常用
式中一般不校正的卡方值
Woolf法
自然对数法,建立在方差的基础上
lnOR的方差为
当四个表中某一格的数值为0时,可在每个格的数值上各加0.5,再求他们的倒数之和
上述两种方法计算结果基本一致
估计归因危险度百分比(AR%)& 人群归因危险度百分比(PAR%)
前提条件
在病例对照研究中,一般不能获得发病率和RR
当所研究疾病的发病率很低(如<5%)时,OR≈RR,故可用OR来代替RR估计AR%
如果对照组的暴露率可以代表病例源人群的状况,则可用对照组的暴露率代表人群暴露率Pe
计算
1:1匹配资料的分析
表格整理
暴露与疾病关联分析
McNemar卡方检验
适用于较大样本
当(b+c)<40时
计算OR
计算Or 95%CI
仍用Miettinen法
式中一般不校正的卡方值
非匹配资料的分层分析
背景:病例对照研究中的混杂因素可以用匹配设计加以控制,但未被匹配的混杂因素,需要用分层分析的方法去识别,并估计和控制其作用。
基本思路
根据潜在混杂因素的有无或程度,将研究对象分为不同的层
在各层中比较病例组和对照组暴露因素的分布
分别计算各层的ORi,并进行齐性检验
如果齐性检验结果显示各层的OR值的差别没有统计学意义,说明各层资料是同质的,可计算总OR即Mantel-HaenszelOR(简称ORMH)
如果齐性检验结果显示各层的OR值的差别有统计学意义,提示各层资料不属于同质资料,不宜在计算合并OR值,而因进一步分析分层因素与暴露因素之间的交互作用
总步骤
判断是否存在混杂因素或某因素是否为混杂因素
1、在没有研究因素的层中,分析混杂因素与结局的关联强度,计算OR和卡方值
2、再分析在对照组(没有研究结局的层)中,分析混杂因素与研究因素的关联强度,计算OR和卡方值
3、判断可以混杂因素是否为研究因素与结局之间的中间环节
步骤
判断混杂因素是否引起了偏倚,即是否其混杂作用
混杂因素存在不一定会引起偏倚
分层分析的步骤
计算各层资料的OR
不考虑混杂因素时的OR
按混杂因素时的分层OR
各层的OR与不分层时的OR不相同,说明混杂因素齐了一定的混杂作用
按混杂因素分层后,进行齐性检验
常用Woolf齐性检验法
若各层无统计学意义,说明各层资料同质,可计算总卡方值和总OR
计算总卡方值
E(ai)为ai的期望值
Var为ai的方差
当四格表中某一格子的理论数小于5
计算ORMH及其95%
95%CI用Miettinen法
局限性
虽然能按照一个以上混杂因素分层进行分层分析,但当混杂因素很多时,分层较多,每层内研究样本可能会很少,不能满足统计分析的需要,故应用上受到一定限制
目前许多多因素分析模型,如多元线性回归和logistic回归等被广泛应用于病例对照研究的资料分析,以探讨多个因素与疾病间的关系以及控制混杂因素,操作简单,结果可靠
剂量反应关系的分析
背景
前述分析方法都是建立在2×2表的基础上,虽然可以同时调整几个混杂因素,每个混杂因素也可分为若干个水平,但暴露因素只分为两个水平
在病例对照研究中,如能够获得某些暴露因素不同暴露水平的资料(也称分级资料),可将不同暴露水平的资料由小到大或由大到小分成多个有序的暴露等级,不同暴露等级分别与无暴露或最低水平的暴露作比较,以分析这些暴露与疾病之间的剂量反应关系,增加因果关系推断的依据
分析暴露资料的分析方法
表格整理:R×C列联表
进行R×C列联表资料的卡方检验
计算各暴露水平的OR值
通常以不暴露或最低水平的暴露组为参照组,其余暴露水平各组分别与参照组进行比较,计算各组的OR值
若个OR值呈明显的剂量-反应关系,还需经卡方趋势检验来判明剂量反应关系是否有统计学意义
趋势检验
第i组暴露水平的xi=i,参照组为x0=0
研究功效
定义:也叫把握度,可以解释为拒绝无效假设的能力,是当无效假设不成立时,该假设被拒绝的概率
一般认为一项研究的功效应在80%以上
研究功效只是一个粗略的估计,计算的结果可供设计阶段参考
偏倚及其控制
选择偏倚
定义:一项病例对照研究所选择的研究对象只是源人群的一个样本,由于选入的研究对象与未选入者在某些特征上存在差异而引起的系统误差
入院率偏倚/伯克森偏倚
产生原因
在以医院为基础的病例对照研究中常发生这种偏倚,当选择医院病人作为病例和对照时,病例只是该医院或某些医院特定病例,而不是全体病人的随机样本,对照是医院某一部分病人,而不是全体目标人群的一个随机样本
由于医院的医疗条件、病人的居住地区及社会经济文化等多方面的影响,病人对医院以及医院对病人都有一定的选择性,特别是因为各种疾病的入院率不同,可导致病例组与对照组在某些特征上的系统误差
控制方法
尽可能在社区人群中选择病例和对照,保证较好的代表性
从根本上解决
如进行以医院为基础的病例对照研究,最好能在多个不同级别、不同种类的医院选择一定时期内连续观察的某种疾病的全部病例或其随机样本,在与病例相同的多个医院的多个科室,多病种的病人中选择对照
因已知与所研究的暴露因素有关的病种就诊的病人不宜作为对照,以避免或减少入院率偏倚
现患病例-新发病例偏倚/奈曼偏倚
产生原因
如果调查对象选自现患病例,即存活病例,特别是病程较长的现患病例得到的一些暴露信息可能只与存活有关,而未必与该病的发病有关,从而错误的估计这些因素的病因作用
某病的幸存者由于疾病而改变了原有的一些暴露特征(如生活习惯),当他们被调查时,容易将这些改变了的暴露特征当作疾病前的状况,从而导致这些因素与疾病的关联误差
控制方法
选择新发病例作为研究对象,可避免或减少此类偏倚
补充
在进行宫颈癌病因的病例对照研究时,哪一组病例最为理想?
一个地区肿瘤发病监测系统登记的所有宫颈癌患者(√)
肿瘤发病监测系统登记的患者代表性较好,不易产生选择偏倚;且发病系统登记的是筛检时查出的阳性病例,医院诊断的是已经浸润的宫颈癌患者,因此发病时间比较新,是比较合适的病例来源
一个地区多所医院新诊断的宫颈癌患者(×)
不如上者代表性好
检出症候偏倚/暴露偏倚
产生原因
某因素虽然不是所研究疾病的病因,但有该因素的个体容易出现某些症状和体征,并常因此而就医,从而提高了所研究疾病早期病例的检出率
如果病例对照研究中病例组包括了较多的这种早期病例,致使过高的估计了病例组的暴露程度而产生的系统误差,即为检出症候偏倚
控制方法
在医院中收集病例时,最好包括不同来源的早、中、晚期病人,以便减少这种偏倚
信息偏倚
定义:=观察偏倚、测量偏倚,是在收集整理信息过程中,由于测量暴露与结局的方法有缺陷造成的系统误差
回忆偏倚
定义:由于研究对象对暴露史或既往使回忆的准确性和完整性存在系统误差而引起的偏倚
病例对照研究中最常见的偏倚
产生有关因素
调查时间和事件发生时间的间隔长短
事件的重要性
调查者的构成
询问技术
控制方法
充分利用客观记录资料,问卷调查时重视提问方式,适当采取一些调查技巧
选择新发病例作为调查对象
调查偏倚
来源
调查者
调查对象
原因
病例与对照的调查环境与条件不同
调查者对病例与对照采取不同的询问方式
对暴露测量方法采用的仪器设备或试剂不统一、不准确
控制方法
做好调查员的培训,统一对病例和对照的提问方式和调查技术
尽可能使用量化或等级化的客观指标
由同一调查人调查病例和对照,调查环境尽量一致
调查员向被调查者讲清调查目的,尽量取得他们的信任与合作,以减少报告偏倚
使用的检查仪器啊、试剂应精良,统一,使用前应校准,并在使用过程中要经常进行检查,以减少测量偏倚
混杂偏倚
定义:当我们研究某个因素与某种疾病的关联时,由于某个既与疾病有关系,又与所研究的暴露因素有关系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系造成的偏倚
混杂因素是所研究疾病的独立危险或保护因素(√)
混杂因素一定不是所研究疾病的危险因素(×)
混杂因素必须与所研究因素有关(√)
混杂因素一定不是研究因素与研究疾病因果链上的中间变量(√)
混杂因素如果能造成混杂,必须在比较的人群组间分布不均(√)
控制方法
研究设计阶段
限制
匹配
随机化
资料分析阶段
分层分析
多因素分析
与队列研究优点和局限性的比较
第六章 实验流行病学
概述
医学科学研究的基本方法
观察:是在不干预、自然的情况下,认识自然现象的本来面目,描述现状,分析规律
实验:在研究者的控制下,对研究对象人为施加或去除某种因素,进一步观察研究对象发生的变化,由此评价这些人为措施效果
历史回顾
1、1917年英国的Topley首先提出“实验流行病学方法”
2、1747年——采用平行对照的实例——维生素C缺乏症研究(James Lind)
3、1799年——Haygarth意识到安慰剂效应问题
4、1863年——Gull首次证实安慰剂治疗在评估疾病自然进程和自发痊愈中的重要性
5、1923年——随机化概念由Fisher最早引入农业实验研究
定义
实验流行病学是指研究者根据研究目的,按照预先确定的研究方案,将研究对象随机分配到实验组和对照组,人为的施加或减少某种处理因素,然后追踪观察处理因素的作用结果,比较和分析两组人群的结局,从而判断处理因素的效果
原理示意图
目标人群
样本
随机分组
实验组 (干预措施)
结局事件发生
结局事件不发生
对照组 (对照措施)
结局事件发生
结局事件不发生
随访观察
基本特征
有人为机遇的干预措施,并强调随机分配
1、对它是前瞻性研究,即必须直接跟踪研究对象,这些对象虽不一定从同一天开始,但必须从同一个确定的起点开始跟踪
2、必须施加一种或多种干预处理,作为处理因素可以是预防某种疾病的疫苗、治疗某病的药物或干预的方法措施等
3、研究对象是来自一个总体的符合纳入排除标准并签署知情同意的人群,通过随机分配形成实验组和对照组,从而保证实验开始时,两组在有关各方面相当近似或可比,这样实验结果的组间差异才能归之于干预处理的效应
如果不能保证严格的随机分组,就属于类实验
用途
1、验证因果关系假设的能力强于分析性研究,可以作为确证因果关系的最终手段
(1)确证危险因素的病因作用
2、用于动物实验或去除有害因素的研究
3、用于评价疾病的防治效果
(3)在疾病治疗研究中可以评价单独一种药物、联合用药、手术或治疗方案的效果
实验流行病学可以评价治疗方案和预防措施效果的优劣,但不能及早治疗病人或预防和控制疾病
4、评价保健策略和政策实施的效果
(2)在疾病预防或保健研究中可以评价单一干预措施或综合干预措施
5、主要用于评价各种干预措施的效果
主要类型
1、临床试验
定义:随机对照试验或随机临床试验(RCT)的简称,强调以病人个体为单位进行实验分组和施加干预措施
通常用来对某种药物或治疗方法的效果进行检验和评价
原理示意图
研究对象 (病人)
随机分组
实验组 (干预组)
有效应
无效应
对照组
有效应
无效应
特点
1、以病人作为研究对象
2、研究多在医院进行
3、多为治疗性试验
4、研究对象应尽可能在基线特征方面一致
5、随机分配治疗措施,并尽可能做到分配方案隐藏,对分配的治疗不服从,应当测量其程度与原因。
6、可能采用盲法
7、如果对于所研究的疾病没有接受的疗法,可以应用安慰剂作为比较
典型例子——在新药的研制和开发中,临床试验可以分为四期
Ⅰ期:通过耐受性试验与药代动力学研究,以确定新药的安全有效剂量范围及药物在人体内的吸收、代谢和排除规律。通常在20~80个志愿者身上进行
Ⅱ期:在一小部分特定病例中,在有对照的情况下进行严密的随机盲法临床试验,以进一步确定此药的安全性与有效性,通常不超过200人
Ⅲ期:在更多数量的病例中进行,是随机化多中心临床试验,目的在于评价药物的安全性,有效性及最佳剂量,一般需要几百到几千人
上市前临床试验
观察对象样本有限
观察时间短、病种单一
多数情况下排除老人,孕妇和儿童
一些罕见的不良反应迟发反应和发生在某些特殊人群的不良反应难以发现
Ⅳ期(上市后监测):进一步观察疗效,监测副作用
实际使用的效果也需进一步研究
2、现场试验
定义
也叫人群预防试验,是以尚未患病的人作为研究对象。与临床试验一样,现场试验中接受处理或某种预防措施的基本单位是个体,而不是亚人群。
特点
1、研究对象通常为非病人
2、研究地点为社区,学校,工厂等现场
3、多为预防性试验
4、通常需要较多的研究对象
5、需要以个体为单位随机分配措施
6、对分配的措施的不依从应当测量其程度与原因
7、尽可能应用方法
与临床试验相比
1、需要较多的研究对象和较高的花费
多用于极常见和极严重的疾病的预防研究
2、疾病的结局很少发生时,在高危人群中研究更为有效
3、社区试验
定义
也到社区干预项目(CIP),是以人群作为整体进行试验观察,整体可以是一个社区或某一人群的各个亚人群,如某学校的班级,某工厂的车间或某城市的街道等
常用于对某种预防措施或方法进行考核或评价
特点
1、研究场所为社区
2、以社区人群或某类人群组/亚组为单位分配干预措施
3、常用于对某种预防措施或方法进行考核或评价
4、一般采用整群随机分配措施的方法,保证比较组之间应尽可能具有可比性
5、如果研究只包含两个社区,则要求干预社区与对照社区间基线特征有类似的分布
总结
类型
注意区分研究对象与研究单位
研究对象:人群,包括各型病人和健康人
研究单位:亦称个体或观察单位,指研究对象的单位组成,是科学研究中的最基本单位
特点对比
异同点对比
研究,设计与实施
一、明确研究问题
研究问题构建:应该根据PICO的框架进行
四个方面分别进行明确的定义
病人(Patient)或人群(Population)
干预(intervention)
对照(control)
结局(outcome)
详细的定义
病人
疾病的诊断标准
考虑年龄,性别,病程,既往史,治疗史等方面信息
干预和对照
治疗的强度,频率,途径等
结局
测量的方法和时间
二、确定试验现场
1、试验现场人口相对稳定,流动性小,并要有足够的数量
2、试验研究的疾病在该地区有较高而稳定的发病率,以期在试验结束时,能有足够的发病人数,达到有效的统计分析
3、评价疫苗的免疫学效果时,应选择近期内未发生该疾病的流行的地区
若该地区近期发生了疾病的流行,当地的人群可能已经获得了自身免疫,因此无法很好地评价疫苗的免疫学效果
4、试验地区有较好的医疗卫生条件,卫生防疫保健机构比较健全,登记报告制度较完善,医疗机构及诊断水平较好等
5、试验地区(单位)领导重视,群众愿意接受,有较好的协作配合的条件等
三、选择研究对象
1、选择对干预措施有效的人群
对某疫苗的预防效果评价
某病的易感人群(√)
病人或非易感者(×)
病例的选择
有统一、公认的诊断标准(√)
最好利用客观地诊断指标(√)
避免把未患病者选入而影响研究的真实性(√)
注意研究对象的代表性(√)
样本应具备总体的某些基本特征,如年龄、性别、疾病类型、病情轻重、有无合并症等
其比例要能代表总体
注意轻型病例固然能取得较好地药物治疗效果,但还有自然康复的趋向,且即使设立了严格的对照组,并得到阳性结果,也仅说明对轻型病人有效,还不能说明对各类病人都有效
2、选择预期发病率较高的人群
评价疫苗的预防效果——选择在疾病高发区人群中进行
药物疗效试验——选择高危人群
3、选择干预对其无害的人群
在新药临床试验时往往将老年人,儿童,孕妇除外,因为这些人对药物易产生不良反应
有胃出血者不应选作抗炎药物试验的研究对象
4、选择能将试验坚持到底的人群
如用一种新药治疗脑出血后肢体瘫痪的临床试验研究,常将伴有癌症者有严重肝肾功能异常者除外,因为这些人可能在研究尚未结束前起死亡或因病情严重而被迫停止试验
5、选择依从性好的人群
四、估计样本含量
1、影响样本量大小的主要因素
实验组和对照组结局事件指标的数值差异大小:差异越小,所需样本量越大
显著性水平(α)
把握度(1-β)
单侧检验或双侧检验
研究对象分组数量
2、试验样本大小的计算
(1)计数资料
如:发病率,感染率,死亡率,病死率,治愈率等
p1:对照组发生率
p2:实验组发生率
p-=(p1+p2)/2
Z(1-α/2):α水平相应的标准正态差
Zβ:1-β水平相应的标准正态差
N:计算所得一个组的样本大小
(2)计量资料
如身高体重,血压,血脂和胆固醇等
若按样本均数比较,当两组样本量相等时,可按下列公式计算样本大小
σ:估计的标准差
d:两组均数之差
适用于N≥30时
五、随机化分组与分组隐匿
目的:在实验研究中,随机化是一项极为重要的原则,即将研究对象随机分配到实验组和对照组,使每个研究对象都有同等的机会被分配到各组去,以平衡实验组和对照组各种已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚、
使干预组和非干预组具有可比性(√)
使研究对象有同等的机会进入干预组和非干预组(√)
解决混杂的问题(√)
操作简单(√)
能彻底控制选择偏倚(×)
任何一种偏倚都不能彻底控制和消除,随机抽样只是减少选择偏倚
1、随机化分组方法
分组随机,可以避免选择偏倚
简单随机分组
研究对象以个体为单位,用掷硬币(正反两面分别指定为实验组和对照组)、抽签、随机数字表等方法进行分组
区组随机分组
基本方法是将条件相近的一组受试对象(如年龄,性别,病情相近)作为一个区组,每一区组内的研究对象(通常为4~6例)数量相等,然后应用单纯随机分配方法将每个区组内的研究对象进行分组
适用
样本量小的研究
当研究对象人数较少,而影响实验结果的因素又较多,简单随机分组不易使两组具有较好的可比性时,可以采用区组随机化法进行分组
优点
在分组过程中,任何时刻治疗组与对照组病例数保持相对一致,并可根据试验要求设计不同的区组
分层随机分组
基本方法是按研究对象特征,既可能产生混杂作用的某些重要因素(如年龄,性别,病程,病情等)先进行分层,然后在每一层内进行简单随机分组,最后再合并成实验组和对照组
适用
简单随机分组,有时无法保证影响预后的重要因素在组间可比,这时就需要考虑分层随机分组
eg.某种疾病男性和女性的预后有较大差别,当评价一种干预措施的效果时,可以先按性别分层,再在各层内随机分组,从而保证两组在性别分布上完全一致
整群随机分组
按社区或团体分配,即以一个家庭,一个学校,一个医院,一个村庄或居民区等为单位随机分组
优点:这种方法比较方便,但必须保证两组资料的可比性
2、分组隐匿
是为了减少选择偏倚
偏倚来源
负责入组病人的研究者预先知道下一个(随机数字所对应的)病人的治疗方案时,研究者可能会根据下一个病人的特征和自己对不同治疗方案的好恶,人为地决定入选或排除病人
病人也会因此人为地决定是否参与研究
定义:为了防止征募病人的研究者和病人在分组前知道随机分组的方案,一种防止随机分组方案提前解密的方法,随机分组治疗方案的隐匿
采用分组隐匿的随机分组叫隐匿随机分组
方法
信封法
将每个分组方案装入一个不透光的信封,信封外写上编号,密封好交给研究者,待有对象进入研究后,将调查对象逐一编码,再打开相应编号的信封,按照信封中的分配方案进行分组,并采取相应的干预措施
重要性
没有分组隐匿的随机分组是有缺陷的,不能起到预防选择偏倚的作用
随机分组联合分组隐匿才是真正意义上的随机分组,否则随机分组很可能成为随意分组
随机分组的原则
(1)随机数字的分配必须在确定纳入一个病人后才能进行
(2)随机分配方案必须隐匿
(3)一个病人随机数字的分配必须一次完成,一旦确定绝对不能更改
(4)一个病人的分组时间应尽可能接近其治疗开始的时间
六、设立对照
设立对照的必要性(原因)
在研究干预措施的效果时,直接观察到的往往是多种因素的效应交织在一起的综合作用,合理的对照能够成功的将干预措施的真实效应客观地、充分地暴露或识别出来,使研究者有可能做出正确评价
1、不能预知的结局
大部分治疗决策所面对的临床结局都不那么容易预测
由于个体生物学差异的客观存在,往往导致同一种疾病在不同个体中表现出来的疾病特征不一致,也就是疾病的发生、发展和结局的自然史不一致
不同病型或病情的病人,对治疗的反应可能也不同
对于一些疾病自然史不清楚的疾病,其疗效也许是疾病发展的自然结果
2、向均数回归
这是临床上经常见到的一种现象,即一些极端的临床症状或体征,有向均数回归的现象
例如血压水平属于特别高的5%的人,即使不治疗,过一段时间再测量血压时,可能会降低一些
3、霍桑效应
在实验研究(干预研究)中,被研究者由于知道自己成为了特殊被关注的对象后,所出现的改变自己行为或状态的一种倾向,与他们接受的干预措施的特异性作用无关,是病人渴望取悦于他们的医师,使医师感到医疗活动是成功的
这是病人的一种心理、生理效应,对疗效产生正向效应的影响。当然,有时因厌恶某医生或不信任某医院也会产生负向效应
4、安慰剂效应
某些疾病病人由于依赖医药而表现的一种正向心理效应
当以主观症状的改善情况作为疗效评价指标时,其“效应”中可能包括有安慰剂效应在内
安慰剂:是一种无论在外观,颜色,味觉,嗅觉上均与积极治疗的药品无从辨别的物品,但没有特定已知的治疗成分
目前已知的安慰剂可使1/3的病人增强信心,潜心病情,减少不适症状(如术后疼痛,呕吐或瘙痒等),此一现象称为安慰剂效应
安慰剂效应对研究者与医师有不同的意义
研究者更有兴趣确定特异并符合现有病因理论的效果,他们以安慰剂效应为测量特定治疗效果的基值
临床医师会欢迎安慰剂效应,并愿意增强这一效果或任何有助于病人的方法
5、存在的未知因素的影响
对照类型
1、根据对照措施来区分
标准疗法对照(有效对照)
是临床试验中最常用的一种对照方式,任以常规或现行的最好疗法(药物或手术)做对照
适用于已知有确定疗效的治疗方法的疾病
安慰剂对照
在所研究的疾病尚无有效的治疗药物或使用安慰剂后,对研究对象的病情无影响时才使用
2、根据研究对象接受单一对照措施,还是交替接受干预和对照措施
平行对照
在实验过程中将研究对象随机分为A和B两组,分别给予干预措施和对照措施,中间不更换干预措施
交叉对照
在实验过程中将研究对象随机分为A和B两组,第一阶段A组人群给予干预措施,B组人群作为对照组,经一段时间的干预后,两组对换,B组接受干预措施,而A组成为对照组
优点
每个研究对象均兼做实验组和对照组成员,干预措施的效果可以汇总个体内的差异而得出
因为个体内的差异通常小于个体间的差异,因此要达到相同的精确度,交叉对照设计所需的样本量小于平行对照
缺点
前提:第一阶段的干预一定不能对第二阶段的干预效应有影响。这在许多试验中难以保证
由于每个对象要经历两段时期,需要的时间就比较长,反而易造成研究对象的退出,数据的分析也比较复杂
3、其他
自身对照
是指试验前后以同一人群做对比
如评价某预防规划实施效果,在试验前需要规定一个足够的观察期限,然后将预防规划实施前后人群的疾病和健康状况进行对比
历史对照
空白对照
非均衡对照
七、盲法的应用
目的:避免选择偏倚和信息偏倚
可以来自研究对象和研究者本人,可产生于设计阶段,也可来自于资料收集或分析阶段
分类
1、单盲:研究对象不知道自己是实验组还是对照组
2、双盲:研究对象和研究实施人员都不了解试验分组情况,而是由研究设计者来安排和控制全部试验
3、三盲:不但研究实施者和研究对象不了解分组情况,负责资料收集和分析的人员也不了解分组情况。
盲法的四个层次
1、负责分配病人到治疗组的人,不知道病人接受什么治疗,才不会依照自己的意愿而是按顺序将病人选入试验
2、病人本身不知道自己接受什么治疗,才不会改变自己的依从性或对症状的报告
3、在研究中照顾病人的医师不知道每个病人接受什么治疗,才不会对他们(可能潜意识地)作不同的处理。
4、研究实施者在评价结果时无法区别谁是治疗组,这样才不会影响测量
开放性试验
定义:未用盲法的试验,即研究对象和研究实施者均知道实验组和对照组的分组情况,试验公开进行
这多适用于有客观观察指标或难以实施盲法的临床试验
eg.外科手术、改变生活习惯的干预效果的观察
优点
易设计和实施,研究实施者了解分组情况,便于对研究对象及时作出处理
缺点
容易产生偏倚
八、确定结局变量及其测量方法
实验流行病学研究的效应是以结局变量来衡量的
主要结局
最好选择能够预测(疾病)临床结果的主要终点
eg.脑卒中临床试验的主要终点是致残率,死亡率
但主要终点的获得通常需要更长的观察时间,更大的样本量和更多的消耗,故会考虑一些替代/次要终点
1~2个
样本量的估计要以主要结局指标为主
次要结局
可以很多个
要包括安全性评价的指标
选择结局变量时还要规定测量的方法和判断的标准,否则将导致测量偏倚,造成结果的误差
九、确定试验观察期限
根据实验目的、干预时间和效应(结局事件)出现的周期等,规定研究对象开始观察,终止观察的日期
传染病观察期限较短,慢性病观察期限较长
原则上观察期限不宜过长,以能出现结果的最短时间为限
十、收集资料
实验流行病学研究作为前瞻性的研究,通常采用专门设计的病例报告表收集研究对象的基线、随访和结局资料
基线资料一般包括:对象的基本人口特征,结局指标的极限水平,其他可能影响研究结果的因素等
有了基线数据结果变量的评价相对比较容易; 调查开始和结束时,确定基线数据的方法必须相同,以便正确评价干预效果
如果现场试验或社区试验还应获得社区的支持,社区各方面领导的支持不但有利于所需监测系统的建立,还将有利于使用社区已有的相关系统为监测服务
监测系统必须有相对低的成本和较高的灵敏度
在实验流行病学研究中,对所有研究对象,不论是实验组和对照组都要同等的进行随访,并要求对所有研究对象都坚持随访到终止期,不可中途放弃或遗漏
随访间隔周期的长短和次数主要视干预时间、结局变量出现时间和变异情况而定
随访观察的内容
1、干预措施的执行状况
2、有关影响因素(预后影响因素)的信息
3、结局变量
随访资料的收集方法
1、访问研究对象或知情人
2、通过对研究对象体检或采样监测
3、到有关单位获取,多为档案、记录
4、对环境的调查
资料整理和分析
1、资料的整理
重要性
资料整理是资料分析的首要步骤
要根据研究目的和设计对研究资料的完整性,规范性和真实性进行核实,并进一步录入归类,使其系统化,条理化,便于进一步分析
要整理全部入组对象,尤其在随访分组后未完成试验者的资料
研究对象在随机分组前或后离开试验所带来的影响是不同的
(1)排除
随机分组前
定义
是指在随机分组前,研究对象因各种原因没有被纳入
产生的影响
排除对研究结果的内部真实性不会产生影响
可能影响研究结果的外推性,被排除的研究对象越多,结果推广的面越小
评估潜在的受试者到真正随机分组研究对象的过程中,被排除者及其排除原因的资料需要整理
试运行期
定义:在随机分组之前,通过短期的试验了解研究对象的合作、依从、不能耐受的不良反应等情况,从而排除不符合标准或可能无法坚持试验的研究对象
情况
对干预措施有禁忌者
无法追踪者
可能失访者
拒绝参加试验者
加入排除者后很可能低估或掩盖真实的疗效,所以在未应用试运行期方法的RCT中,即使阴性结果也应引起人们高度重视
(2)退出
随机分配后
定义
指研究对象在随机分配后,从实验组和对照组退出
产生影响
造成原定的样本量不足,使研究功效或(把握度)降低
容易产生选择偏倚
原因
1、不合格的研究对象
在资料整理时,一般要把不合格的研究对象剔除
不符合纳入标准者
一次也没有接受干预措施或没有任何数据者
注意
在试验研究时,研究者对试验组往往观察仔细,因此试验组中的不合格者比较容易发现,结果造成因不合格而非剔除的人数多于对照组
研究者对某些研究对象的反应的观察与判断可能有倾向性
eg.如对效果差着可能特别注意,造成更易于从中发现其不符合标准并将其剔除,而留在组内的往往是效果较好的研究对象,由此而得出的结论往往比实际的效果要好
分亚组分析
为了防止因对研究对象的剔除造成偏倚,有的学者主张在随机分配后发现不符合标准者,可根据入选标准将研究对象分为“合格者”和“不合格者”两个亚组分别进行分析,如果两者结果不一致,则在下结论时应谨慎
意向性分析(ITT):对“不合格者”保留在原组分析
2、不依从的研究对象
是指研究对象在随机分组后不遵守试验所规定的要求
实验组成员不遵守干预规程,相当于退出或脱落实验组
对照组成员不遵守对照规程而私下接受干预规程,相当于加入实验组
原因
1、试验或对照措施有副作用
2、研究对象对试验不感兴趣
3、研究对象的情况发生改变,如病情加重
解决方法
对研究对象要进行宣传教育,讲清试验目的、意义和依从性的重要性
要注意设计的合理性,试验期限不宜过长
要简化干预措施等,以便取得研究对象的支持和合作
对不依从者不能剔除,应采用意向性分析
还要调查不依从的原因与进程,并详细记录
不依从率的高低与不依从的原因应当是资料分析的重要内容之一
3、失访
定义
这个研究对象应因迁移与本病无关的其他疾病,死亡等而造成失访
一般要求失访率不超过10%
在试验中出现失访时,尽量用电话、通信或专门访视进行调查
调查失访的原因,详细记录失访发生的时间,资料分析时需对失访者的特征进行分析,还可采用生存分析的方法,充分利用资料
2、资料的分析
分析方法
1、意向性分析(ITT)
①+② vs ③+④
指所有病人被随机分入RCT中的任意一组,不管他们是否完成试验或者是否真正接受了该组治疗,都保留在原组进行结果分析
目的:在于避免选择偏倚,并使各治疗组之间保持可比性
在ITT中,随机化不仅决定治疗的分配,而且决定病人数据的分析
ITT是最有效的方法
应用及局限性
RCT的两个基本目标是获得试验的效力和效果
试验的效力反应的是在一种理想状态下的治疗效果西,即参加试验者真正接受并完成了该种治疗
试验的效果是指在一般的临床状态下治疗的实际效果,参加者可能会不依从改变治疗方法或间断治疗等
ITT分析评价的就是这种结果,是给予某种治疗方式后病人的实际结局
ITT分析反映了两种治疗实际临床应用后的效果,包括病人在试验过程中的各种转归。但在评价治疗方法的真正疗效方面,如果试验方案确实有效,应用ITT分析会低估该试验的治疗效果
对于试验的效力来说,如果试验中失访、不依从的况很少,或者各组之间失访和不依从是均衡的,那么ITT分析可以得到效力的有效信息
因此在评价试验的效力时,建议同时使用上述三种分析,以获得更全面的信息,以使RCT结果的解释更为合理
2、效力分析
② vs ③
依从者分析、解释性试验或生物效力试验
依从者分析只是对试验依从的人进行分析,并未完全遵循最初的随机分组
这种不依从在两组间是不均衡的
因此依从者分析,会高估手术治疗的效果
3、接受治疗分析
①+③ vs ②+④
接受治疗分析也会高估了手术治疗的效果
统计分析数据集
(1)FAS集
基于意向性原则,全部随机化(对于单组研究则是筛选合格)的受试者都应纳入分析,称作全分析集
=将该集合的人群称为ITT人群
FAS集是从所有随机化的受试者中,以最少的和合理的法剔除受试者后得出的
(2)PPS集
基于符合方案原则,全部随机化的受试者中,完全按照方案设计进行研究的那一部分才纳入分析,称为符合方案集
一般研究中把没有重要违背方案的受试者都认为是符合方案
(3)SAS集
对于安全性分析,不使用意向性原则和符合方案原则,而是暴露原则,即所有至少使用过一次研究药物的受试者,都必须观察安全性指标,由此形成安全性分析集
选择病例
随机分配
治疗A组
未能完成A或转向B组 ①
完成治疗A ②
治疗B组
完成治疗B ③
未能完成B或转向A组 ④
3、评价指标
评价指标的选择基本原则
1、不但用定性指标,并尽可能用客观的定量指标
2、测定方法有较高的真实性(效度)和可靠性(信度)
3、要易于观察和测量,且易为受试者所接受
1、评价治疗措施效果的主要指标
有效率
治愈率
N年生存率
这是直接法计算生存率的公式,当观察期较长,观察对象加入观察的时间不一致时,观察期间因其他原因死亡或失访,为了充分合理利用研究的资料信息,可用寿命表法进行分析
2、评价预防措施效果的主要指标
保护率(PR)
P1、P2:对照组、实验组的发病率
Q1、Q2:对照组、实验组的未发病率
n1、n2:对照组、实验组人数
效果指数(IE)
需治疗人数(NNT)
定义:是为预防1例不良事件发生临床医师在一段时间内应用某一疗法需治疗的病人数,从数学关系式上讲,NNT等于绝对危险度的倒数
优点
直观易懂,操作方便
可指导个体病人的临床决策
危险度评价指标
EER:治疗组事件发生率 CER:对照组事件发生率
与其他治疗的比较
实验流行病学研究的优缺点
优点
1、研究者根据试验目的,预先制定试验设计,能够对选择的研究对象、干预因素和结果的分析判断进行标准化
2、按照随机化的方法,将研究对象分为实验组和对照组,做到了各组具有相似的基本特征,提高了可比性,减少了混杂偏倚
3、试验为前瞻性研究,在整个试验过程中,通过随访将每个研究对象的反映结局自始至终观察到底,实验组和对照组同步进行比较,最终能做出肯定性的结论
缺点
1、整个实验设计和实验条件要求高,控制严,难度较大,在实际工作中有时难以做到
2、受干预措施适用范围的约束,所选择的研究对象代表性不够,以致会不同程度的影响试验结果推论到总体
3、研究人群数量较大,试验计划实施要求严格,随访时间长,因此依从性不易做得很好,影响试验效应的评价
实验流行病学应注意的问题
1、类实验
一个完全的实验流行病学必须具备随机、对照、干预、前瞻4个基本特征,如果一项实验研究缺少其中一个或几个特征,这种实验就叫类实验或自然实验
分类
根据类实验是否设立对照组可分
(1)不是平行对照组
1)自身前后对照:同一受试者在接受干预措施前后比较
2)与已知的不给该项干预措施的结果比较
(2)设立对照组
虽然设立了平行对照组,但研究对象的分组不是随机的
如在社区试验中,并不是总能获得随机对照的,如果只能对整个居民区人群实施预防,随机分组就不可能进行,可选择具有可比性的另一个社区人群作为对照组
类实验常用于研究对象数量大,范围广,而实际情况不允许对研究对象做随机分组的情况
2、伦理道德问题
开始人群试验前,必要时应先做动物实验,初步验证此项实验方法合理,效果良好,无危害性
特别是设立对照时,必须以不损害受试者身心健康为前提
知情同意
3、预实验
在正式试验前,应先在小范围做一次少量人群的预实验
目的:检验实验设计的科学性和可行性,以免由于设计不周,盲目开展试验而造成人力、物力和财力的浪费
预实验必须像正式实验一样的认真进行具有科学的意义,如果随便选择一个地方或者人群做预实验,不具备实验设计方案中的基本条件是不可行的
只有在避免了各种主观因素干扰,经过认真的预实验后,如果取得成功,才能按设计方案进行正式的大规模试验
4、研究注册问题
5、结果报告的完整透明问题
第七章 筛检
属于观察法
概述
背景
根据疾病自然史,大致可将疾病的进展分为易感期,临床前期,临床期和结局四个阶段
随着医学技术的发展,人们已经可以在某些疾病的临床前期或早期,通过适当的检测技术,将机体出现的一些异常特征(如肿瘤的早期标记物,血压升高、血脂升高等)及早检测出来,并采取适当治疗,最终可以明显提高疾病的治愈率和病人的生存质量,降低人群死亡风险
人们提出在表面健康的人群中开展筛查,这也是抗击慢性疾病,保障人群健康的重要公共卫生措施
研究对象:表面健康的人群
筛检的概念
是针对临床前期或早期的疾病阶段,运用快速、简便的试验、检查或其他方法,将未察觉或未诊断疾病的人群中的那些可能有病或缺陷、但表面健康的个体同那些可能无病者鉴别开来的一系列医疗卫生服务措施
筛检流程图
筛检一般是由国家或地区政府主导,动员全社会参与的系统工程,又称为“三早”预防,包括对目标疾病的早期发现、早期诊断、对各阶段阳性者的处理(早期治疗)及阴性者医学随访的一系列医疗和卫生服务实践活动
筛检的目的及类型
目的
1、发现隐匿的病例
在表面健康的人群中筛检出可能患有某病的个体,并进一步进行确诊和早期治疗,实现二级预防
2、发现高危人群
通过筛检发现人群中某些疾病的高危个体,并从病因学的角度采取措施,以减少疾病的发生,降低疾病的发病率,达到一级预防的目的
3、了解疾病的自然史,解释疾病的“冰山现象”
确定筛查的起始年龄,筛查间隔,筛检及治疗方案有重要意义
4、指导合理分配有限的卫生资源
如利用高危评分的方法,筛检出孕妇中的高危产妇,将其安排到条件较好的县市级医院分娩,而危险性较低的产妇,则留在当地乡卫生院或村卫生室分娩,以降低产妇死亡率
类型
筛检的实施原则
一项筛检计划应包括
1、选择筛查疾病的依据
2、明确的目标人群
3、合理的筛查程序
包括起始筛查年龄、筛查间隔、不同阶段的筛查试验和确诊试验
4、干预和随访方案
4个原则
1、筛检的疾病
(1)所筛检疾病或相关健康状态应是该地区现阶段的重大公共卫生问题,能够对人群健康和生命造成严重危害,对现患率或死亡率较高,是人群的主要是死因之一
(2)目标疾病的自然史清晰,有足够长的临床前期和可被识别的疾病标志,有早诊断的方法,且早期干预能显著降低死亡率
(3)对疾病不同阶段的干预效果及其不良反应有清晰的认识
2、筛检试验
选择合适的筛检试验是整个筛查程序设计的关键部分
选择原则
筛检试验应准确,简单,经济,安全,且容易被受检者接受
应有符合不同经济发展和卫生资源水平的筛检方法可供选择
3、疾病治疗
对筛查出的不同阶段结局均有行之有效的干预方案,且确保早期治疗的效果应优于晚期治疗
4、筛检项目实施计划及评价
目标人群是否明确
筛查-治疗程序是否有效
是否有卫生经济学价值
否符合公平性,可及性以及伦理学原则
人群获益是否超过伤害
对筛查的质控,经费保障及项目风险应对机制等方面进行评估
筛检试验评价
筛检试验
定义
用于识别外表健康的人群中那些可能患病个体或具有患病风险个体的方法
形式
1、可以是问卷,体格检查,内镜与X线的物理学检查
2、可以是细胞学或生物大分子标志物检测技术
特点
基本特点:良好的真实性,可靠性和预测度
简单性:易学习、易操作,即使是非专业人员经过适当的培训也会操作
廉价性:原则上在健康收益一定的情况下,筛检试验的费用越低越好
快速性:很快得到结果
安全性:不会给受试者带来创伤,原则上初筛方法不宜采用可能成创伤的检查手段
可接受性:易于被目标人群接受
筛检试验与诊断试验的区别
筛检试验的评价方法及指标
(一)真实性
效度、准确性
1、研究设计
真实性评价采用“对比”研究的思路,比较筛检试验与疾病的标准方法,判断结果的一致程度
两类
以医院为研究现场的病例-非病例(对照)设计
先用“金标准”确定某病的患病和非患病人群
随机选择病例组和非病例组,再用待评价的筛检试验盲法检测两组对象
以社区为研究现场的横断面设计
抽取一个目标人群的代表性样本
同时用金标准和筛检试验盲法检测所有研究对象
事后根据金标准检测判断病例组和非病例组
优缺点对比
病例-非病例方法的设计要点
1、确定金标准
“金标准”是指当前临床医学界公认的诊断疾病的最准确可靠的方法
目的:准确区分受试对象是否为某病病人
最佳的金标准有
病理诊断
活检
手术发现
微生物培养
尸检或特殊检查
由于筛检对象(尤其是非病例组)包括健康人,难以对所有对象进行上述检查,因此金标准也可以选择准确性较高的影像诊断、临床综合判断、结合短时间内重复或随访,尽量减少确诊方法的误诊和漏诊
2、选择研究对象
受试对象
应能代表筛检试验可能应用的人群
尽量满足随机化抽样原则
筛检目的:发现临床前期或早期的病人
病例选择应包括
早期病症轻微的病例
考虑疾病的各种临床类型(不同病情程度、不同病程、典型和不典型、有无并发症、是否治疗过)
非病例组
金标准证实未患有目标疾病者
包括非病人和(或)与目标疾病易产生混淆的疾病病人
3、样本量计算
相关参数
(1)筛检试验的灵敏度
(2)筛检试验的特异度
(3)显著性水平α
(4)容许误差δ
近似公式
当灵敏度和特异度在20%~80%区间变化时
δ为容许误差,一般定在0.05~0.01
p为待评价的筛检方法的灵敏度或特异度
灵敏度用于估计病例组的样本量
特异度用于估计非病例组的样本量
样本率的分布呈偏态,需要对率的平方根作反正弦转换,再代入下式
当灵敏度或特异度小于20%或大于80%时
4、确定筛查结局分类标准或截断值
筛检试验结果需明确的、有明显区分度的阳性和阴性判断标准
分类或等级指标
根据专业知识判断
连续型指标
确定判断阳性结果的具体取值——截断值
5、盲法测量
一般采用盲法来控制信息偏倚
2、资料整理及真实性评价
资料整理
真实性评价指标
灵敏度/真阳性率
定义:实际患病且被筛检试验标准判断为阳性的百分比
反映了筛检试验发现病人的能力
假阴性率/漏诊率
定义:实际患病但被筛检试验确定为阴性的百分比
反映的是筛检试验漏诊病人的情况
互补:灵敏度=1-假阴性率
特异度/真阴性率
定义:实际无病且被筛检试验标准判断为阴性的百分比
反映了筛检试验鉴别排除病人的能力
假阳性率/误诊率
定义:又称“假阳性率”,是指实际无病,但被筛检试验判断为阳性的百分比
反映的是筛检试验误诊病人的情况
易错描述
误诊率是指在新筛检方法检测出的所有阳性人数中,误判为病人的比例(×)
误诊率是指“金标准”确诊的非病人中用新筛检方法误判为阳性的比例(√)
互补:特异度=1-假阳性率
正确指数/约登指数
表示筛检方法识别真正病人与非病人的总能力
范围:0~1
指数越大,真实性越高
似然比
同时反映灵敏度和特异度的总和指标
阳性似然比
比值越大,试验结果阳性时为真阳性的概率越大
阴性似然比
比值越小,试验为阴性时为真阴性的概率越大
在选择筛检试验时应选择阳性似然比高,阴性似然比低的方法,此时试验的准确性最佳
(二)可靠性
信度、精确度、可重复性
定义:是指在相同条件下用某测量工具(如筛检试验)重复测量同一受试者时结果的一致程度
可信度评价与金标准诊断是否患病的结果无关
研究设计
通常与真实性评价同时开展
方法
由两名或多名检查者采用同样的检查程序对研究人群进行同时盲法检查
eg.血压重复测量三次
样本量计算
Bland-Altman法推荐对连续性变量进行一致性评价,所需的样本量应不少于100例
如果真实性研究的样本量较大(1000以上),可随机抽取5%~10%样本进行重复检测
1、信度指标
重测资料总的来说可以看作配对(定量、定性)资料
(1)连续性测量资料
同一样品或一组同质性样品(个体差异较小的样品)进行多次重复测量
标准差和变异系数
值越小,方法的精密度越高
一批不同质样品(对象)进行两次重复测量
两次测量值的相关系数(r)
r≥90%,可认为一致性较好
配对t检验分析
(2)分类测量的资料
配对四格表
符合率/一致率
kappa指标
常用来评价两次检测结果的一致性,该指标的计算考虑机遇因素的影响,是更为客观的指标
一般认为Kappa值≥0.75为一致性极好,在0.4~0.75为中、高度一致;≤0.4为一致性差
将该公式上下同时除以N²,则可以变为
那么
实际观察一致率
机遇一致率
配对χ²检验
2、影响筛检试验可靠性的因素
(1)受试对象生物学变异
由于个体生物周期的生物学变异,使得同一受试对象在不同时间获得的临床测量值有所波动
(2)观察者
由于测量者之间、同一测量者在不同时间的技术水平不一,判断尺寸掌握差异,预期偏倚等均可导致重复测量的结果不一致
(3)实验室条件
重复测量时,测量仪器不稳定,试验方式本身不稳定,不同厂家、同一厂家生产的不同批号的试剂盒的纯度,有效成分的含量,试剂的稳定性等均有不同,由此可能引起测量误差
(三)预测值
定义
是应用筛检结果的阳性和阴性来估计受检者为病人和非病人可能性的指标
反映了筛检试验实际应用到人群筛查后,获得的收益大小
计算方法
1、直接计算法
前提:在社区开展的,基于横断面设计的筛查试验评价,样本人群的疾病现患率与目标人群的现患率一致
(1)阳性预测值
筛检发现的阳性者(分母)中患目标疾病的人所占的比例
(2)阴性预测值
筛检发现的阴性者(分母)不患目标疾病的人所占的比例
2、间接计算法
前提:在医院开展的,基于病例-非病例设计的筛查试验研究,病例组和非病例组的构成比不能代表目标人群的现患与未患比例,因此不能直接计算预测值
(1)阳性预测值
(2)阴性预测值
Bayes公式
预测值与真实性指标、现患率的关系
筛检试验的灵敏度,特异度和目标人群的疾病患病率都会影响预测值的大小
(1)现患率对预测值的影响
(2)灵敏度、特异度对预测值的影响
(四)确定连续性测量指标的阳性截断值
筛查试验的结果是连续性指标时,需要确定阳性/阴性结果的判定标准——截断值
两组人群测量值分布的三种状态
假设病人的测量值总体上大于非病人,H为病人的最低值,X为非病人的最高值
(1)独立双峰分布
总人群分布成独立分布的双峰型,病人和非病人分布曲线完全无重叠
原则上把截断值选在病人中的最小值H处,筛检试验的判断准确度可达100%,但在实际检测中人们是很难穷尽病人的最小值的,通常的做法是根据非病人检测值的99%~99.9%CI上限来确定截断值
具体可信限值取决于疾病的发生率的大小
对发病率极低(<10/10万)的疾病可选择99.9%上限值,这样既可保证灵敏度达到100%,又避免过高的假阳性检出率
(2)部分重叠双峰分布
总人群分布成双峰型,病人和非病人分布曲线小部分重叠
在H至X之间,当截断值向非病人的最高值方向(X)移动,特异度升高,灵敏度降低
发现病人的能力下降了
当截断指向病人的最低值(H)方向移动时,灵敏度增大,特异度降低
发现病人的能力增加了
筛检试验阳性结果的截断值选择在何处,可从以下几个方面进行考虑
(1)如果疾病的预后差,漏诊病人可能带来严重后果,目前又有可靠的治疗方法则截断值应向提高灵敏度方向移动,尽可能多的发现可疑病人,但会使假阳性增加
(2)如果疾病后续诊疗方法不理想,则截断值应向提高特异度的方向移动,尽可能将非病人鉴别出来,减小假阳性对参加者造成的心理压力,如肝癌的筛检
(3)一般而言,筛检试验应综合考虑灵敏度和特异度达到平衡,此时将临界点定在非病人与病人分布的交界区,实际操作时,一般采用受试者工作曲线来决定最佳截断值
受试者工作曲线(ROC)
基本原理:将病人和非病人的测量值从小到大排序,即可划分一系列截断值。对应每个截断值可计算相应的灵敏度和特异度。绘制1-特异度(假阳性)为横坐标,灵敏度为纵坐标的坐标轴,每个截断值对应的灵敏度和1-特异度值构成坐标点,多个坐标点相连,即ROC曲线
距离坐标轴左上角最近的坐标点可同时满足筛检试验的灵敏度和特异度相对最优,它所对应的取值即最佳截断值
ROC曲线你整个横轴构成的面积(AUC)也可以反映检测方法的真实性。AUC越接近1.0,检测方法真实性越高。等于0.5时,则真实性最低,无应用价值
还可以利用AUC线下面积直接比较两种以上筛检试验的真实性的优劣
(3)单峰连续分布
总人群分布成单峰型,病人和非病人的分布相互交错,区分度较差,此时无论截断值如何选择都可能有较大的误判率
这类指标通常用作初筛方法,截断值可选择图形中的拐点,此时尽管误诊率较高,但可尽量避免漏诊
如果病人的测量值完全包含于非病人的范围内,且分布较宽,则不宜采用该类型指标开展疾病筛检
筛检效果的评价
筛检效果评价阶段及研究方法
三个人群获益阶段
近期收益
早中期疾病中间结局改善
长远期人群终末结局风险(死亡)降低
评价内容
生物学效应指标
安全性评价
卫生经济评价
项目可持续性评价/社会适应性评价
一向筛检项目开展之前,就应计划在人群基础上逐级深入的开展以下研究
1、局部范围精细化设计的现场干预研究
2、扩大区域的社区干预研究
3、推广应用后的验证研究
筛检效果评价阶段
1、第一阶段(现场干预研究)
一般采用设计严谨的随机对照试验,将研究对象以个体或整群随机的方式分为两组,干预组需要接受连续周期性的筛查,对照组则需接受常规的医疗服务
理想的筛检项目试验研究往往需要庞大的样本量和较长的随访期,可获得筛查项目的近期至长远期的一系列效果指标
RCT研究多用来评价筛查方法的收益,中间结局改善情况,筛查成本及人群可接受度等近期效果指标
2、第二阶段(筛检示范区建设阶段)
这一阶段采用多中心的社区类实验究连续观察筛查的中、远期效果生物学指标,卫生经济学效果指标及筛查和治疗的不良反应事件发生情况等,探索筛检在实际环境中的运作机制
3、第三阶段(验证和应用阶段)
该阶多采用观察性的研究方法,进一步验证真实条件下筛查所取得的远期生物学效应,卫生经济学效益以及项目的可持续性
开展这类研究的前提是:筛查项目已经在某地区广泛推广,地区全人群健康档案齐全,有连续多年的完整、准确的筛查和疾病登记信息
常用流行病学方法
(1)回顾性队列研究
该方法在以推广筛查的地区,通过比较既往参与筛查人群和不接受筛查人群的随访一段时间后的归因死亡率、生存率的差异来说明筛查项目的效果
(2)病例对照研究
研究假设是:如果筛查项目能够降低疾病死亡率,则在同一人群中死亡病人封存接受筛查的比例应低于存活病人
病例是在实施了筛查项目的地区人群的所有死亡病例的随机样本
对照是同一源人群(包括病人)的存活者的随机样本
(3)生态学研究
筛查推广较长时间后,可应用生态学研究方法比较开展地区和未开展地区或者项目地区开展前后人群肿瘤归因死亡率的变化,以此说明筛查项目的长远效果
筛查项目评价内容及指标
1、收益
收益
也称收获量,指经筛检后能使多少原来未发现的病人(或临床前期病人,高危人群)得到诊断和治疗
该类指标反映人群在短期内因筛检得以早诊早治的收益情况
指标
阳性预测值
最常用的收益指标
转诊率或筛查阳性率
即筛查阳性人数占筛查目标人群数的比例
转诊率与筛检试验的灵敏度高或特异度低有关,如果目标人群基数较大,该指标不宜太高,否则不符合卫生经济学原则
早诊/早治率
即早期病例在筛查所发现的全部病例中所占的比例,如果筛查的早诊率显著高于正常医疗程序发现的早诊率,则可认为筛查收益较好
提高筛检收益的方法
(1)高危人群策略
疾病在某些年龄,性别,种族及主要危险因素暴露特征人群中有较高的患病率,在这些高危人群中开展筛查可提高阳性预测值,也更符合低成本,高效益的原则
(2)选择合理的筛查方案
选择高灵敏度方法
目的是尽可能不漏诊病例
采用联合试验
定义:在实施筛检时可采用两种或两种以上筛检试验检查同一受试对象,以提高筛检的灵敏度和特异度,增加筛检的收益,这种方法叫做联合试验
类型
串联试验/系列试验
一组筛检试验按一定的顺序相连,初筛阳性者进入下一轮筛检,全部筛检试验结果均为阳性者才定为阳性
发现病人的能力下降了
该法可以提高特异度,但会使灵敏度降低
初筛的方法尽量选择灵敏度高的方法,第二轮的筛查则尽可能选择特异度较高的方法
并联试验/平行试验
全部筛检试验同时平行开展,任何一项筛检试验结果阳性就可判断为阳性
发现病人的能力提高了
该方法的优点是可以弥补两种方法灵敏度都不足的问题,提高筛查整体的灵敏度,但会降低特异度。
在设计并联筛查方案时,应充分考虑筛查方法的成本-效益比
筛查起始年龄和时间间隔
筛查的起始年龄和筛查间隔应根据人群最大获益的时点来确定
筛查间隔要根据方法的准确性来调整
用灵敏度和特异度均高的方法,筛查间隔可较长
灵敏度较低的方法,可以通过提高筛查频率来减少漏诊的情况
2、生物学效果指标
生物学效果评价是根据筛查能改善疾病的中间或终末结局状态(发病或预后)的观察终点来设定,通常采用率为指标,另外筛查效果一般都是通过对比研究来体现,故需要计算相对比指标
(1)结局测量指标
归因死亡率
评价筛检人群长远期获益的终点结局指标
归因死亡率降低是筛查效果评价中最有说服力的结论性指标
治愈率,复发率,病死率,生存率和生存时间
评价筛检人群早期或中期获益的中间结局指标
常用1年,3年,5年生存率来评价癌症的筛检计划
要注意应用这些指标时,应注意领先时间、病程长短等时间相关偏倚的影响
复发率:中远期生物学效果评价指标
(2)关联指标
随机对照试验
效果指数
保护率
保护率:不是【结局】测量指标,是关联指标
保护率:是预防性试验研究中的评价预防措施效果的指标
归因危险度或绝对危险度
观察性研究
死亡危险率比(RR)
优势比(OR)
(3)需要筛检人数(NNBS)
不是结局测量指标
是实验流行病学指标“需治疗人数(NNT)”在筛检项目效果评价中的具体应用
在筛查研究中,以目标疾病的死亡率作为结局指标,随访一定期限后,计算对照组与筛检组的疾病归因死亡率之差(AR),将AR取倒数值,得到NNBS=1/AR
该指标表示减少一例目标疾病病例的死亡需要筛检多少人,这个数值越小越好
3、卫生经济学评价
筛查成本
是提供卫生服务过程中所消耗的资源
包括
项目成本(项目培训、管理、组织的费用)
个人直接成本(诊治和交通陪护等)
个人间接成本(生产力损失)
成本-效果分析
效果指筛检项目开展后健康改善方面所取得的生物学效果
如:复发率、死亡率等下降,生存期的延长
指标:生存-效果比(CER)
每延长一年生存期所消耗的成本
成本-效用分析
效用是综合了生物学效果和人们对结果主观感受和功能状况的指标
它不仅关心病人能存活多久,还关心存活的质量
如:寿命年作为观察指标,考虑到疾病对病人生命质量的影响,则应测量质量调整寿命年
指标:成本效用比(CUR)
成本-效益分析
效益是指将健康改善的结局用货币价值来衡量
是公共卫生项目经济学评价中最佳的评价指标
指标:成本效益比(CBR)
卫生经济学模型
常用:马尔可夫模型
4、安全性和伦理学评价
安全性及伦理问题
评价伤害的指标
过度诊断/治疗率
不良事件发生率
筛检相关的伤害包括三个方面
(1)筛查方法本身造成的伤害
(2)筛查的假阳性则可能面临过度诊断的问题,可能会经历确诊前的焦虑情绪困扰
(3)如果早期诊断的病例是所谓的“惰性病例”,随之而来的过度治疗可能会损害其健康
必须遵循“赫尔辛基宣言”的医学伦理学准则
(1)开展筛查研究前应提交伦理委员会审查及获得受试者的知情同意
(2)应保护受试者的生命健康,尊严,完整性,自我决定权和隐私
(3)筛查应该是有益无害或收益远大于危害的
(4)如果筛检的价值和安全性已确定,项目应公平合理的对待每一个社会成员
政策、经济及人力支持环境
人群接受度
5、项目可持续性评价
筛检效果评价中常见的偏倚
1、领先时间偏倚
领先时间:是指临床前筛查诊断的时点(年龄)至常规临床诊断时间(年龄)之间的时间间隔
该间隔是疾病的自然病程阶段,如果筛查只提前了发现疾病的时点,而并未改变筛查人群的死亡时点(年龄),也会观察到筛查人群比不筛查人群生存时间更长的假象,领先时间偏倚
以生命年为指标评价筛查效果时,应扣除领先时间,否则会高估了筛查效果
2、病程偏倚
疾病被检出的可能性和疾病的进展速度有关
肺癌的非小细胞癌恶性程度高,肿瘤增长速度快,在临床前期被筛检发现的机会较低
腺癌的恶性程度低,筛查能检出该亚类病人的概率较大
如果筛查组中疾病进展缓慢的病人占较大比例时,可能观察到筛查组较未筛查组生存概率更高或生存时间更长,此时筛查的效果被高估了,且产生了病程长短偏倚
3、志愿者偏倚
健康行为可能决定筛查意愿,参加筛查者与不参加者相比可能有更高的受教育程度,个人经济状况更好,更关注自身的健康,不良行为习惯的发生率较低,因此参加筛查的人群总的发病或死亡风险可能低于不参加筛查人群
主动参与筛查者对后续的治疗的顺应性更高
这些因素都可能使筛查人群的死亡风险低于不参与人群,导致筛查效果被高估,即产生健康志愿者偏倚
4、过度诊断偏倚
如果筛查出的病变正处于良性阶段,可能逆转至正常状态(如宫颈癌的CIN Ⅰ阶段可自行恢复)、或病人病程停滞或进展缓慢,病人可能在出现临床症状前就死于其他竞争性疾病
筛查发现过多的早期病例,而增加了诊断治疗的负担,这种现象称为“过度诊断”
因为筛检这些“惰性病例”被发现、确诊患病、并被记入病人总体之中,导致经筛检发现的病人有较多的生存者有或较长的平均生存期,从而高估了筛查效果,即产生了过度诊断偏倚,他也是病程偏倚的一种极端形式
第八章 病因及其发现和推断
病因的基本概念
病因:引起疾病发生的原因,即能够影响未来疾病发生的因素或事件
因果关系
概念:是两个事物之间关系的一种,是一种由事物变化关联和时间因素构成的复杂抽象关系。是一个事件在时间上总是随着另一个事件发生而发生的规律性关系。
基本条件
缺一不可
1、时间顺序:因事件必须发生在果事件之前
2、关联关系:果事件随着因事件的变化而变化
可以直接观察到
3、因变性:果事件的变化是由于因事件的变化而引起的
需要通过排除其他因素的可能性来间接证明
医学实践中重要的因果关系
病因和疾病的关系
治疗和效果的关系
治疗和副作用即不良反应的关系
因果关系
多样性
混杂因素可能会存在任何研究中影响研究因素与结局之间的关系,可能会影响到关联强度的大小,对因果关系的影响较小,且对因果关系的形式不会有影响
复杂性
直接病因和间接病因的现象预示病因链的存在,也提示了切断病因链的任何环节都可以达到预防疾病的目的,预示了更多的预防疾病方略的可能性
关联性质
病因学说与病因模型
概念
病因学说:现代医学以前对病因本质的假说
病因模型:现代医学里用来区分不同病因以及阐述他们与疾病的关系,他们彼此之间的关系以及他们作用机制的理论框架
主要用途
1、用于阐述病因之间的关系以及病因与疾病之间关系
2、指示病因的方向以揭示新的病因
3、用于说明病因的作用和解释流行病学概念和原理
是流行病学研究设计的理论基础(×)
其理论基础应该是各种研究方法的基本原理的总和
他们都以发现新的病因或抓住主要病因,从而制定更全面、更有效的疾病预防策略为最终目的
类型
瘴气说
微生物说
单病因学说
传染性疾病病因的三角模型
John Gordon
传染病流行的三个方面
1、宿主
2、病原体
3、环境
等边三角形的平衡关系
流行病学的主要任务就是寻找可以用来切断该三角中任何一条或多条链锁的措施,阻断任何两个因素之间的联系,以此就可以控制疾病的流行。
优缺点
优点:优于朴素的单病因学说,揭示了在病原体之外存在可以用来预防和控制传染性疾病的因素,揭示了在病原体不明的情况下预防传染病的可能性,是人类用来控制传染病的重要理论基础
缺点:病因的三角模型承认一个疾病的病因是多重的,但是把病原体宿主和环境分隔开来,把每个因素放在一个独立的位置,把他们等量齐观,可能不适合慢性病因的研究
病因的轮状模型
背景:慢性病不像传染病那样存在明确的病原体,而且慢性病的致病因素是多样的,且任何单一因素的作用相对较小
Mausner和Kramer
特点
把可患病的人或动物放到了中心的位置,周围是他们生活的物理、化学、生物和社会环境,而传染病的致病因子只是生物环境的一部分
该模型用新的方式描述了宿主、致病因子和环境的关系,认为环境宿主和病原体不是对等和分离的关系,它们的重要性也有主次分别,并提示了直接病因和间接病因的存在,以及远端病因和近端病因的区别。
强调宿主与环境的关系,扩充了环境的概念。提示更多的环境因素可以治病,指出了更多的干预靶点,为预防疾病提供了更多的选择
优点
较三角模型更接近于病因之间以及病因与疾病的实际关系,为研究复杂的慢性疾病的病因打开了新的窗口
缺点
早期的轮状模型是围绕传染病的三个因素展开的,对于慢性非传染性疾病,他们揭示的病因的范围存在局限性,限制着人们认识和控制慢性非传染病疾病的能力和作为,因此是一个过渡性的模型。
健康决定因素模型/生态病因模型
Dahlgren 和Whitehead
特点
1、该模型的中心人是人体,包括一个人的性别,年龄,遗传等特征,然后将其他病因归类,并分成不同的层次,每层又有包含很多相关但不同的因素,并强调各种因素的相互作用对健康的影响。
2、病因的生态模型认为个体特征是疾病发生的根本
3、生态病因模型也表明了直接和间接病因的存在
优点
该模型具有早期疾病轮状模型的基本特征,但是“健康决定因素”生态模型还意味着那些可影响健康但不影响发病的因素也可以被利用。进一步拓宽了“病因”的范围和领域,揭示了更多可以用来提高健康预防疾病的因素。
生态病因模型最大限度的拓展了人类对各种可能病因的认识,从而也揭示了更多新的促进健康、预防疾病的方法,尤其强调人们共同暴露的社会生态因素,提出了改善社会生态环境对预防疾病的作用。
缺点
在呈示病因之间的关系上,生态模型还是笼统的、不完善的
病因链
时间上先后发生的互为因果的病因之间,以及这些病因与最终疾病之间的关系,可以用病因链来描述
在一个病因链上除去任何一个病因,就可以切断整个病因链,从而预防疾病通过此病因链发生。而且这也是最有效的方法,因为不需要针对一个病因链上的所有因素进行干预,就能够达到预防的效果
一个疾病可能有多个独立作用或相互影响的病因链
病因网
很少疾病。疾病只有一个单一的病因列,事实上一个疾病往往存在多个独立的或相互关联的病因链,同一疾病不同病因链相互连结,相互交错,形成一个更为复杂的完整的病因关系网
如果说轮状模型指出了更广泛的病因的存在,病因网则试图更详尽的描述他们之间的关系
从理论上更清楚的解释疾病预防中的很多现象
1、去除一条病因链中的任何一个因素,就可以完全切断整个病因链,从而预防疾病通过此病因链发生。这使得阻断病因链有了多种选择,增加了预防的方法和可能性
2、不同的病因链对疾病发生的作用的大小可能不同,有效的预防应切断主要的病因链
3、不同的病因链可能独立的影响疾病的发生,同时阶段多个病因链必然可以预防更多的病例
病因模型的比较
早期的病因假说主要是针对传染性疾病的,瘴气说和微生物说是早期朴素的病因理论,可以看成是最简单的病因模型。
病因的三角模型对早期模糊的病因假说进行了明确的界定,也是对单一病因假说的否定和对多病因假说的肯定,使病因的探索有了更多的方向
病因的轮状模型和健康决定因素的生态模型是病因概念扩展的典型产物,它们揭示了病因的多元性,大大扩展了病因的范畴,尤其是健康决定因素的生态模型,形象的展示了病因与疾病远近的现象,提示直接病因和间接病因的存在
病因网则试图更好地展示病因之间以及病因与疾病之间的复杂关系,如链式连接,协同作用,主次关系,远近关系等,揭示了抓一点(即一个病因)可以影响全局的可能性,增加了预防慢性病的选择,也便于分清主次和发现主要矛盾,更有效地预防和控制疾病
充分病因-组分病因
定义
注意
为了预防疾病,我们不需要知道所有的组分病因,除去或阻断其中任意一个组分就可以打散该充分病因,从而预防通过该充分病因发生的所有病例
组分病因对充分病因缺一不可,但这不等于说所有组分病因必须同时存在,更可能的情况是他们需要按照一定的时间顺序逐次发生,当最后一个组分病因发生或出现时,充分病因完成,疾病发生
然而能够引起一个疾病发生的充分病因往往不止一个,或者说疾病的发生可以通过多个不同的充分病因实现,同一疾病的充分病因也彼此互为互补病因
病因的分类和举例
充分病因-组分病因模型回答了病因学说的两个重要的悖论
1、为什么没有某个病因,疾病却发生了?
因为绝大多数慢性非传染性疾病没有明显的必要病因,疾病可以通过不同于所关注病因的其他充分病因实现
2、某个病因存在,疾病却没有发生
因为关注的病因不是充分病因,只有当其互补病因都存在时,疾病才会发生,绝大部分慢性非传染性疾病的病因都属于这类病因
该病因模型还可以用来解释很多流行病学的核心概念,如发病率、暴露或治疗作用的大小效应,效应修饰作用,归因危险度,疾病潜隐期等
发现和检验病因
发现病因的法则与方法
因果关系的三个必要特征
1、时间顺序
2、关联关系
3、因变性
方法:穆勒法则(Mill's canons)
所谓发现因果关系就是依据穆勒法则设计研究方案,并依此收集有关因果关系第三个条件存在的证据,最后对证据进行评估,推论因果关系存在的可能性
穆勒法则与流行病学研究设计
求同法病例系列的原理——产生假设
共求法是病例对照研究,队列研究和随机对照试验的理论基础——验证假设
局限1:只适合于必要且充分病因的研究,不适合现代慢性非传染病的研究
修订:很多同一疾病的病人都具有某一因素,多数为患某疾病的人都没有该因素,而且该因素的发生频率在患病者和非患病者之间存在差异,该因素很可能是该病的病因。这个修正的核心是将“所有”→“很多”或“多数”,“决定论”→“概率论”
局限2:是逻辑上的推理,没有明确界定事件之间的时间关系
完善:队列研究设计正是切中并解决了穆勒法则里时间和方向不明的问题,队列研究从因开始,在果没发生的情况下,观察果随后的发生情况,然后看果是否随因的不同而不同,因此队列研究观察的关联关系具备了因先果后的时间顺序关系,提供了因果关系中时间顺序证据,发现的病因可更可能是真实的
局限3:还不能排除观察到的果随着因发生的变化不是由于因引起,而是由混杂造成
完善:随机对照试验,利用随机分组的方法保证了比较组之间的可比性,彻底排除了混杂,发现的因果关系的可靠性高于队列研究,因此,随机对照试验是在人群中验证因果关系最可靠的方法
需要考虑的伦理:我们只能人为的向人群施加有益的因素,而不能施加有害的因素(如致病因素),因此随机对照试验只能用来评估治疗和干预的效果,不能用来直接研究疾病的病因。队列研究是在人群中验证病因的最可靠的方法。也常被用于研究治疗的不良反应
综上:队列研究和随机对照试验有机融合了穆勒的四个法则,并同时考证了因和果的时间顺序和应变性是在人群检验因果关系最可靠的方法
研究病因的理论,法则与方法
1、研究病因的基础:因果关系的三个基本条件
2、发现病因的法则:穆勒的因果推理法则
3、发现病因的研究方法
发现传染病病原体的科赫氏法则
发现慢性非传染性疾病多重病因的流行病学研究
4、病因推断
希尔的9条病因推论标准
系统综述
GRADE的推论原则
因果关系推论
科学推论的一般原则
病因推断
三个层次
1、单个研究内(真实性)的推论(把握度)
推论的正确性首先取决于研究的相关性和设计类型
其次取决于研究的方法学质量和样本量,且研究质量的重要性大于样本量
2、基于现有所有同类研究的推论(假设检验)
3、基于所有有关证据的推论(循证医学)
两个方面
对定性结论的推论
判断某个因素是否为某种疾病的病因
对定量结果的推论
可以判断因果关系的强弱
评价单个研究的真实性
原始研究的真实性是推论正确性的基础决定因素
真实性和研究质量
真实性:在研究条件下,观察的结果与真实的接近程度
偏差/系统误差:观察与真实之间的差别
研究质量:决定研究结果内部真实性,是对研究偏倚控制程度的总体衡量
决定研究质量的因素
1、研究质量由研究的偏倚控制措施决定
研究设计是一项研究控制偏倚最基本的方法,一项研究的质量首先取决于研究设计的种类
2、研究的质量进一步取决于流行病学研究的一般偏倚控制措施
如收集资料的准确性,组间测量的一致性,样本的代表性,减少失访,足够的观察时间等
3、研究的质量还取决于一类研究设计特有的偏倚控制措施
比如临床试验可使用随机分组、分组隐匿、盲法、维持原随机分组分析等偏移控制措施
4、样本量决定抽样误差的大小,决定结果估计的精确性,本质上也是研究结果与真实激进程度的决定因素之一
评价研究质量的方法
证据分级是快速评估真实性常用的参考工具
一般认为将研究质量分为3~5级就可以满足病因推论的需要
综合所有证据的推论
希尔准则
希尔的病因推断准则
明显的缺陷
1、没有考虑收集的原始研究是否全面和完整
2、对原始研究正确的真实性没有考评
3、将一个研究内提供的信息以及可在研究间观察到的信息和流行病学研究以外的信息混为一谈,认为它们是同等重要的
4、非特异的标准中,一致性是最关键的条件,但是希尔对什么是一致性没有量化的界定,因此很难判断
系统综述
循证医学出现把医学领域因果关系的研究和推论推向了新的阶段,循证医学首先关注的不是病因,而是治疗的效果和副作用,治疗与其产生的效果和副作用的关系也是因果关系
系统综述加强了对原始研究收集的系统性以及对结果定量的推断,并在原始研究结果真实性,精确性和一致性方面系统地提出了一套统一的定量评估方法
系统综述可以说是对希尔准则的科学的系统的定量的应用和发展,并明确提出对原始研究质量进行严格的评估
总结
原始临床研究
观察法
描述性研究
病例报告、病例系列、常规资料分析
横断面研究、生态学研究、筛检
分析性研究
队列研究
病例对照研究
实验法、实验性研究
随机对照实验
非随机对照实验
二次临床研究
Meta分析
一类统计方法,用来比较和综合针对同一科学问题所取得的研究结果,比较和综合的结论是否有意义,取决于这些研究是否满足特定的条件
系统综述
针对某个主题进行的二次研究,在复习,分析,整理和综合针对该普及的全部原始文献的基础上进行综述过程要依照一定的标准化方法,是行政决策的良好依据
异同:Meta分析是运用定量方法去概括(总结)多个研究结果的系统评价。系统综述并不一定意味着一定要对相关研究的结果进行定量合成,它可以是定性的系统综述,也可以是定量的系统综述,它包含meta分析
临床指南、决策分析