导图社区 人卫第8版《流行病学》——第三章《描述性研究》
这是本书介绍的第一个研究方法,也是最常见的一种研究方法!难度不大,重点主要在掌握现况研究偏倚和优缺点、随机抽样的方法、生态学研究的特点和优缺点
编辑于2023-03-12 16:57:20 广东社区模板帮助中心,点此进入>>
第三章 描述性研究
描述性研究的概述
概念:利用常规监测记录或通过专门调查获得的数据资料(包括实验室检查结果)按照不同地区、不同时间及不同人群特征,进行分组,描述人群中有关疾病或健康状态以及有关特征和暴露因素的分布状况,在此基础上进行比较分析,获得疾病三间(人群、地区和时间)分布的特征,进而获得病因线索,提出病因假设。
种类
现况研究
定义:是在一个特定时点或时期内,在特定范围内的人群中,对某种(些)疾病或健康状况以及相关因素进行调查的的一种方法。
意义
(1)描述所研究疾病或健康状况以及相关因素在该调查人群中的分布
(2)为建立病因假设提供证据
病例报告
定义:对临床上某种罕见病的单个病例或少数病例的详细介绍
定性研究
意义
重点探究罕见病产生的原因(研究涉及少数个案,通过对个案特征的把握得出结论。无需描述事物集中趋势和离散程度,为研究者提供分析和决策的线索)
通常是针对个别现象的探讨,判断一个病例是否为罕见病例需要进行全面的文献检索
病例系列分析
定义:对一组(几例、几十例、几百例或几千例)相同疾病的病人临床资料进行整理、统计、分析、总结并得出结论
意义:分析某种疾病的临床表现特征,评价预防、治疗措施的效果
个案研究
=个案调查,是指到发病现场对新发病例的接触史、家属及周围人群的发病或健康状况以及可能与发病有关的环境因素进行调查,
目的
(1)以达到查明所研究病例的发病原因和条件
(2)控制疫情扩散及消灭疫源地,防止再发生类似疾病的目的
对象:一般为传染病病人,也可以是非传染病病人或病因未明的病例等
意义
(1)是医疗卫生及疾病预防部门日常处理病例报告登记工作的组成部分
(2)可以获得有关疾病发病的第一手资料
(3)为地区疾病控制提供了分析基础
(4)为探索病因提供线索
举例
对个别发生的麻疹患者进行调查
一次因会餐引起的事物中毒调查
历史资料分析
定义:研究者通过回顾性调查,提取和利用相关机构的日常工作的记录、登记、各类日常报告、统计表格、疾病记录档案等历史资料,进一步开展统计分析,最终获得研究结果
意义
(1)是研究疾病的三间分布特征、疾病危险因素和评价疾病防制措施效果的重要资料和信息来源
(2)属于基础资料范畴
随访研究
定义:通过定期随访,观察疾病、健康状况或卫生事件在一个固定人群中随着时间推移的动态变化情况。
对研究对象进行连续观察
意义
(1)疾病自然史的研究
(2)提供病因线索
(3)提出或检验某种病因学假设
生态学研究
=相关性研究。是在群体的水平上研究暴露于疾病之间的关系,观察和分析的单位是群体。
粗线条的研究
仅能提供一定的病因线索
特点
以观察为主要研究手段,不对研究对象采取任何干预措施。
观察、无干预
暴露因素的分配不是随机的,且在研究开始时一般不设立对照组
暴露分配非随机、研究开始不设对照
暴露与结局的时序关系无法确定,因果推断具有一定的局限性,仅可做一些初步的闭角型分析,但可为后续的分析性或实验研究提供线索
暴露时序不定,因果受限,仅初步分析,提供线索
用途
描述疾病或者健康状况的分布及发生发展的规律
疾病危险因素的发现
高危人群的确定
疾病病人的早发现、早诊断、早治疗
人群疾病防制策略措施的提出
卫生政策和医疗卫生计划的制定提供基础资料,具有启示作用
获得病因线索,提出病因假设
比较差异
现况研究
概念=横断面研究、患病率研究
定义:对特定时点(或期间)和特定范围内人群中的疾病或健康状况和有关因素的分布情况的资料收集、描述,从而为进一步的研究提供病因线索。
特点
现况研究一般在设计阶段不设对照组
研究设计阶段,根据研究目的确定研究对象,然后调查研究对象在某一特定时点上的暴露(特征)和疾病的状态,而不是根据暴露状态或疾病状态先进行分组
但是在资料分析阶段,则可根据暴露(特征)的状态或是否患病的状态来分组比较
现况研究的特定时间
1、某一特定时点上或某一特定时期内
2、特定时点并不强调必须是某年某月的某一特定时间,如调查高血压的患病情况时,对每一个个体来说,特定时点是指测量血压、诊断是否为高血压的时间
3、这些不同的具体时点持续太久,就会对调查结果产生影响
4、所调查的疾病是急性的,且随着时间的变化,其发病率也有不同,此时结果就很难解释
5、理论上,时点患病率较期间患病率更为准确,因此这个时间应该越集中越好
现况研究在确定因果联系时受到限制
在现况研究中,研究对象一般都是存活期较长的病人,而某些病程较短的疾病病人(如迅速痊愈或很快死亡),则很难包括在一个时点或一个短时期的研究中。但存活期长与存活期短的病人,在许多特点上可能会很不一样,这种情况下,就很可能将影响存活的因素当作影响发病的因素
可能把疾病的保护因素当作发病的危险因素
现况研究一般揭示的是某一时点或时期暴露(特征)与疾病的关系,而不能确定暴露与疾病的时间顺序关系
无法知道是因为影响因素的出现导致的疾病还是疾病的出现导致影响因素的出现
对研究对象固有的暴露因素可以作因果推断
如性别、种族、血型、基因型等因素,在发病之前就存在,且不会因是否患病而发生改变,则在排除和控制了可能存在的便宜的情况下,在现况研究可以提供相对真实的暴露和疾病的时间先后时序关系,从而进行因果推断
现况研究用现在的暴露(特征)来替代或估计过去的情况的条件
1、现在的暴露或暴露水平与过去的情况存在着良好的相关关系,或已被证明变化不大。如职业性暴露
2、已知研究因素的暴露水平的变化趋势或规律,以此趋势或规律来估计过去的暴露水平
3、回忆过去的暴露或暴露水平极不可靠,而现在的暴露资料可以用来估计过去的暴露情况
现况研究定期重复进行可以获得发病率资料
1、该时期的发病率=两次现况研究的现患率之差/两次现况研究之间的时间间隔
2、要求:两次现况研究之间的时间间隔不能太长,在该时间范围内发病率的变化不大,且疾病的病程稳定。
3、避免了需要长期随访监测研究对象来获得发病率资料的研究方法的弱点。
类型
普查
抽样调查
用途
掌握目前群体中疾病或健康状况的分布
提供疾病病因研究的线索
确定高危人群
例如,为了预防与控制冠心病和脑卒中的发生,需要将目标人群中这类疾病的高危人群鉴别出来。现有的知识认为高血压是这类疾病的一个重要危险因素,据此,可应用现况研究找出该目标人群中的全部高血压病病人,将其确定为高危人群。
描述性研究的用途
评价疾病监测、预防接种等防治措施的效果。
优点
现况研究常开展的是抽样调查。其研究结果有较强的推广意义,以样本估计总体的可信度较高。
现况研究是在资料收集完成之后,将样本按是否患病或是否暴露来分组比较的,即有来自同一群体自然形成的同期对照组,使结果具有可比性。
现况研究往往采用问卷调查或实验室检测等手段收集研究资料,故一次调查可同时观察多种因素,其在疾病病因探索过程中,为不可或缺的基础工作之一。
缺点
现况研究与分析性研究的一个明显区别是其对特定时点即某一时间横断面和特定范围的规定,收集的信息通常只能反映调查当时个体的疾病与暴露状况,难以确定先因后果的时相关系
现况研究调查得到的是某一时点是否患病的情况。故不能获得发病率资料,除非在一个稳定的群体中连续进行同样的现况调查。
在一次现况研究中,如果研究对象中一些人正处于所研究疾病的潜伏期或临床前期,则其极有可能会被误定为正常人。使研究结果发生偏倚,低估该研究群体的患病水平。
普查和抽样调查
普查
定义:在特定时点或时期内、特定范围内的全部人群(总体)作为研究对象的调查。
1、这个特定时间应该较短
2、特定范围是指某个地区或某种特征的人群
目的
早期发现、早期诊断、早期治疗病人。eg.宫颈癌普查
了解慢性病的患病及急性传染性疾病的的疫情分布
了解当地居民健康水平
了解人体各类生理生化指标的正常值范围
优点
不存在抽样误差
可以同时调查目标人群中多种疾病或健康状况的分布情况
能发现目标人群中的全部病例,在实现三早预防的同时,全面地描述疾病的分布与特征,为病因分析提供线索
缺点
不适用于患病率低且无简便易行诊断手段的疾病
工作量大,因此不易细致,难免存在漏查
调查工作人员涉及面广,掌握调查技术和检查方法的熟练程度不一,对调查项目的理解往往很难统一和标准化,较难保证调查质量
耗费人力、物力资源一般较大,费用往往较高
抽样调查
定义:指通过随机抽样的方式,对特定时点、特定范围内人群的一个代表性样本进行调查,以样本的统计量来估计总体参数所在的范围。即通过对样本中的研究对象的调查研究来推断其所在总体的情况
优点
具有节省时间、人力和物力资源等优点
由于调查范围小,调查工作易于做得细致
缺点
抽样调查的设计、实施与资料分析均比普查要复杂
资料的重复或遗漏不易被发现
不适用于抽样调查
对于变异过大的研究对象或因素和需要普查普治的疾病
很难抽到有代表性的样本
患病率太低的疾病(因为需要很大的样本量,如果抽样比大于75%。则不如进行普查)
抽不到病例
影响样本量的因素
预期现患率(p)
精确性:容许误差d↑,样本量↓
显著性水平(α):α↓,样本量↑
求样本量
当α=0.05,d=0.1×p,Z=1.96≈2时,n=400×q/p
p为预期的现患率,q=1-p
总结
因为需要很大的样本量,如果抽样比大于75%→普查。抽样调查的基本要求是能将从样本获得的结果推论到整个群体(总体),抽样必须随机化,样本量要足够
随机抽样方法
单纯随机抽样
定义:从总体N个对象中,利用抽签或其他随机方法(如随机数字)抽取n个,构成一个样本
重要原则:总体中每个对象被抽到的概率相等(均为n/N)
样本量的估计
若已知总体率
则无限总体抽样公式如下,δ为容许误差,π为总体率
若总体均数已知
无限总体的样本量计算公式如下,
有限总体需在其基础上进行校正
标准误计算
均数的标准误
率的标准误
s为样本标准差,p为样本率,N为总体含量,n为样本量,n/N为抽样比,若小于5%可忽略不计
最简单,最基本的抽样方法。是其他抽样方法的基础。
系统抽样
定义:又称机械抽样,是按照一定顺序,机械地每隔若干单位抽取一个单位的抽样方法。
优点
可以在不知道总体单位数的情况下进行抽样
在现场人群中较易进行
样本是从分布在总体内部的各部分的单位中抽取的,分布比较均匀,代表性较好
缺点
假如总体各单位的分布有周期性趋势,而抽取的间隔恰好与此周期或其倍数吻合,则可能是样本产生偏性
计算:系统抽样标准误的计算可用单纯随机抽样的公式代替。
分层抽样
定义:是指先将总体按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本
层内变异越小越好,层间变异越大越好
优点
可以提高总体指标估计值的精确度。(它可以将一个内部变异很大的总体,分成一些内部变异较小的层(次总体))
分层抽样比单纯随机抽样所得的结果精确度更高。组织管理更方便,而且它能够保证总体中每一层都有个体被抽到
除了能估计总体的参数值,还可以分别估计各个层内的情况
分类
按比例分配
各层内抽样比例相同
最优分配
各层抽样比例不同,内部变异小的层抽样比例小,内部变异大的层抽样比例大,此时获得的样本均数或样本率的方差最小。
计算
估算总体率所需样本量:
Wi=Ni/N为第i层的例数、pi阳性率、qi阴性率、N总例数、v为估计总体率的方差,δ为容许误差
第i层样本量:
估计总体均数所需样本量
第i层的样本量:
整群抽样
定义:是将总体分成若干群组,抽取其中部分群组作为观察单位组成样本。
分类
单纯整群抽样:被抽到的群组中的全部个体作为调查对象
二阶段抽样:通过再次抽样后调查部分个体
特点
易于组织,实施方便,可以节省人力、物力
群间差异越小,抽取的群越多,则精确度越高
抽样误差较大,故通常在单纯随机抽样样本量估计的基础上再增加1/2
多阶段抽样
定义:将抽样过程分阶段进行,每个阶段使用的抽样方法往往不同。即将以上抽样方法结合使用,其在大型流行病学调查中常用
优点
充分利用各种抽样方法的优势,克服各自的不足,并能节省人力物力
缺点
在抽样之前要掌握各级调查单位的人口资料及特点
现况研究的偏倚及控制
偏倚:指从研究设计与实施得到数据处理和分析的各个环节中产生的系统误差,以及结果解释、推断中的片面性导致的研究结果与真实情况之间出现的倾向性的差异,进而导致对暴露与疾病之间联系的错误描述。
研究设计➡️数据处理➡️结果解释
研究结果不等于真实情况
产生原因
主观选择研究对象。即选择研究对象具有随意性,将随机抽样当做随意抽样。
任意变换抽样方法,如原本根据出院号来随机选择抽样,之后又改用入院号等其他方法来抽样。
无应答偏倚:调查对象因不愿意合作或其他种种原因,不能或不愿意参加调查,从而降低了应答率。如果应答率低于70%,就难以用调查结果来估计整个研究总体的情况
幸存者偏倚:所调查到的对象均为幸存者,使得调查结果有一定的局限性和片面性,不能全面反映实际情况
选择偏倚:导致研究样本缺乏代表性,而使研究结果不能外推。
报告偏倚:询问调查对象有关问题时,由于种种原因回答不准确
回忆偏倚:调查对象对过去的暴露史或疾病史等回忆不清,特别是健康的调查对象,由于没有疾病的经历,而容易将过去的暴露情况等遗忘
调查偏倚:调查员有意识的深入调查某些人某些特征。而不重视或马虎对待其他人的这些特征。
测量偏倚:在资料收集过程中,测量工具、检验方法不正确,化验操作不规范等。
混杂因素的存在也可以导致偏倚的发生
控制
有效的质量控制的前提:研究设计时要反复论证,尽量设计严密。并要考虑到调查中或调查结束时对资料进行质量评价的方法和指标。
重点强调以下几个方面
严格遵照抽样方法的要求,确保抽样过程中随机化原则的切实实施
提高研究对象的依从性和受检率
正确选择测量工具和测量方法,包括调查表的编制等
组织好研究工作,调查员一定要经过培训,统一标准和认识
做好资料的复查,复核等工作
选择正确的统计分析方法,注意辨析混杂因素及其影响。
生态学研究的概念、类型、特点、用途
定义:在群体的水平上研究某种暴露因素与疾病之间的关系,以群体为观察和分析的单位,通过描述不同人群中某因素的暴露状况与疾病的频率,分析该暴露因素与疾病之间的关系。
特点
在收集病和健康状况以及某暴露因素的资料时,不是以个体为观察和分析的单位,而是以群体为单位的(如国家,城市,学校等),这是生态学研究最基本的特点。
该类研究虽然能通过描述不同人群中某因素的暴露情况与疾病频率来分析该因素与疾病的关系,但无法得知个体的暴露与效应(疾病)间的因果关系。
生态学研究是从许多因素中探索病因线索的一种常用方法,然而喜提供的信息是不完全的,只是一种粗线条的描述性研究。
用途
提供病因线索,产生病因假设
被广泛应用于慢性病的病因学研究,或环境变量与人群疾病(健康)状态关系的研究。为研究假设建立提供依据。
评估人群干预措施的效果
在疾病监测工作中,可应用生态学研究来估计监测疾病的发展趋势,为制定疾病预防与控制的策略和措施提供依据。
总结
类型
生态比较研究
定义:是指观察不同人群或地区某种疾病的分布,然后根据疾病分布的差异提出病因假设
是生态学研究中应用较多的一种方法
其中最为简单的方法是:观察不同人群或地区某种疾病的分布,然后根据疾病分布的差异提出病因假设。
一般情况下,这种研究不需要暴露情况的资料,也不需要复杂的资料分析方法。如描述胃癌在全国各地区的分布,发现沿海地区的胃癌死亡率较其他地区高,从而提出沿海地区环境或饮食结构等可能是胃癌的危险因素之一。
常用:比较在不同人群中某因素的平均暴露水平和某疾病频率之间的关系。即比较不同暴露水平的人群中疾病的发病率或死亡率的差别。了解这些人群中暴露因素的频率或水平,并与疾病的发病率或死亡率作对比分析,从而为病因探索提供线索。
环境流行病学研究中常采用生态比较研究的方法
此法也可应用于评价社会设施,人群干预以及在政策、法令的实施等方面的效果
生态趋势研究
定义:连续观察人群中某因素平均暴露水平的改变与某种疾病的发病率、死亡率变化的关系,了解其变动趋势,通过比较暴露水平变化前后疾病频率的变化情况,来判断某因素与疾病的联系。
由于在生态学研究中一般可获得疾病的发病率,故在生态学研究资料分析中也可引入相对危险度(RR)、人群归因危险度(PAR)等评价指标来进行分析。
来源
地理信息系统的应用
大数据的应用
优缺点
优点
1、生态学研究常可应用常规资料或现成资料(如数据库)来进行研究。因而节省时间、人力和物力,且可以较快得到结果。
2、生态学研究对病因未明的疾病可提供病因线索供深入研究。这是生态学研究最显著的特点
3、对于个体的暴露剂量无法测量的情况,生态学研究是唯一可供选择的研究方法
4、当研究的暴露因素在一个人群中变异范围很小时,很难测量其与疾病的关系。这种情况下更适宜采用多个人群比较的生态学研究。如研究饮食结构与若干癌症的关系研究等。
5、生态学研究适用于对人群干预措施的评价。例如通过综合方式(如健康教育与健康促进等)减少人群对于危险因素的暴露,对此干预措施的评价只需在人群水平上进行
在疾病监测工作中,应用生态趋势研究可估计某种疾病发展的趋势。
缺点
生态学谬误
混在因素往往难以控制
存在多重共线性问题
难以确定两变量之间的因果联系
生态学谬误
在生态学研究中,生态学谬误是此类研究最主要的缺点
原因:他是由于生态学研究以各个不同情况的“个体”集合而成的“群体"(群组)为观察和分析的单位,以及存在的混杂因素等原因而造成研究结果与真实情况不符。
生态学研究提示的病因线索既可能是疾病(或其他卫生事件)与某因素之间真实的联系,也可能是由个体到群体观察后所造成的一种虚假联系,反之亦然。
产生原因
1、缺乏暴露与结局联合分布的资料。研究者只知道每个研究人群内的暴露和非暴露人群量,发生研究结果和未发生数,但不知暴露、非暴露人群中各有多少个体发生了研究结局,即无法在个体水平确定暴露与研究结局联合分布的信息
2、无法控制可疑的混杂因素。由于它是在群体水平上进行观察分析的研究,因此无法对个体水平上混杂因素的分布不均进行控制。
3、相关资料中的暴露水平只是近似值或平均水平,并不是个体的真实暴露情况,无法精确评价暴露与连疾病的关系,造成对暴露与研究结局之间关系的一种曲解。
现况研究的设计与实施
明确研究的目的
了解健康状况分布or开展群体健康调查
明确研究的类型
普查or 抽样
确定研究对象
儿童/就诊个体/特殊人群
确定样本含量和抽样方法
样本量
决定因素
预期患病率(p)
对调查结果精确性的要求:即容许误差(d)越大,所需的样本量越小
要求的显著性水平(α):α值越小,即显著性水平要求越高,样本量要求越大
计数资料的计算
(一般的,在做某病的现患率调查时,样本量可用该式估计)
(经转换,可得该式)
(q=1-p)
以上样本量估计公式仅适用于n×p>5的情况,如果n×p≤5则宜用Poisson分布的办法来估算样本量
计量资料的计算
如抽样调查的分析指标为计量资料,则应按计量资料的样本估计公式来计算(s为总体标准差的估计值)
计算题只要求记住:N=400✖️q/p(p=预期患病率)
适用条件:a=0.05时,d=0.1p,Z=1.96=2时
抽样方法
非随机抽样
eg.典型调查
典型抽样仅能反映调查地区/人群的情况,难以推广
随机抽样
随机抽样的样本获得须遵循随机化原则,即保证总体中每个对象都有已知的、非零的概率被选为研究对象。以保证样本的代表性
若样本量足够大,调查数据可靠,分析正确。则可以把调查结果推论到总体
资料收集
确定拟收集资料的内容
个人的基本情况:年龄,出生日期,性别,民族,文化程度,婚姻状况,家庭人口数及结构组成、家庭经济状况等
职业情况:具体工作性质,种类,职务,从事该工作的年限,与职业有关的特殊情况等。
生活习惯及保健情况:饮食情况,吸烟史及量,饮酒史及量,个人对自我保健的重视程度及开展情况,医疗保健条件,体育锻炼情况等
妇女生育情况:月经史,生育史,使用避孕药物及激素的情况等。
环境资料:生活环境和工作环境的某些数据,最好用客观的、数量化的指标表示。
人口学资料
调查员培训
资料的收集方法
三种
1、通过实验室测定或检查的方法来获得
2、制调查表后对研究对象进行调查,进而获得暴露或疾病的资料
3、利用常规资料
具体
常规登记和报告:利用疾病报告登记,体检记录,医疗记录或其它现有有关记录的资料
专题询问调查与信函调查:根据调查目的和疾病种类制定调查表。调查中应注意调查对象的“无应答率”,一般不得超过30%,否则样本的代表性差,可能影响结果的真实性。
临床检查及其他特殊检查的有关资料:收集各种医学检查数据和为特殊目的进行的检查。
数据整理与分析
1、仔细检查这些原始资料的完整性或准确性,对原始资料进行检查与核对,并进行逻辑检错,以提高原始资料的正确性。
2、按照卫生统计学和流行病学的专业需要,进行原始资料的整理。如:划分组别、制定整理表和统计表等
3、对于连续变量的数据,了解数据的分布类型;非正态分布的数据,进行适当的数据转换,以求转换后数据呈正态或近似正态分布。如果数据人称非正态分布,可以考虑将数据转换成分类变量进行统计分析,或者用非参数统计分析方法
4、计算各种率,常用现患率、阳性率、检出率等,定量资料还可以计算平均数等
5、计算标化率,即分析结果时,为了便于不同地区的比较,常采用率的标准化方法。
6、应用流行病学的原理与方法,采用分类、分析、综合、比较和各种归纳推理方法,通过单因素分析和多因素分析的技术来研究分析疾病或健康状况的规律性。
两种思路
以是否暴露为分组依据进行比较分析研究
以是否患病为分组依据来进行比较分析研究
知识陷阱
普查和抽样调查的优缺点
现况研究的偏倚与控制
随机抽样方法
现况研究与生态学研究的优缺点