导图社区 病例对照研究、队列研究(204的秘密)
队列研究 cohort study/前瞻性研究 prospective study/随访研究 follow-up study(是真实世界研究real world 。
编辑于2023-01-09 20:16:33 广东病例对照研究、队列研究
病例对照研究case-control study/回顾性调查
现在→过去 (初步探讨病因)
分析过程
1. 统计描述
2. 简单关联性研究方法
差异性分析:卡方检验队列研究简单关联性研究实操案例
采用卡方或Fisher确切概率法
单因素回归分析——logistic回归
3. 多因素Logistic回归分析方法
实操案例
病例对照研究分析过程:统计描述——单因素关联性分析——多因素关联性分析
队列研究 cohort study/前瞻性研究 prospective study/随访研究 follow-up study(是真实世界研究real world study 的主要方法之一)
现在→未来 (明确病因)
用途
病因研究
评价预后影响因素(治疗措施对预后的 影响)
暴露因素可以是发病因素,也可以是治疗措施(非干预性的,因为研究者只观察)
研究分类

1. 前瞻性队列研究(双前瞻)
2. 回顾性队列研究(从现在出现的 结局去回归性收集关于暴露的历史档案)
3. 双向性队列研究(1+2)
统计分析方法

定量结局的分析(t检验、F检验、秩和检验、相关分析→线性回归分析)
分类结局的分析
简单关联性分析
相对危险度( relative risk,RR)→直接表示风险大小
RR的概念与计算 RR值是医学研究最重要的效应值指标,没有之一。RR值,全称是相对危险度(Relative Risk),也就是暴露组相对对照组,结局阳性事件发生的风险程度,用于描述暴露因素与终点结局事件关联。 效应值方面,OR值、RR值和HR值堪称三剑客。其中,OR值已在之前篇章中详细阐述;HR是生存分析关键效应值,它将与Cox回归同时亮相;RR值应该是医学研究最重要的指标,队列研究能够计算出RR值。 RR大于1,说明暴露组相比对照组容易发生阳性事件,反之则说明暴露组不容易发生阳性事件。无论大于1还是小于1,说明暴露因素与结局有关。 它的算法是,暴露组阳性率与非暴露组阳性率率的比值。令a/m1=P1或者Pe,把c/m0=P0或者Pc,则: SPSS软件卡方检验不仅可以计算P值,同时也可以计算RR值。例如吸烟的案例卡方检验和RR值的计算: 卡方检验结果显示,P<0.001说明暴露组和对照组肺癌发生率存在着统计学差异,也说明RR值总体上不等于1。 计算RR值和95%CI 结果如下:RR=13.5,95%CI: 5.41-33.71。RR值置信区间不包括1,也说明RR总体不等于1。
RR值,是暴露组相对对照组,发生阳性事件的概率的倍数。
RR值>1,提示暴露是阳性事件发生的促进因素; RR值<1,提示暴露是阳性事件发生的阻碍因素; RR值=1,提示暴露对阳性事件发生无影响。
多因素关联性分析(回归分析方法)
Logistic回归 (logistic regression)—计算OR值

修正poisson回归(modified Poisson regression)—计算RR值
特别注意, 修正Poisson并非普通的Poisson,只有修正Poisson(modified Poisson 才能用于二分类的结局)
SPSS软件操作
 若在广义线性模型-预测变量-选项-升序(以赋值最大者为对照)/一般我们选择降序(以赋值最小者为对照),则你的结果 :P值不变,回归系数B值是负的,RR值是倒数 若在广义线性模型-估算-基于模型的估计量(一般Poisson 回归)/稳健估算量(修正Poisson回归) 若在广义线性模型-统计-包括指数参数估算值(则出现RR值,不选就没有RR值!)
OR值 会高估 RR

二分类或多分类的结局
队列研究回归方法(Poisson 回归、log-binomial回归),计算R值
代替方法 Logistic 回归,计算OR值
logistic回归只能计算OR值,怎么办? logistic回归是队列研究最重要最常见的方法,但是无法计算RR值,这不是意味着logistic回归方法就不适合队列研究? 不是的。 虽然Logistic回归分析得不到RR值,但是,第一,由于OR值和RR值一般比较接近,第二,OR值和RR值假设检验的结果一致,OR值具有统计学意义,则RR值也具有统计学意义,第三,Logistic方法软件操作更简单,因此我们经常使用Logistic回归计算OR来研究队列研究。 特别是:对于发病率很低的慢性病(如心脑血管疾病、恶性肿瘤等),由于P<<1,OR可作为RR的近似值估计:
生存时间治疗的结局
COX回归
队列研究基本统计分析步骤包括以下3步: 第1步,统计描述。总体描述人群的特征、分组情况、分组人数、随访时间、失访情况。 第2步,初步分析暴露因素与结局的关联性。根据结局的特征,暴露因素与结局的关联性,一般常用的条件与方法如下:
队列研究基本统计分析步骤包括以下3步: 第1步,统计描述。总体描述人群的特征、分组情况、分组人数、随访时间、失访情况。 第2步,初步分析暴露因素与结局的关联性。根据结局的特征,暴露因素与结局的关联性,一般常用的条件与方法如下:
队列研究结果呈现
按照暴露组和对照组进行分组。类数据构成比是暴露组内部加起来100%,对照组内部加起来100%。同时也计算了糖尿病患者的冠心病发生率为60.5%;没有糖尿病患者,冠心病发生率为49.6%。
这是病例对照研究与队列研究最重要的区别之一。
很多人怎么开展回顾性队列研究的呢(研究伊始结局已经出现(足痛、非足痛))?既然结局都已经出现了,那么就抽取足痛和非足痛的人凑一起,进行统计分析吧。 错在哪里?当然你抽取足痛与非足痛人群开展研究时,你的思维已经不是队列研究的思维,而是病例对照研究的思维,你的人群不是队列人群的目标人群。为什么?这是因为,当挑选痛与非足痛人群开展分析时,你已经排除了一大批人群。他们可能是失访的人群、愿接受随访的人群。实际上,这些人都是目标人群的重要组成部分。 只有从暴露因素出发,框定目标人群,选择队列样本人群,逐一随访各个体的结局(哪怕是失访,也是一个结局)。这才是正确的姿势。
浮动主题
logistics 回归分析

分类logistic回归分析类型
SPSS软件操作
 ①因变量:放入“是否患有冠心病(ca)” ②协变量:即自变量,放入年龄、性别、心电图表现、糖尿病、高血压 ③保存:可分别计算除预测值(即P值)和残差,残差包括原始残差和标准化残差  
结果分析
 好的模型,残差越小越好,残差均方越小越好。因此,logistic回归模型中,残差也是非常重要的评价指标。      
logistic回归拟合效果——“模型摘要”
Exp(B)的置信区间—OR值
1.要看阳性组赋值大还是小,对应性别大小(男/女)Exp(B)-较大的那一方赋值=风险提升的倍数。
规范描述
规范文字1:纳入年龄、心电图和性别等构建多因素Logistic回归方程。结果发现:心电图异常对冠心病的影响具有统计学意义(OR=3.40, 95%CI 1.81-6.37, P<0.001);年龄对冠心病的影响具有统计学意义(OR=1.09, 95%CI 1.03-1.15, P=0.001);性别对冠心病的影响具有统计学意义(OR=6.24,95%CI 2.50-15.56, P<0.001);高血压状况对对冠心病的影响具有统计学意义(OR=10.81,95%CI 4.15-28.20, P<0.001)。 规范文字2:纳入年龄、心电图和性别等构建多因素Logistic回归方程。结果发现:心电图异常等级增加将增加冠心病的风险,具有统计学意义(OR=3.40,95%CI 1.81-6.37, P<0.001);年龄越大冠心病风险越高,具有统计学意义(OR=1.09, 95%CI 1.03-1.15, P=0.001);相对女性,男性增加冠心病发生的风险,差异具有统计学意义(OR=6.24,95%CI 2.50-15.56, P<0.001);高血压增加冠心病的风险,差异具有统计学意义(OR=10.81,95%CI 4.15-28.20, P<0.001)。 特别提醒:Logistic回归OR值不能代表风险增加的准确倍数,因此文字描述,切勿说相对女性,男性增加冠心病风险5.24倍的说法。 
值得注意
要读懂统计结果表,读懂OR值,必须明确: (1)何为阳性事件。我们可能想当然认为阳性事件必然是冠心病发生;然而在SPSS分析中,阳性事件指的是数据库结局变量赋值较大的结局。在本例中,若是否有冠心病(ca)变量,如果(冠心病是0,未发生冠心病是1),那么未发生冠心病的是阳性事件。 是不是听起来特别别扭?我想要研究的是发生冠心病的风险呀!怎么办? 那就请诸位在构建数据库时,将所指认的阳性事件给予更高的赋值,高于阴性事件。对于二分类的结局,最好用0、1表示(0代表阴性事件,1代表阳性事件),保证你理念中的阳性事件与SPSS的阳性事件定义的统一,不容易出错。 (2)要明确自变量,谁为对照? 对于定量数据,比如年龄,b值代表x每增加一个单位,结局改变的量;OR值更有意义,OR代表,x增加一个单位,比如年龄增加一岁,阳性事件出现的概率将大约增加(OR-1)倍;对于年龄,比如年龄增加一岁,平均风险将增加0.091倍,这意味着,年龄越大,冠心病风险越高。 对于二分类定性数据,OR值也代表x增加一个单位,结局改变的量。比如性别,x增加一个单位,风险增加大约5.24倍。那么,如何理解此处“增加一个单位”的意思呢? 实际上指的是数据库性别变量赋值增加一个单位吗(性别变量从0增加1),风险增加大约5.24倍(不过不像年龄,性别变量x只能增加1次)。 很多时候,如此解释还别扭,我们更倾向寻找对照作为支点,进行比较分析。性别从0到1,那就是性别变量赋值为1和赋值为0的相比,风险增加5.24。0是什么?0是女性,而1是男性,那意味着是男性与女性相比,风险大概增加5.24倍。 SPSS统计分析在二分类自变量的影响时,默认是以自变量赋值较低作为对照,探讨赋值较大者能否相对能否增加阳性事件概率。 对于等级资料,其解释与定量数据无异,也就是X每加一个等级,比如年龄增加一岁,阳性事件出现的概率将增加(OR-1)倍左右;比如对于心电图异常情况变量,意味着心电图异常情况平均每增加一个等级,冠心病的风险将增加2.406倍左右。 此外,高血压变量在数据库中赋值为0=无高血压,1=有高血压,意味着对照组是无高血压,有高血压的病人与之相比,风险增加9.814倍左右。糖尿病无统计学意义。 总之,OR值是探讨SPSS数据库中自变量赋值较大者,对SPSS数据库中阳性事件(也是赋值较大者)的影响。如果不注意这
暴露因素:危险因素、保护因素
健康结局:疾病发生、发展、预后
阐明因果关系为主要目的的研究设计类型