导图社区混杂偏倚研究（204的秘密）

混杂偏倚研究（204的秘密）

204的秘密：应对（潜在）混杂因素的策略：事先（常用于RCT研究）设计阶段的控制）：限制、随机分组和配对。

编辑于2023-01-09 20:14:34 广东

混杂偏倚研究

黑大瑞

他的近期作品查看更多>>

混杂偏倚研究（204的秘密）

社区模板帮助中心，点此进入>>

黑大瑞

他的近期作品查看更多>>

相似推荐
大纲

论语孔子简单思维导图
- 90.5k
- 948
- 1.1k
- 490
- 1
MindMaster
《傅雷家书》思维导图
- 135.6k
- 1.7k
- 2.7k
- 1.3k
- 0
MindMaster
《童年》读书笔记
- 46.7k
- 488
- 988
- 337
- 0
MindMaster
《茶馆》思维导图
- 13.7k
- 176
- 181
- 40
- 0
MindMaster
《朝花夕拾》篇目思维导图
- 26.8k
- 532
- 1.2k
- 300
- 0
MindMaster
《昆虫记》思维导图
- 35.3k
- 272
- 778
- 279
- 0
MindMaster
《安徒生童话》思维导图
- 19.9k
- 277
- 264
- 66
- 0
MindMaster
《鲁滨逊漂流记》读书笔记
- 22.6k
- 310
- 551
- 166
- 0
MindMaster
《这样读书就够了》读书笔记
- 99.6k
- 12.9k
- 9.0k
- 2.2k
- 0
Ethan
妈妈必读：一张0-1岁孩子认知发展的精确时间表
- 11.3k
- 1.8k
- 411
- 38
- 0
Ethan

混杂偏倚研究

偏倚

误差：随机误差（无法避免）系统误差（可以杜绝）：偏倚就是一类系统误差医学研究是抽样研究，据样本推断总体，获得总体上研究因素与结局的关系。但是整个推断过程中会由于各种原因导致“总体上研究因素与结局的关系”的失真，这一失真现象，称之为偏倚。

1. 选择偏倚（选样本无法代表总体）

RCT最常见选择偏倚

2. 信息偏倚（获得资料不正确）

3. 混杂偏倚（由于分组不均衡由其他干扰因素造成）

混杂偏倚

.什么样的因素才可以被称为混杂因素实际上混杂因素不仅要分组是否均衡，它总共要满足3个条件： 1) 与研究因素存在着相关或因果关系（本条件即为分组不均衡的结果） 2) 与结局存在因果关系 3) 不在研究因素与结局因果链上的之间（如果是，那么即为我们之前提过的中介变量）比如：研究某药物X的治疗肿瘤的效果(Z)，同时发现，药物X可能通过改变体内的物质Y而影响疗效由于非随机，药物X的使用还受到患者人口学、社会、经济因素(C)的影响。例如：由于分组不均衡，药物组多为中青年人群，对照组多为中老年人。如果药物效果较好，生存率较高，则年龄是典型的混杂因素(C)，而Y是中介变量。如何判断某个变量为混杂因素混杂因素三个条件，其中第1）和第2）条件一般可以通过统计学方法来解决，第三个条件则主要基于专业知识判断。 1)与研究因素存在着相关或因果关系采用t、卡方、方差、秩和 2)与结局存在因果关系采用线性（t检验）、logistic（卡方）、COX回归 3) 不在研究因素与结局因果链上的之间主要是专业判断举例：分析性别、吸烟对幽门螺杆菌（HP）的影响，判断性别是否是混杂因素 1）判断不同吸烟状态中性别分布是否不同吸烟人群，男性中比例更高；不吸烟人群中，女性比例更高；卡方检验结果，显示具有统计学差异 2)判断性别是否对Hp有影响：单因素logistic回归。结果显示，性别对HP影响有统计学意义（P<0.001），男性感染率更高。 3) 性别不在吸烟与HP因果链上的之间：从专业上判断成立。因为，如果性别在他们因果关系链上，会是什么情况？吸烟会通过改变性别，而影响HP感染率（Are you kidding？）因此，性别是混杂因素！实际操作上，该过程过于复杂，往往针对上述三个方面的两个方面来进行论证1）+3）或者2）+3），阳性结果称之为潜在混杂因素。潜在混杂因素在后期的统计分析过程中，很多时候比混杂因素更为常见。分组不均和和混杂偏倚一般情况下，观察性研究产生混杂的重要原因是分组不均衡。比如。病例对照研究，病例组和对照组之间分组不均衡的变量；队列研究，暴露和对照组分组不均衡的变量。分组不均衡意味着混杂偏倚的三个条件，满足了第一个条件。因此，凡事分组不均衡的变量，我都称之为潜在混杂因素（或者可疑混杂因素）。一般在统计分析中，我们需要简单到底哪些是干扰因素，一般不会严格鉴定是否混杂，但会挑选出潜在混杂因素。

应对（潜在）混杂因素的策略

1. 混杂偏倚控制的主要方法医学研究混杂偏倚的控制方法，根据研究阶段可以分为两类，事先控制和事后控制。事先：设计阶段控制：限制、随机分组和配对事后：资料分析阶段的控制：分层分析、多因素分析、倾向得分方法等限制(restrict)：指在设计阶段对研究对象的纳入标准加以限制使研究对象选取限制在一定范围内，范围越窄，研究对象彼此的差别越小，越利于观察因素作出结论。随机分配(randomized allocation)：主要适用实验研究，即将研究对象随机分配到试验组和对照组。随机分配可使研究对象的非处理因素和混杂因素在各组间趋于均衡，组间基线情况有良好的可比性，而使得处理因素的真实差别得以显示。配对或匹配(matching)：配对是控制混杂因素常用的方法。特别是在病例-对照研究中较常用。对病例组的每一个成员，选择具有相似特征(除了要观察的暴露因素)的对象为匹配的对照分层分析：是资料分析阶段控制混杂因素常用的方法。即将观察对象按照相似性的特点，分成亚组后再进行试验组和对照组的比较。分层因素主要为与比较指标有关的因素，如年龄、性别、病情等。按某混杂因素分层后，再用相应的统计方法进行处理。多因素分析方法：多因素回归是最常用，也是最成熟的混杂偏倚控制方法，特别是观察性研究。常用的多因素分析方法有多重线性回归、协方差分析、logistic回归模型、对数线性模型、Cox模型等其他高级方法：工具变量法、倾向得分方法。这俩方法近年来越来越流行，学有余力的朋友可以拓展学习。

事先（常用于RCT研究）设计阶段的控制）：限制、随机分组和配对

事后（常用于观察性研究）资料分析阶段的控制）：分层分析、多因素分析、倾向得分方法等

常见的事后统计策略

分层分析

协方差分析

多因素回归：线性、logistic、cox回归

更复杂的方法：倾向得分法、工具变量法等

如何剔除混杂因素