导图社区 Logistic回归分析(bayan)
这是一篇关于Logistic回归分析(bayan)的思维导图
编辑于2022-10-02 20:33:45 新疆Logistic回归分析
适用条件
混杂因素较多时,分层分析方法无法处理。
医学中常常研究二分类变量或多分类变量Y与一组自变量的关系。
logistic回归分析已广泛应用于 横断面研究、队列研究、病例-对照研究中。
分类
按应变量类型
二分类logistic回归
有序分类logistic回归
无序分类logistic回归
按设计时是否匹配混杂因素
非条件logistic回归
条件logistic回归
Logistic回归的参数估计及假设检验
参数估计方法:极大似然值估计
假设检验方法
对整个回归模型:似然比检验
对每个回归系数:Wald卡方检验、比分检验、似然比检验、z检验
应用及注意事项
应用
预测和估计:Logistic回归分析可用于估计某个事件发生的可能性,也可分析某个问题的影响因素有哪些。 分析影响因素、控制混杂因素、分析交互效应:医学研究中,Logistic回归常用于对某种疾病的危险因素分析。像是分析年龄、吸烟、饮酒、饮食情况等是否属于2型糖尿病的危险因素。 判别分析
应用条件:二分类logistic回归:独立性、残差服从二项分布、影响因素与logistP呈线性
注意事项
变量的取值形式:无序分类变量分析必须引入哑变量,有序变量也可引入
样本含量:有足够的样本含量。配对资料,配对组数应为自变量个数的二十倍
模型评价
标准化回归系数
变量赋值
自变量赋值
二分类变量:不爆露于某因素为x=0,暴露于某因素为x=1
无序多分类变量:用多个二分类哑变量表示,设置参照变量
有序多分类变量
分组线性变量:以一个k等级变量赋值为0,1,...K-1进入模型
哑变量 :按无序多分类赋值
定量变量
线性变量:以数值形式直接纳入模型
二次或多次变量:将自变量取二次或多次方
分组线性变量:将自变量等级化后纳入模型
哑变量:将自变量等级化后按无序多分类变量赋值
应变量赋值
研究者关注的事件或结局赋值为1,与其对立赋值为0
若应变量赋值顺序相反,回归系数绝对值不变,符号相反
Logistic回归模型
建模策略
1.建模过程应从详细的各变量的单因素分析开始 2.对性质相同的一些自变量进行部分多因素分析,并探讨自变量 纳入模型时的适宜尺度,及自变量间的必要的一些变量变换 3.单变量分析和相关自变量分析基础上进行多因素的逐步筛选 4.多因素筛选模型基础上,考虑有无必要纳入变量的交互作用项 不同的分析思维、不同的统计方法所得模型可能不一样,应允 许多个模型并存,只要能较好地反映病因与疾病间的联系。
二分类(非条件)Logistic回归
一般形式
logit(p)=ln(p/1−p)=β0+β1X1+⋯+βmXm:用于对比自变量和应变量的作用大小
p=exp(β0+β1X1+⋯+βmXm)/1+exp(β0+β1X1+⋯+βmXm):用于估计和预测某件事的概率
回归系数解释
回归系数与OR值: OR = exp(β),或者β= ln(OR) β=0,OR=1,表示该因素对疾病的发生不起作用; β>0,OR>1,表示该因素是危险因素; β<0,OR<1,表示该因素是保护因素
βm:控制或固定其他自变量不变时,自变量Xm增加一个单位时的优势比的对数
条件Logistic回归
一般形式
logit(p)=β1X1+⋯+βmXm
除了无常数项和不可预测和估计以外,回归系数的解释、应变量及自变量的赋值参数估计和假设检验、建模策略等与非条件logistic回归相同。
条件logistic模型与非条件logistic模型的区别
1.设计类型不一样:条件(配比设计)非条件(独立无配比设计)2模型不一样:条件logistic模型无常数项 3.应用中条件logistic回归不可预测和估计