导图社区 生存分析
生存分析回归,详细的总结了生存资料概述,生存资料的统计描述,COX回归。感兴趣的小伙伴可以下载收藏哦~
多重线性回归(multiple linear regression) 是简单直线回归的推广,研究一个因变量与多个自变量之间的数量依存关系。多重线性回归用回归方程描述一个因变量与多个自变量的依存关系,简称多重回归。
“多元分析常用统计量 各变量(指标)间的描述统计量除了各变量间的均数、方差(标 准差)外,还需各变量间的协方差或相关系数 常以矩阵(matrix :是指纵横排列的二维或多维数据表格) 形 式表达多变量间关系,构成矩阵每个数据称为元素(
社区模板帮助中心,点此进入>>
论语孔子简单思维导图
《傅雷家书》思维导图
《童年》读书笔记
《茶馆》思维导图
《朝花夕拾》篇目思维导图
《昆虫记》思维导图
《安徒生童话》思维导图
《鲁滨逊漂流记》读书笔记
《这样读书就够了》读书笔记
妈妈必读:一张0-1岁孩子认知发展的精确时间表
生存分析
生存资料概述
生存分析基本概念
这类既要考虑结局又要考虑结局出现的时间的资料称为生存资料
生存分析是将观察的结局和出现结局所经历的时间结合起来进行分析的统计方法
生存三要素
起点事件
终点事件
时间的观测尺度
起点事件和终点事件是由研究目的决定的,在设计时就明确规定,并在研究期间严格遵守不能随意改变。
完全数据:指从观察起点到发生死亡事件所经历的时间,生存时间是完整确切的
生存时间观察过程的截止不是由于死亡或终点事件,而是由于其他原因引起的,称为截尾
截尾的主要原因
失访
退出
终止
重点
对截尾数据进行分析是生存分析的重要特点
生存分析,结局变量以1表示出现结局,0表示截尾
应变量有两个:生存时间t和结局变量(0-1)
生存资料的特点
蕴涵结局和时间两个方面的信息
结局为两分类互斥事件
通过随访观察,从某一时间点开始,观察到某规定时间点截止
常因失访等原因造成部分研究对象的生存时间数据不完整
分布类型复杂。需用生存分析
生存资料的基本内容
描述生存过程:研究生存时间的分布特点,估计生存率及其标椎误、绘制生存曲线
常用方法:乘积极限法和寿命表法
比较生存过程:获得生存率及其标椎误的估计值后,可进行两组或多组生存曲线的比较
常用方法时序检验
生存过程影响因素分析
常用多因素生存分析方法:COX比列风险回归模型
生存分析基本方法
统计描述
统计指标:生存率,中位生存时间
列表和绘画:生存曲线
统计推断
参数法:指数分布,威尔布分布
非参数法:log-rank检验(单因素分析)
半参数法:COX回归(多因素分析)
生存资料的统计描述
基本概念
死亡概率:记为q,是指在某单位时段开始时存活的个体在该时段内死亡的可能性大小
生存概率:记为p,与死亡概率相对立,表示在某单位时段开始时存活的个体到该时段结束时仍存活的可能性大小
生存率:指观察对象活过tk时刻的概率
中位生存时间:又称半数生存期,指生存率为0.5时对应的生存时间,表示有50%的观察对象可活这么长时间。
统计描述的常用方法
乘积极限法
称为K-M法
小样本资料或大样本未分段资料
寿命表法
大样本分段资料
生存分析的基本要求
样本应由随机抽样得到,要保证一定的样本含量
死亡例数不宜太少
截尾例数不宜太多
生存时间应尽可能精确
对数秩检验(log-rank)注意事项
属于单因素分析方法,适用于两组及多组间的比较
可用于时间未分组的资料,也可用于时间分组资料
效应比较:各组生存曲线的高低及中位生存时间判断
需满足生存资料的基本要求,且各样本生存曲线不能交叉
生存曲线若出现交叉,则提示可能存在混杂因素,应用分层对秩数检验或COX比列风险回归模型进行分析
COX回归
模型的一般形式
相对危险度RR:两个风险函数(率)之比(风险比)
回归系数的解释
其他自变量固定不变时,自变量Xi每改变一个单位,得到的相对危险度RR的对数值
RR=exp(p)
β>0,RR>1,危险因素
β=0,RR=1,无作用
β<0,RR<1,保护因素
RR的解释与自变量的编码有关
COX回归应用条件
独立性
等比例风险
风险比与时间无关,为常数
自变量的取值及作用大小不随时间变化而变化
对数线性
自变量与对数风险比呈线性关系
回归系数估计及假设检验
回归系数的估计-极大似然法
假设检验方法
模型-似然比检验
回归系数的检验
Wald卡方检验
似然比检验
比分检验
Z检验
回归分析应注意的问题
等比例风险的假定
影响因素各水平的生存曲线无交叉
协变量与时间交互项无统计学意义
回归系数的解释,变量赋值与编码,假设检验,建模策略等与logistic回归类似
样本含量估计
注意时依协变量COX模型