导图社区 脓毒症相关急性肾损伤危重症患者预后模型的构建与验证:可解释的
这是一篇关于脓毒症相关急性肾损伤危重症患者预后模型的构建与验证:可解释的的思维导图,主要内容包括:补充材料,表不如图,字不如表,摘要,题目。
编辑于2024-10-21 09:51:12这是一篇关于关系性研究的思维导图,涵盖了多种统计分析和方法。主要内容包括:ROC曲线,聚类分析,降维分析,回归分析,相关性分析。
这是一篇关于临床医学模型数据前处理流程的思维导图,主要内容包括:影像组学资料Imaging histologydata,体格测量指标Physical measurement indicator,生化检测指标Biochemical test index,人口学指标Demographic indicator。
这是一篇关于临床预测模型思路的思维导图,展示了临床预测模型的构建和评估过程,主要内容包括:人有我优,人多我比,人无我有。
社区模板帮助中心,点此进入>>
这是一篇关于关系性研究的思维导图,涵盖了多种统计分析和方法。主要内容包括:ROC曲线,聚类分析,降维分析,回归分析,相关性分析。
这是一篇关于临床医学模型数据前处理流程的思维导图,主要内容包括:影像组学资料Imaging histologydata,体格测量指标Physical measurement indicator,生化检测指标Biochemical test index,人口学指标Demographic indicator。
这是一篇关于临床预测模型思路的思维导图,展示了临床预测模型的构建和评估过程,主要内容包括:人有我优,人多我比,人无我有。
脓毒症相关急性肾损伤危重症患者预后模型的构建与验证:可解释的机器学习方法
题目
Construction and validation of prognostic models in critically Ill patients with sepsis-associated acute kidney injury: interpretable machine learning approach
摘要
背景/目的
急性肾损伤( acute kidney injury,AKI )
机器学习( machine learning,ML )
脓毒症相关AKI ( sepsis-associated AKI,S-AKI )
AKI 是脓毒症危重症患者常见的并发症,往往与不良预后相关
利用 ML 方法构建并验证可解释的 S-AKI 患者预后预测模型
方法
训练队列数据来源于MMIC-IV数据库2.2版建立模型,并提取浙江大学医学院附属杭州市第一人民医院患者数据进行模型外部验证
使用链式方程的多元插补来插补缺失值
使用递归特征消除(RFE)来确定死亡率的预测因素
本研究使用 RFE 算法从训练队列的数据中选择特征
这项研究分析了重症监护入院后 24 小时内的 78 个人口统计数据、生命体征和实验室指标特征;微生物培养;先进的生命支持数据
使用 RFE 的合并症。选择了 40 个特征来构建 ML 模型
对训练队列患者进行随机分组,并将 80% 分配给训练组,20% 分配给内部验证队列
使用合成少数过采样技术(SMOTE)和Tomek链接(SMOTETomek)技术对训练集进行预处理,以平衡正负类别
使用随机森林、极限梯度提升(XGBoost)、多层感知器分类器、支持向量分类器和逻辑回归分别建立重症监护病房(ICU)入院后7、14和28天的预后预测模型
使用受试者工作特征(ROC)曲线和决策曲线分析(DCA)评估预测性能
SHAP用于解释 ML 模型
结果
总共 2599 名 S-AKI 患者被纳入分析
选择了四十个变量用于模型开发
根据训练组的 ROC 曲线下面积 (AUC) 和 DCA 结果,XGBoost 模型表现出优异的性能
它还在外部验证队列中表现出了出色的辨别力
基于 SHAP 的汇总图和力图用于全局和局部解释 XGBoost 模型
结论
ML 是预测 S-AKI 患者预后的可靠工具
SHAP 方法用于解释 XGBoost 模型的内在信息,这可能在临床上有用,并帮助临床医生制定精确的管理
字不如表
Table 1
首次入ICU时训练队列患者的特征
阳性事件
表 1 中以 7 天为一组显示和比较变量
表 1 显示了基于 7 天组的训练队列的总体基线特征、生命体征和实验室参数
训练队列中 7 天内 S-AKI 患者的总体死亡率为 28% (n = 712)
Table 2
通过在模型中加入NT-proBNP和ST2,对60个月全死因死亡率进行综合判别改进和净重分类改进
表不如图
Figure 1
筛选流程图
Figure 2
为了过滤缺失数据,使用了Python 3.9.12软件中的missingno模块
缺失数据分布每列代表一个临床变量,白线代表缺失数据
每列中的行数越多,该变量的缺失值就越多
Figure 3
五个模型与训练队列中三组的 ROC 曲线比较
A:7天组,B:14天组,C:28天组
Figure 4
五个模型与训练队列中三组的性能比较
A:7天组,B:14天组,C:28天组
Figure 5
五种模型与训练队列中三组的 DCA 比较
五种预测模型的决策曲线分析(DCA)
显示了预后模型的净效益曲线
X 轴表示重症监护结果的阈值概率,Y 轴表示净效益
Figure 6
XGBoost 模型的 SHAP 方法的特征重要性分析 XGBoost 模型的 40 个特征的 SHAP 汇总图
Figure 7
力图将单个模型预测可视化为特征贡献的结果
基值代表平均预测结果
特征值和特征名称列在图底部
每组功能按照其影响程度从中心到两端进行排名
A:一名患者在入住 ICU 后 7 天内死亡
B:一名患者在入住 ICU 后 14 天内死亡
C:一名患者在入住 ICU 后 28 天内死亡
D:入住 ICU 28 天后幸存的患者
Figure 8
五个模型与外部验证队列中的三组的 ROC 曲线比较
Figure 9
五个模型与外部验证队列中三组的性能比较
补充材料
Additional file 1
缺失值信息
删除了缺失超过 30% 的观测值的变量,例如身高和血清白蛋白水平,以促进和确保研究准确性
Additional file 2
3个预测结局5种ML模型的超参数
Additional file 3
训练队列和外部验证队列的特征比较