导图社区 机器学习衍生的胆石症所致急性胆管炎患者预后的在线预测模型
这是一篇关于机器学习衍生的胆石症所致急性胆管炎患者预后的在线预测模型:在的思维导图,主要内容包括:补充材料,表不如图,字不如表,摘要,题目。
编辑于2024-10-03 23:39:30机器学习衍生的胆石症所致急性胆管炎患者预后的在线预测模型:在两个回顾性队列中开发和验证
题目
Machine-learning-derived online prediction models of outcomes for patients with cholelithiasis-induced acute cholangitis: development and validation in two retrospective cohorts
摘要
背景/目的
胆石症引起的急性胆管炎( CIAC )是一种预后较差的急性炎症性疾病
本研究旨在创建机器学习( ML )模型来预测CIAC患者的结局
方法
在这项回顾性队列和ML研究中,根据国际疾病分类( ICD )第9版修订,同时符合"胆管炎"和"胆囊或胆管结石"诊断,或根据ICD第10版修订,在单次住院期间符合"胆管结石伴急性胆管炎伴或不伴梗阻"诊断的患者被纳入重症监护医学信息集市数据库,该数据库记录了2001年6月1日至2022年11月16日期间美国马萨诸塞州Beth Israel Deaconess医疗中心的患者入院情况
该研究集中于三个主要终点,包括院内死亡率、出院后 30 天内再次入院以及出院后 180 天内死亡率
为了减轻因缺失数据而产生的偏差,在数据收集阶段排除了表现出超过 20% 缺失值的因素
采用多重插补 (MI) 技术来解决剩余变量中的缺失值以供分析
在 CIAC 患者的训练子集中,通过单变量逻辑回归确定了与结果独立相关的变量
排除非急诊入院、入院后24 h内未行胆道引流、年龄小于18岁、信息丢失超过20 %的患者
采用9种机器学习方法对患者院内死亡率、出院后30 d内再入院率、出院后180 d内死亡率进行预测
选取2019年1月1日至2023年7月30日期间在东南大学附属中大医院就诊的患者作为外部验证集
受试者工作特征曲线下面积是模型性能评价的主要指标
共纳入1156例患者构建模型
对所有患者、入住重症监护病房( ICU )的患者和在ICU治疗期间进行胆道引流的患者进行了分层分析
从186个变量中筛选出13 ~ 16个特征用于模型训练
结果
XGBoost方法显示出最佳的预测效能,训练集AUROC为0.996 (院内死亡率),0.886 (出院后30天内再入院率)和0.988 (出院后180天内死亡率)
0.998,0.933和0.988 (入住ICU患者)
0.987,0.908和0.982( ICU治疗期间行胆道引流患者)
在内部验证集中,所有患者院内死亡率的AUROC达到0.967,出院后30天内再入院率的AUROC达到0.589,出院后180天内死亡率的AUROC达到0.857
入住ICU患者的AUROC达到0.963、0.668、0.864
ICU治疗期间行胆道引流患者的AUROC达到0.961、0.669、0.828
61例患者组成的外部验证集的AUROC值分别为0.741、0.812、0.848
结论
XGBoost模型有望成为预测CIAC患者预后的工具,具有较好的临床适用性
基于XGBoost模型构建了一系列用户友好的在线预测平台,可以追踪CIAC患者的多个短期或长期临床结局,这需要多中心队列和更大样本量的进一步验证
字不如表
Table 1
包括所有患者的基线特征
Table 2
不同的结果对应于不同的患者类别
Table 3
用于预测与患者类别相对应的各种结果的最佳机器学习算法
Table 4
链接到预测CIAC患者不同结局的网络工具
表不如图
Figure 1
研究的总体流程图( a )
研究的算法图( b )
Figure 2
基于SelectFromModel算法的特征选择
对所有入住ICU的患者以及ICU治疗期间接受胆道引流的患者,在构建院内死亡率、入院后30天内再次入院的预测模型时,分别选择16、13、15和15、14、16个变量
对所有患者进行综合分析后,发现13个关键变量对院内死亡的发生影响最大
横轴代表每个变量的名称,纵轴代表每个变量的重要性
所有患者的结果(a-c):院内死亡率、出院后 30 天内再次入院以及出院后 180 天内死亡率
入住 ICU 患者的结果 (d–f)
ICU治疗期间接受胆道引流的患者的结果(g-i)
Figure 3
九个模型的ROC曲线和PR曲线
所有患者的结果:院内死亡率(a-c)
出院后 30 天内再次入院(d-f)
出院后 180 天内死亡率(g-i)
Figure 4
XGBoost以及除XGBoost之外预测效果最有争议的模型的决策曲线分析
AdaBoost,自适应增强
所有患者的结果:院内死亡率(a)、出院后30天内再次入院(b)、出院后180天内死亡率(c)
Figure 5
Web 工具使用示例
通过输入 ICU 治疗期间接受胆道引流的单个患者的 15 个临床参数来进行院内死亡率预测,从而表明预后不良
补充材料
Figure S1
九个模型的接收者操作特征曲线(a-f)和精确率-召回率曲线(g-l)
入住 ICU 患者的结果:院内死亡率 (a, g)、出院后 30 天内再次入院 (b, h) 以及出院后 180 天内死亡率 (c, i)
ICU治疗期间接受胆道引流的患者的结果:院内死亡率(d,j),出院后30天内再次入院(e,k),出院后180天内死亡率(f,l)
Figure S2
XGBoost以及除XGBoost之外预测效果最有争议的模型的决策曲线分析
入住 ICU 患者的结果 (a-c):院内死亡率、出院后 30 天内再次入院以及出院后 180 天内死亡率
ICU治疗期间接受胆道引流的患者的结果(d-f)
Figure S3
外部验证集中 XGBoost 的接收者操作特征曲线
中大医院ICU治疗期间接受胆道引流的患者结局:院内死亡率(a)、出院后30天内再次入院(b)、出院后180天内死亡率(c)
Table S1
入住 ICU 的患者的基线特征 (n=652)
Table S2
ICU 治疗期间接受手术的患者的基线特征 (n=614)
Table S3
中大医院采集的变量数据单位与MIMIC数据库现有数据单位换算关系汇总表
Table S4
分析导致所有患者不同结果的因素(n=1156)
具有不同预后结果的患者之间的特征差异详见补充表 S4
Table S5
出院后 30 天内重新入院的患者的基线特征 (n=262)
Table S6
30天内再次入院的患者是否会在出院后180天内死亡的因素分析(单变量logistic回归,n=262)
Table S7
30天内再次入院的患者是否会在出院后180天内死亡的因素分析(多因素logistic回归分析,n=262)
Table S8
分析30天内再次入院的患者是否会在出院后180天内死亡(排除院内死亡,n=1104)
Table S9
导致入住 ICU 患者不同结局的因素分析(n=652)
Table S10
ICU治疗期间接受手术的患者不同结局的影响因素分析(n=614)
Table S11
根据与各种患者类别对应的数据分布类型分类的变量
Table S12
不同患者类别对应不同结局的影响因素(P<0.1)
Table S13
特征选择后最终纳入每个模型的变量摘要
Table S14
机器学习算法的性能(预测所有患者的院内死亡率)
Table S15
机器学习算法的性能(预测所有患者出院后 1 个月内再次入院)
Table S16
机器学习算法的性能(预测所有患者出院后 180 天内的死亡率)
Table S17
机器学习算法的性能(预测入住 ICU 患者的院内死亡率)
Table S18
(预测入住 ICU 的患者出院后 1 个月内再次入院)
Table S19
(预测入住 ICU 的患者出院后 180 天内的死亡率)
Table S20
机器学习算法的性能(预测 ICU 治疗期间接受手术的患者的院内死亡率)
Table S21
(预测 ICU 治疗期间接受手术的患者出院后 1 个月内再次入院)
Table S22
(预测 ICU 治疗期间接受手术的患者出院后 180 天内的死亡率)
Table S23
中大医院ICU治疗期间接受胆道引流的患者变量(n=61)