导图社区 基于机器学习算法构建肺癌患者化疗后肺部感染风险预测模型
这是一篇关于基于机器学习算法构建肺癌患者化疗后肺部感染风险预测模型的思维导图,主要内容包括:补充材料,表不如图,字不如表,摘要,题目。
这是一篇关于预测复发性心包炎患者的长期临床结果的思维导图,主要内容包括:补充材料,表不如图,字不如表,摘要,题目。
这是一篇关于老年急性冠脉综合征和心房颤动患者出血和缺血预后模型的开发和验证的思维导图,主要内容包括:补充材料,表不如图,字不如表,摘要,题目。
这是一篇关于心房颤动危重患者应激性高血糖比率指数与全因死亡率之间的关联的思维导图,主要内容包括:补充材料,表不如图,字不如表,摘要,题目。
社区模板帮助中心,点此进入>>
APPLE评分:一种新的、简单的预测心房颤动导管消融术后心律
一个新的列线图用于预测首次心房颤动导管射频消融术治疗患者的心
关于预测导管消融结果的新评分系统的提案:土耳其冷冻消融登记处
心房颤动的反复导管消融——如何预测结果?
重症监护病房非创伤性蛛网膜下腔出血患者7 d内死亡风险的机器
可解释机器学习模型预测儿童肺动脉高压30天再入院:一项多中心
心力衰竭人群中重度急性肾损伤的预测模型
基于机器学习的可穿戴数据对儿童注意缺陷多动障碍和睡眠问题的预测
SII联合UHR对急性心肌梗死经皮冠状动脉介入治疗术后造影剂
机器学习衍生的胆石症所致急性胆管炎患者预后的在线预测模型
基于机器学习算法构建肺癌患者化疗后肺部感染风险预测模型
题目
Construction of a risk prediction model for lung infection after chemotherapy in lung cancer patients based on the machine learning algorithm
摘要
背景/目的
本研究的目的是建立并验证一个基于机器学习的模型,用于预测肺癌患者化疗后肺部感染的可能性
方法
对502例接受化疗的肺癌患者进行回顾性研究
从病历中收集患者的年龄、体重指数、基础疾病、化疗周期、住院次数、各项血液检查结果等资料
使用合成少数类过采样技术( SMOTE )来处理不平衡数据
使用Boruta算法和最小绝对收缩和选择算子( LASSO )进行特征筛选
六种ML算法使用十折交叉验证方法来训练和开发ML模型
逻辑回归( LR )
随机森林( RF
高斯朴素贝叶斯( GNB )
多层感知机( MLP )
支持向量机( SVM )
K最近邻( KNN )
通过ROC 曲线、准确度、灵敏度、特异度、F1分数、校准曲线、决策曲线、临床影响曲线和混淆矩阵等指标对模型的性能进行评价
通过 SHAP 分析进行模型解释,以明确模型各特征的重要性及其决策依据
最后,构建了列线图,使预测模型结果更具有可读性
结果
Boruta和LASSO方法的整合确定了重要的预测因子
性别
吸烟
饮酒
化疗周期
胸腔积液( PE )
中性粒细胞-淋巴细胞计数比( NLR )
中性粒细胞-单核细胞计数比( NMR )
淋巴细胞( LYM )
中性粒细胞( NEUT )
与其他ML算法相比,LR模型性能最佳,AUC为0.888
SHAP方法确定了化疗周期和烟雾是影响ML模型预测的主要决策因素
本研究成功构建了交互诺模图和动态诺模图
结论
ML算法结合了人口统计学和临床因素,准确地预测了癌症患者化疗后肺部感染
LR模型表现良好,在临床实践中具有提高早期发现和治疗的潜力
字不如表
Table 1
研究变量的描述
36个预测因子
Table 2
基线表征与比较
SMOTE后基线
Table 3
训练集和测试集变异性分析
Table 4
Logistic模型的危险因素及其参数
纳入模型的9个预测变量的系数和比值比( OR )
表不如图
Figure 1
研究流程图
Figure 2
预测因子筛选结果
(A) Boruta
(BC) 两张图
(D) Boruta和LASSO之间的共同预测因子
Figure 3
六种不同预测模型的性能及比较
( A )训练集ROC曲线
( B )测试集ROC曲线
( C ) AUC值的森林图
( D )训练集的评价指标
( E )测试集的评价指标
Figure 4
逻辑回归模型的综合评价
训练集验证集校准曲线、决策曲线、临床影响曲线、混淆矩阵
临床影响曲线( Clinical Impact Curves,CICs ),以评估具有最高诊断价值的模型在临床效用和适用性方面的净增益
临床影响曲线(图4G , H)提供了模型在不同成本效益比阈值下预测高风险患者能力的信息
训练集和测试集曲线均显示,当阈值概率大于65 %预测评分概率值时,预测模型对化疗后肺部感染高危人群的判定与实际发生感染的人群高度匹配,证实该预测模型具有较高的临床有效性
Figure 5
逻辑回归模型的可解释性分析
( A )逻辑回归模型特征的SHAP树状图
( B )逻辑回归模型特征重要性排序图
2个独立样本的( C、D)可解释性分析
Figure 6
构造两个不同的诺模图
( A )交互式诺模图
( B ) 10种情景下风险分布的动态诺模图
补充材料
Table S1
单因素Logistic分析结果汇总