共纳入476例在2个中心接受手术治疗的感染性心内膜炎患者。开发队列包括276例患者
从89个潜在预测因子中选取8个变量作为XGBoost模型的输入来训练预测模型
将完成的预测模型在2个独立的队列中进行内部和外部验证
内部测试队列由独立于开发队列的125例患者组成,外部测试队列由来自另一个中心的75例患者组成
在任何分析之前,都排除了缺失记录超过5 %的潜在预测因子
对于其他变量,我们用个体连续变量的均值来代替缺失记录,用一个负的结果来代替个体分类变量的缺失记录
为了消除临床数据中潜在的多重共线性的不利影响,将所有分类变量输入 LASSO 回归模型进行多变量分析
为避免某些连续变量和分类变量之间的线性相关性带来的不利影响,将它们分开进行分析
在20个连续变量中,有3个变量是IE术后早期死亡的有统计学意义的预测因素
在69个分类变量中,LASSO回归模型保留了7个潜在预测因子
当前心力衰竭、中度或重度营养不良、UOB≥( + + )、舒张功能障碍、多瓣膜受累、三尖瓣受累和赘生物> 10 mm
为了说明XGBoost算法的优越性,基于训练-验证队列,使用8个变量构建了经典逻辑回归模型和集成学习模型