利用MIMICⅢ数据库和本研究所收集的数据,开发了6个机器学习模型
Logistic Regression ( LR )
Gradient Boosting Machines ( GBM )
Extreme Gradient Boosting ( XGB )
在本研究中,回顾性收集了548例确诊为SAH的患者,其中训练集341例,测试集207例
采用单变量和多变量logistic回归以及Pearson相关性分析来筛选患者的临床变量
然后将初步筛选的变量纳入机器学习模型,并对这些模型的性能进行评估
决定将单变量逻辑回归分析的结果纳入我们的机器学习算法中进行进一步分析
在测试集中对模型的性能进行测试,通过受试者工作特征曲线下面积( AUC )对模型性能进行评价,通过精确率-召回率( PR )曲线对不平衡数据进行评价,通过不同ML算法模型的准确率和校准曲线评价不同模型的预测性能
对于表现最好的模型,通过绘制夏普利加性解释( SHAP )来确定和报告模型参数的重要性
在这项研究中,使用Shapley值进行风险因素分析,以确定SAH患者7天内死亡的相关因素