导图社区 应用机器学习算法识别低骨密度人群
这是一篇关于应用机器学习算法识别低骨密度人群的思维导图,主要内容包括:补充材料,摘要,字不如表,表不如图,题目。机器学习模型证明了使用血液生物标志物对低BMD的有效分类。这可以为骨质疏松症的预防和管理提供临床决策支持。
这是一篇关于主动脉夹层(AD)的思维导图,主要内容包括:病理分型,病因,概念。帮助大家快速掌握该疾病的核心要点。
这是一篇关于抗凝治疗的思维导图,该思维导图以简洁明了的方式,对抗凝治疗的原则和常用药物进行了系统的梳理和介绍。
这是一篇关于抗血小板药物的思维导图,主要内容包括:环核苷酸磷酸二酯酶抑制剂,血小板糖蛋白IIb/IIIa受体拮抗剂(GPI),P2Y12受体拮抗剂,环氧化酶抑制剂。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
小儿常见病的辩证与护理
蛋白质
计算机操作系统思维导图
计算机组成原理
应用机器学习算法识别低骨密度人群
题目
Application of machine learning algorithms to identify people with low bone density
摘要
背景/目的
旨在开发一种机器学习算法,利用容易获得的人口统计学和血液生化数据,有效地识别低骨密度人群
方法
采用NHANES 2017 - 2020数据,选取股骨颈BMD数据完整的50岁以上受试者
删除缺失值大于30 %的变量,利用R软件中的MI包对缺失值小于30 %的变量进行多重插补
该队列被随机分为训练集( 70 % )和测试集( 30 % )
Lasso回归选择变量纳入在训练数据上建立的6个机器学习模型中
Logistic回归( LR )
支持向量机( SVM )
梯度提升机( GBM )
朴素贝叶斯( NB )
人工神经网络( ANN )
随机森林( RF )
将2013 - 2014周期的NHANES数据作为外部验证集输入到模型中,验证其泛化性
通过AUC、准确度、灵敏度、特异度、精密度和F1值来评估模型的区分度
校准曲线评价拟合优度
决策曲线决定临床效用
SHAP框架分析了变量的重要性
结果
本研究内部验证集共纳入3,545名参与者,其中1870名骨密度正常,1675名骨密度低下
若以λ . min作为最优λ值,最终模型中会包含41个变量,使得模型过于复杂,可能存在过拟合的风险
Lasso回归选择了19个变量
λ . 1se
在测试集中,AUC分别为0.785 ( LR )、0.780 ( SVM )、0.775 ( GBM )、0.729 ( NB )、0.771 ( ANN )和0.768 ( RF )
LR模型具有最佳的区分度和较好的校准曲线拟合度,决策曲线具有最佳的临床净获益,在外部验证数据集中也体现出良好的预测能力
LR模型中排名靠前的变量有:年龄、BMI、性别、肌酸磷酸激酶、总胆固醇和碱性磷酸酶
结论
机器学习模型证明了使用血液生物标志物对低BMD的有效分类。这可以为骨质疏松症的预防和管理提供临床决策支持
字不如表
Table 1
骨密度正常组与骨密度减低组一般特征的比较
Table 2
比较几种模型在测试集中的预测能力
Table 3
比较几种模型在训练集中的预测能力
表不如图
Figure 1
本研究的流程图
Figure 2
( A ) 59个变量的Lasso系数路径图
( B )交叉验证曲线(10倍交叉验证)
左虚线代表lambda.min,右虚线代表lambda.1se
Figure 3
6个模型在训练集( A )和测试集( B )的ROC曲线
Figure 4
测试集中6个模型的混淆矩阵
Figure 5
六种模型在训练集( A )和测试集( B )的校准曲线
Figure 6
六种模型在训练集( A )和测试集( B )中的决策曲线
Figure 7
( A ) LR模型的蜂群图。为每个变量生成SHAP值,并揭示其与低骨密度的关系
( B ) LR模型变量重要性排序图
补充材料
外部验证集中低和正常骨密度组研究参与者之间基线资料的比较
基于不同年龄组的研究对象基线特征比较
6组6个年龄段
几种模型在外部验证中的预测能力
年龄与低骨密度发生关系的限制性立方样条 图
年龄与各种血液生化指标关系的 RCS 图
12个
六个模型外部验证ROC曲线、校准曲线、决策曲线
六个模型外部验证混淆矩阵