导图社区 高质量或低质量碳水化合物与抑郁症状的关联及基于XGboost
这是一篇关于高质量或低质量碳水化合物与抑郁症状的关联及基于XGboost的思维导图,主要内容包括:补充材料,表不如图,字不如表,摘要,题目。
编辑于2024-08-27 18:26:03高质量或低质量碳水化合物与抑郁症状的关联及基于XGboost算法的社会经济-饮食因素模型:来自NHANES 2007 - 2018
题目
Association between high or low-quality carbohydrate with depressive symptoms and socioeconomic-dietary factors model based on XGboost algorithm: From NHANES 2007–2018
摘要
背景/目的
抑郁症状是一个严重的公共心理健康问题,而膳食摄入通常被认为与抑郁症状相关
膳食碳水化合物的质量与抑郁症状之间的关系尚不清楚
探讨高、低质量碳水化合物与抑郁症状之间的关系,并尝试利用机器学习构建预测抑郁症状的整合模型
方法
NHANES 共4 982个样本纳入本研究
通过24小时膳食回顾评估碳水化合物摄入量,并使用患者健康问卷- 9 ( PHQ9 )评估抑郁症状
采用方差膨胀因子( VIF )和Relief - F算法进行变量特征选择
通过六个周期的筛选,排除可能与其他变量存在协方差的变量
其余 26 个变量包含在 Relief-F 模型中
本研究选择了权重值> 0.001的11个变量
所有分析均使用 EmpowerStats 软件、R 版本 4.2.2 和 MATLAB 2022b 进行
使用了所有 4,982 个样本来构成训练数据集
随后,为了评估模型的预测准确性,随机选择包含30%数据的子集作为预测集
结果
多元线性回归结果显示,高质量碳水化合物与抑郁症状(β = -0.147)呈负相关,低质量碳水化合物与抑郁症状(β : 0.018)呈正相关
利用XGboost模型制作了抑郁症状综合评估模型,并开发了相应的在线工具( http://8.130.128.194:5000/ )对抑郁症状进行临床评估
结论
碳水化合物质量与抑郁症状相关,将饮食与社会经济因素相结合的机器学习模型可以作为预测抑郁症严重程度的工具
优质碳水化合物摄入量与抑郁症状也呈正相关;低质量碳水化合物摄入量与抑郁症状之间存在负相关性
即使在调整其他重要变量后,这种负相关性仍然存在
字不如表
Table 1
参与者特征采用PHQ9 (加权),NHANES 2007 - 2018
无
低
中
重度
Table 2
所有变量的VIF
VIF1、VIF2和VIF3分别代表三个loop中不同的VIF值
六轮VIF中排除了总脂肪、能量、总胆碱、烟酸和总单不饱和脂肪酸五个变量
Table 3
调整β为抑郁症状与碳水化合物质量的连续变量和四分位数的关联
模型Ⅰ对高质量碳水化合物调整了吸烟和维生素K,对低质量碳水化合物调整了吸烟、咖啡因、糖尿病、性别和胆固醇
模型Ⅰ针对添加到该模型时使匹配β改变至少10%的特征进行了调整
模型Ⅱ调整了BMI、受教育程度、咖啡因、糖尿病、吸烟、性别、种族、维生素K和胆固醇
模型Ⅱ针对与抑郁症状显着相关的其他变量进行了调整
将膳食碳水化合物质量的四分位数转化为等级变量,分别赋值为0、1、2、3,然后将该等级变量带入回归模型,计算趋势P
Table 4
训练集和验证集的模型评估
R2(决定系数):该指标衡量可从自变量预测的因变量方差的比例
MAE(平均绝对误差):该指标衡量预测值与实际值之间的平均绝对差
MSE(均方误差):该指标计算预测值和实际值之间的平均平方差
RMSE(均方根误差):该指标是 MSE 的平方根
RPD(相对百分比差异):该指标将预测值与实际值之间的差异作为实际值的百分比进行比较
MAPE(平均绝对百分比误差):该指标衡量预测值与实际值之间的平均百分比差异
表不如图
Figure 1
研究过程示意图
Figure 2
研究人群的流程图
Figure 3
对Relief - F模型的24个特征进行权重评分
W[A] 越高表示预测能力越高。在本文中,绝对值大于0.001的W[A]被视为特征变量
Figure 4
对特征选择过程进行简要说明
计算各变量的VIF,若最大VIF值> = 5,则剔除VIF最大的变量
重复步骤1和步骤2,直到所有剩余变量的VIF < 5
经过6次循环后,排除( VIF > 5)中的5个变量 < 5
Figure 5
高质量或低质量碳水化合物与抑郁症状之间的限制性立方样条
横坐标表示膳食摄入量
纵坐标为碳水化合物质量与抑郁症状之间的β
Figure 6
测试集和验证集的模型图像
( a )为测试集图像,( b )为验证集图像
y轴代表抑郁症状,即PHQ9评分
x轴代表参与者的序列号( PHQ9从低到高依次为)
红色空心圆代表准确的PHQ9得分,实心蓝色圆点代表XGboost模型预测的PHQ9得分
补充材料
Table S1
优质碳水化合物和低质量碳水化合物的每参考单位
Table S2
针对不同变量制定详细的诊断标准
Table S3
参与者特征采用PHQ9(加权),NHANES 2007-2018
Table S4
抑郁症状与连续变量和碳水化合物质量四分位数关系的敏感性分析
抑郁症状亚组人群
Figure S1
XGboost模型的在线web实现