在这项诊断研究中,ABCD 研究在美国 21 个地点收集了可穿戴数据和 K-SADS 数据
ABCD研究是一项大规模的纵向研究,涉及美国17个州23个数据采集点的9 ~ 11岁儿童
从最初的11 878例患者开始,11 235例患者在1年时发布了数据,6571例患者在2年随访时发布了数据
ABCD研究数据可在美国国立精神卫生研究所的数据信息库中获得
使用了 6571 名患者的筛查数据和 2 年随访中收集的 5725 名患者的 21 天可穿戴数据,并为每个参与者生成了基于昼夜节律的特征
本研究使用了6571例患者的筛查数据和5725例患者在2年随访时发布的21天可穿戴数据( ABCD移动设备)
提取20 %的训练数据作为留出测试集。在剩余的80 %数据中,70 %用于训练集,10 %用于验证集
考虑到训练数据集中预测类的比例高度不平衡,ADHD为6.62 %,睡眠问题为1.84 %,训练集包含了超集成Smote欠采样随机森林( hyperSMURF )算法的策略
27个hyperSMURF通过将不平衡数据划分为N个分区,保持比例为(例如,一个分层的k - fold),并使用合成少数类过采样技术对少数类进行平衡,对多数类进行欠采样来生成训练集
总共合并了 12 348 个 ADHD 的可穿戴数据和 39 160 个睡眠问题的可穿戴数据,用于开发 ML 模型
在有筛查数据的6571名儿童中,使用K - SADS的家长访谈,共有1090人( 16.6 % )被纳入ADHD分析
使用K - SADS的儿童访谈,共有3414人( 52.0 % )被纳入睡眠问题分析,其中68人( 1.0 % )被诊断
ADHD的训练数据由12,348个可穿戴数据( 1 , 090人; 79个作为诊断, 1011个作为对照)组成
睡眠问题由39,160个可穿戴数据( 3 , 414只; 68个作为诊断, 3 346个作为对照)组成
ML 模型的平均性能通过受试者工作特征曲线下面积 (AUC)、敏感性、特异性、阳性预测值 (PPV) 和阴性预测值 (NPV) 来衡量
从平均PPV和最高PPV来衡量ML模型预测ADHD和睡眠问题的性能