• •
宋欣芫1,常文秀1*,张文玉1,杨婷婷2,王恺2
SONG Xingyuan1,CHANG Wenxiu1*,ZHANG Wenyu1,YANG Tingting2,WANG Kai2
摘要: 背景 早期准确预测罹患终末期肾病(ESRD)的风险对医疗决策至关重要。在慢性肾脏病(CKD)领域,许多学者正从医学角度探讨各种因素和前 2 年估算肾小球滤过率(eGFR)下降百分比对 ESRD 发展的影响。传统的风险评估方法通常依赖于专家经验、简单的统计分析和有限的生物标志物,这些方法在处理复杂、多维度的健康数据时面临明显的局限,而采用机器学习算法,如人工神经网络可以显著提升风险预测的准确性、灵敏度和特异度。目的 基于多种算法探究 2 年临床参数平均水平和 2 年内 eGFR 变化率对 CKD 发展至 ESRD 的预测价值。方法 本研究数据集来自 2008—2014 年日本帝京大学医院的日本 CKD 群体回顾性队列,700 例患者入选研究队列。基于该队列获取两个数据集,分别是基线数据集和 2 年时间平均数据集。使用逻辑回归(LR)、多层感知机(MLP)、支持向量机(SVM)、极端梯度提升树(XGBoost)、卷积神经网络(CNN)算法预测患者是否会在数年后达到 ESRD,并得出概率。从数据和算法两个层面平衡数据集,使用对比试验证明医学上的意义。结果 将 LR、MLP、SVM、XGBoost 作为基准模型,对比试验表明,CNN 模型表现最佳,准确率为 94.8%,精确率为 80.3%,召回率为 78.2%,F1 分数为 78.4%。5 个模型在 2 年时间平均数据集上的评价指标明显高于基线数据集上的指标,尤其是召回率。此外,包含 2 年内 eGFR 下降率变量的模型优于不包含该变量的模型。在解决数据集类别不平衡的问题后,召回率有了很大程度的提高。结论 本研究证明基于 CKD 数据集的 CNN 模型可以指导医护人员做出更佳的临床治疗决策,前 2 年临床参数的平均水平和2年内 eGFR 下降百分比对预测透析事件具有重大意义,前 2 年的综合管理对于推迟发生 ESRD 至关重要。
中图分类号: