• •
夏莹1,2,俞家杨1,2,郭申奥1,2,洪忻1*
摘要: 背景 心血管病(CVD)是全球发病和死亡的首要原因,颈动脉斑块(CP)作为动脉粥样硬化的重要标志物可用于预测心血管事件,但传统超声筛查在大规模人群中受限,探索机器学习预测模型有助于实现CP的早期识别与CVD防控。目的 探索基于CVD高危人群构建CP风险的机器学习预测模型。方法 选取“江苏省心血管病高危人群早期筛查与综合干预项目”中南京市2023年9月至2025年8月的人群数据,按7:3比例随机划分训练集与测试集,以CP为结局,分别构建逻辑回归(LR)、类别提升(CatBoost)、极限梯度提升(XGBoost)、弹性网络(EN)、支持向量机(SVM)模型。基于测试集受试者工作特征曲线下面积(AUC)、准确度、灵敏度、特异度、F1分数综合评估不同模型效能,使用Shapley加法解释(SHAP)对最佳模型进行可解释性分析。结果 在5 666名研究对象中,斑块组3 639例(64.2%)。通过最小绝对收缩与选择算子(LASSO)回归筛选出21个非零系数关键变量,包括性别、地区、心电图印象、年龄、血尿酸、估计肾小球滤过率、糖化血红蛋白(HbA1c)、同型半胱氨酸(Hcy)、非高密度脂蛋白胆固醇、载脂蛋白B(APOB)、肌酸激酶同工酶(CK-MB)、舒张压、脉压差、尿酸碱度、尿比重、文化程度、当前职业、吸烟情况、饮酒情况、体力活动及睡眠质量。训练集中,XGBoost模型综合预测效能最优(AUC=0.747,准确度=0.693,灵敏度=0.732,特异度=0.623,F1分数=0.754)。基于SHAP的重要性排序结果依次为:年龄、Hcy、CK-MB、地区、HbA1c、ApoB和性别。结论 基于XGBoost机器学习算法构建的CVD高危人群CP风险预测模型性能最优,可为基层医疗卫生机构提供简便、低成本的工具,用于早期识别CP个体,并有助于在动脉粥样硬化早期阶段进行干预,从而降低CVD不良结局的发生风险。