中国全科医学 ›› 2026, Vol. 29 ›› Issue (18): 2498-2503.DOI: 10.12114/j.issn.1007-9572.2025.0021
• 论著 • 上一篇
摘要: 背景 人工智能(AI)技术存在易受对抗性攻击和过拟合现象,在实践应用中效果不及实验数据完美。考虑到远程心电图会诊收费和时效性等因素,基层医务人员会直接采用AI诊断结果,可能存在医疗风险。 目的 应用黄山市区域远程心电诊断中心3年的会诊数据,以医师诊断为标准,分析AI诊断的准确性及其影响因素。 方法 回顾性收集2020年9月—2023年9月黄山市区域远程心电诊断中心来自基层医疗机构的全部会诊心电图18 164份。分别将AI和医师心电图诊断结论分为正常、阳性、危急及采集不良4类,并将患者身份信息与同期黄山市人民医院住院电子病历系统关联,提取相关患者在三级医院的出院诊断信息,按出院诊断分为心血管疾病(CVD)住院和非CVD住院两类。采用配对设计的McNemar χ2检验比较AI组与医师组分类差异,采用Pearson χ2检验比较两组分类结果与是否因CVD住院的差异性,剔除采集不良病例后,以正常类为参照,采用单因素Logistic回归分析探讨不同分类与CVD住院的相关性。进一步将医师组非采集不良心电图的17个心电图指标转化为二分类变量,以AI组与医师组分类是否一致为因变量,绘制ROC曲线对医师组危急类、阳性类进行分层分析,评价各心电图指标对两组分类不一致的影响。 结果 共纳入远程常规心电图18 164份,患者中位年龄为69(65,74)岁,其中男8 731例、女9 433例。医师组分类为正常5 873份(32.3%)、阳性11 678份(64.3%)、危急393份(2.2%)、采集不良220份(1.2%);AI组相应分别为4 723份(26.0%)、12 861份(70.8%)、390份(2.1%)和190份(1.0%)。研究期间相关患者同期转入三级医院住院553人次,其中CVD住院457人次(82.6%)。单因素Logistic回归分析显示,以正常心电图为参照,医师组阳性类和危急类因CVD住院风险分别为正常类的1.84倍(OR=1.84,95%CI=1.11~3.04)和2.80倍(OR=2.80,95%CI=1.08~7.21)(P<0.05);AI组阳性类(OR=1.54,95%CI=0.88~2.67)和危急类(OR=2.46,95%CI=0.92~6.55)与CVD住院无统计学关联(P>0.05)。AI组与医师组诊断分类一致16 018份(88.2%),不一致2 146份(11.8%),两组差异有统计学意义(χ2=680.931,P<0.001);以医师组为标准,AI组误诊率为27.7%,漏诊率为3.9%。ROC曲线结果显示,在医师组危急类心电图中,窦性心律、ST段异常及急性心肌缺血对两组分类不一致有判别价值,ROC曲线下面积(AUC)分别为0.74(95%CI=0.65~0.82)、0.69(95%CI=0.58~0.80)和0.97(95%CI=0.96~0.99);在医师组阳性类心电图中,低电压和T波异常对两组分类不一致有判别价值,AUC分别为0.58(95%CI=0.55~0.61)和0.61(95%CI=0.58~0.63);在医师组正常类心电图中,心动过缓对两组分类不一致有判别价值,AUC为0.58(95%CI=0.56~0.60)。 结论 当前的AI算法对心电图诊断的准确性低于医师组,仍需有经验的医师审核确认。提示应用于临床的AI技术应进行广泛的稳健性验证。