背景 术前新辅助治疗(NAT)是治疗局部晚期乳腺癌的标准化手段,但只有部分患者对NAT敏感,在NAT前对患者进行疗效预测至关重要。既往研究利用统计学方法结合临床数据或深度学习方法结合影像学图像预测乳腺癌NAT疗效,效果欠佳。
目的 利用多示例学习(MIL)方法训练基于乳腺癌粗针穿刺全切片图像(WSI)的深度学习(DL-CNB)模型,实现对病理性完全缓解(pCR)的预测和相关肿瘤区域的可视化。
方法 采用回顾性研究模式,收集北京朝阳医院2019年4月—2022年4月收治的经NAT的乳腺癌患者的临床资料和NAT前穿刺苏木精-伊红(HE)染色切片。依据纳排标准共筛选出195例患者。根据Miller-Payne(MP)分级将患者分为pCR组(MP=5级,n=40)和non-pCR组(MP=1~4级,n=155)。首先对临床资料进行分析,构建pCR影响因素的Logistic回归模型。将所有WSI图像按照4∶1的比例随机划分为训练集和测试集,并从训练集中取出25%的数据作为验证集。标记每张WSI中全部肿瘤细胞区域,通过滑动窗口取块、数据筛选、数据增强、归一化处理等步骤准备训练集。对比5种卷积神经网络模型,选择最优模型作为DL-CNB的特征提取器。设置参数训练DL-CNB模型。利用独立测试集测试模型,评价DL-CNB的预测价值。根据由注意力模块获得的权重绘制热力图,实现WSI中与预测相关重要区域的可视化。
结果 pCR组组织学分级高、ER阴性、PR阴性、HER2阳性、Ki-67高表达的患者占比高于non-pCR组(P<0.05)。与HR+/HER2-相比,HR-/HER2+(OR=10.189,95%CI=3.225~32.187)和HR+/HER2+(OR=3.349,95%CI=1.152~9.737)可测预患者达到pCR状况(P<0.05)。Logistic回归模型的受试者工作特征曲线下面积(AUC)为0.769,准确率为81.000%。DL-CNB模型独立测试集AUC为0.914,准确率为84.211%。随机选取独立测试集中某张标签为non-pCR和某张标签为pCR的WSI肿瘤区域进行可视化展示。
结论 DL-CNB模型实现了通过乳腺癌穿刺WSI对新辅助治疗pCR的预测和重要区域的可视化,其预测结果优于临床数据预测模型。由此,本研究能够为符合NAT适应证的乳腺癌患者提供临床决策参考,辅助实现个体化精准治疗,对改善患者生活质量及生存预期具有重大意义。