中国全科医学 ›› 2017, Vol. 20 ›› Issue (27): 3353-3359.DOI: 10.3969/j.issn.1007-9572.2017.00.036

• 专题研究 • 上一篇    下一篇

基于临床指标和病理指标的三种预测模型用于结直肠癌的预后分析研究

尹明明1,2,秦环龙1,2*   

  1. 1.200072 上海市,安徽医科大学上海临床学院
    2.200072 上海市,上海市第十人民医院胃肠外科
    *通信作者:秦环龙,教授,博士生导师;E-mail:huanlong_qin@live.cn
  • 出版日期:2017-09-20 发布日期:2017-09-20
  • 基金资助:
    国家自然科学基金资助项目(81230057)

  • Published:2017-09-20 Online:2017-09-20

摘要: 目的  通过支持向量机模型(SVM)将临床指标和病理指标进行整合,分析其对结直肠癌(CRC)患者预后的预测价值。方法  选取2002-2011年在上海市第十人民医院胃肠外科行结直肠肿瘤切除术的患者2 951例为研究对象。收集患者的临床指标(性别、年龄、肿瘤大小、肿瘤位置、组织病理类型、T分期、N分期、M分期、G分期)和病理指标〔癌胚抗原(CEA)、增殖细胞核抗原(PCNA)、P53、CD34、S-100、NM23、CerB-b2、P21、Ki-67〕。按照随访信息是否缺失将患者分为两组,第一组为临床数据完整但随访信息缺失,共2 747例;第二组为临床数据及随访信息均完整,共204例。记录患者生存情况。第一组中,若某一患者有超过4个指标缺失,则该患者被剔除;在余下的患者中,若某一指标的缺失率>30.0%,则该指标被剔除;进一步将少发病理类型患者剔除;计算临床指标和病理指标的关联性,随后,将所得关联性在第二组患者中进行验证,若该关联性在第二组中存在,则直接将第二组患者纳入第三组中;若该关联性在第二组中不存在,则采用SVM内部算法剔除部分患者,直至该关联性再次成立,将余下的第二组患者纳入第三组。对第二组中患者的病理指标进行统计,若某一指标的缺失率>50.0%,则该指标被剔除。基于SVM对第三组数据进行处理,建立3种预测模型:SVM1基于临床指标、SVM2基于病理指标、SVM3基于临床指标和病理指标的汇总。结果  第一组中,共834例患者缺失指标<4个,其中性别、年龄、肿瘤位置、组织病理类型、P53、CD34、S-100、CerB-b2、Ki-67共9个指标缺失率<30.0%而被保留,剔除5例少见肿瘤患者后,共剩下829例患者。第一组患者年龄与CerB-b2表达情况存在关联性(P<0.05)。第二组剔除105例患者后,余下99例患者,患者年龄与CerB-b2表达情况存在关联性(P<0.05),将这99例患者纳入第三组。第二组中PCNA、P53、CD34、S-100、CerB-b2共5个指标缺失率<50.0%而被保留。第三组患者年龄与S-100、CerB-b2表达情况存在关联性(P<0.05);M分期与PCNA表达情况存在关联性(P<0.05)。第三组不同T分期、N分期患者生存曲线比较,差异有统计学意义(P<0.05)。SVM1纳入9个临床指标(性别、年龄、肿瘤大小、肿瘤位置、组织病理类型、T分期、N分期、M分期、G分期),准确率为83.4%;SVM2纳入5个病理指标(PCNA、P53、CD34、S-100、CerB-b2),准确率为78.8%;初始的SVM3纳入以上9个临床指标及5个病理指标,准确率为74.8%,通过最小冗余最大相关性(MRMR)法对指标进行进一步筛选,得到最终的SVM3,其纳入4个临床指标(肿瘤位置、组织病理类型、T分期、N分期)和2个病理指标(CD34、CerB-b2),准确率为81.8%。不同风险SVM1、SVM2、SVM3患者生存曲线比较,差异有统计学意义(P<0.05)。结论  临床指标如年龄、M分期与病理指标如CerB-b2、S-100和PCNA存在一定的关联性;借助SVM模型将临床指标和病理指标进行整合分析可对CRC患者预后进行有效预测。

关键词: 结直肠肿瘤, 预后, 预测模型