Page 53 - 2022-34-中国全科医学
P. 53

·4274· http://www.chinagp.net   E-mail:zgqkyx@chinagp.net.cn


           HbA 1c 数据缺失的个案,仅凭借 FBG 诊断 T2DM,这                    的评估标准且主观性较强,少有研究者将其列为候选预
           可能会导致诊断性偏倚。上述 6 项                [16,22,28,30,33,38]   测因子或将其纳入预测模型。下一步,可探究上述因子
           研究在该领域的偏倚风险评估结果为“高”,其余研究                            对模型预测性能提升的影响。同时考虑到 T2DM 发病率
           均为“低”,见表 4。                                         具有性别与年龄差异         [45-46] ,故也可深入开发基于性别、
           2.4.1.4 数据分析领域 除 3 项      [23,27,29] 研究在该领域的        年龄的 T2DM 发病风险差异化预测模型。
           偏倚风险评估结果为“不清楚”,其余研究均为“高”。                           3.3 亚洲 T2DM 发病风险预测模型存在高偏倚风险
           10 项 [9-10,12,14,16-18,21-22,24] 研究在转化连续变量的过程       PROBAST 是由 Cochrane 协助组推荐的预测模型研究偏
           中未检验连续变量间是否存在非线性关系或未对分类变                            倚风险评估工具。研究均于该工具发布前实施、模型开
           量进行标准的定义,故在相应问题上被评价为“否”。10                          发过程中应注意的细节问题较多可能是导致偏倚风险
           项 [10,14,18,22,25,29,30,35-37] 研究未将所有的研究对象          较高的原因之一。未来,研究者可按照 PROBAST 开展
           纳入分析(研究数据多来源于数据库,或为登记数                              T2DM 发病风险预测模型的开发与验证工作,并严格遵
           据),这可能会导致结果出现偏差。采用完整个案分                             循多变量预测模型报告规范,进而尽可能地减少研究中
           析法处理缺失数据的研究中,4 项              [9,14,20,24] 研究对剔     存在的偏倚。
           除样本与纳入分析样本的基本特征进行了组间比较分                             3.3.1 连续变量与缺失数据处理 本研究中,83.9%
           析,发现差异无统计学意义,该处理方法相对合理;                             (26/31)的研究对连续变量进行了分类处理,但此方
           而其余研究在采用完整个案分析法处理缺失数据后,                             法可能导致重要信息丢失、变量间的关系被破坏及模型
           在不确定数据缺失是否完全随机的情况下,并未对剔                             预测能力的下降       [47] 。有研究者认为,对于连续变量,
           除样本的特征进行分析,可引起偏倚。仅 1 项                    [24] 研    宜保持其连续性,若连续变量间存在非线性关系,可运
           究明确表示考虑了数据竞争问题,在相应问题上被评                             用分段多项式函数(如样条函数)处理数据                   [48] 。除了
           价 为“ 是 ”。16 项       [10-13,15-16,18-19,24,26-27,32,34,35,38]   未报告缺失数据处理方法的研究外,91.7%(22/24)的
           研究由于未报告模型的校准度,或仅以 H-L 拟合优度检                         研究采用完整个案分析法处理缺失数据,该方法虽简单
           验的统计量值和 P 值反映模型的校准度而未能提供校准                          易用,但可能会消减数据特征、降低数据和研究的效力
           图等因素,在相应问题上被评价为“否 / 可能否”,见表 4。                      [49] 。多重插补、单一插补法的运用能有效降低数据缺
           2.4.2 适用性评价结果 纳入模型总体及在各领域上的                         失对统计分析、模型稳定性造成的不利影响,提高研究
           适用性较好,见表 4。                                         精度和结果可靠性,是合适的数据缺失处理方法                     [50] 。
           3 讨论                                                3.3.2 模型的过度拟合和存在的乐观偏差 模型的不确
           3.1 亚洲 T2DM 发病风险预测模型的研究尚处于                          定性和参数的不确定性可导致模型的过度拟合,连续变
           发展阶段 本研究系统检索了亚洲 T2DM 发病风                            量的离散化处理、基于单因素分析的变量筛选方法等可
           险预测模型相关研究,经过逐层筛选,最终纳入                               使模型出现乐观偏差的可能性增高,而两者(模型的过
           了 31 项 研 究。 纳 入 模 型 的 AUC 为 0.62~0.92, 其 中          度拟合、模型出现乐观偏差)均可致使预测模型的泛化
           12 项 [12-14,18,22,25,33-37,39]  研究开发的 40 个模型的       能力下降    [51] 。本文纳入的研究中,48.4%(15/31)的
           AUC>0.8,2 项  [18,36] 研究中的 2 个模型的 AUC>0.9,           研究考虑了模型的过度拟合问题,这也提示研究人员对
           提示模型预测性能较好。所有纳入的研究均存在高偏倚                            模型过度拟合问题及其存在的乐观偏差重视程度不够。
           风险,主要原因为对连续变量的处理不合理、对缺失数                            随机将数据集拆分为两个子集并将其中一个子集用于内
           据的处理不合理、存在乐观偏差、忽略了模型的过度拟                            部验证,已经被证实为一个不太恰当的测量乐观偏差的
           合问题、未规范地对模型进行评价及缺乏外部验证等。                            方法  [52-53] 。今后,在开发 T2DM 发病风险预测模型时,
           3.2 亚洲 T2DM 发病风险预测模型存在同质化现象                         可使用自举法、交叉验证法等对模型拟合进行校验,校
           T2DM 发病风险预测模型包含的预测因子以年龄、性别、                         验时须重复整套建模流程,包括变量转换、缺失值处理、
           糖尿病家族史、BMI、腰围、FBG、HbA 1c 和血脂指标                      变量筛选和模型拟合,否则可能无法衡量模型存在的实
           为多见。一方面提示临床医务工作者应重视上述指标对                            际乐观偏差水平       [54] 。此外,开发动态预测模型也可能
           T2DM 发病的预警作用,加强对其的评估;另一方面也                          是解决模型过度拟合的有效方法,如 ASGARI 等                 [37] 通
           说明 T2DM 发病风险预测模型存在较为严重的同质化问                         过使用纵向数据(即重复测量数据,如 FBG)和事件
           题。探索新的、个性化预测因子可能有助于突破现有发                            发生时间数据进行联合建模,使开发的 T2DM 发病风险
           展“瓶颈”,提升模型的预测性能,提高个体化治疗水                            预测模型具备了动态性。联合模型的原则是先定义两个
           平 [40-42] 。流行病学研究结果表明,心理因素、饮食习惯、                    子模型,即混合效应模型和 Cox 模型,然后使用其共同
           贫困、受教育程度、职业压力水平、睡眠障碍与 T2DM                          的潜在结构将其链接起来。下一步,研究者可深入开发
           发病高风险相关       [43-44] 。但由于上述部分指标缺乏统一                基于混合效应模型和 Cox 模型的纵向和生存数据联合模
   48   49   50   51   52   53   54   55   56   57   58