Page 53 - 2022-34-中国全科医学
P. 53
·4274· http://www.chinagp.net E-mail:zgqkyx@chinagp.net.cn
HbA 1c 数据缺失的个案,仅凭借 FBG 诊断 T2DM,这 的评估标准且主观性较强,少有研究者将其列为候选预
可能会导致诊断性偏倚。上述 6 项 [16,22,28,30,33,38] 测因子或将其纳入预测模型。下一步,可探究上述因子
研究在该领域的偏倚风险评估结果为“高”,其余研究 对模型预测性能提升的影响。同时考虑到 T2DM 发病率
均为“低”,见表 4。 具有性别与年龄差异 [45-46] ,故也可深入开发基于性别、
2.4.1.4 数据分析领域 除 3 项 [23,27,29] 研究在该领域的 年龄的 T2DM 发病风险差异化预测模型。
偏倚风险评估结果为“不清楚”,其余研究均为“高”。 3.3 亚洲 T2DM 发病风险预测模型存在高偏倚风险
10 项 [9-10,12,14,16-18,21-22,24] 研究在转化连续变量的过程 PROBAST 是由 Cochrane 协助组推荐的预测模型研究偏
中未检验连续变量间是否存在非线性关系或未对分类变 倚风险评估工具。研究均于该工具发布前实施、模型开
量进行标准的定义,故在相应问题上被评价为“否”。10 发过程中应注意的细节问题较多可能是导致偏倚风险
项 [10,14,18,22,25,29,30,35-37] 研究未将所有的研究对象 较高的原因之一。未来,研究者可按照 PROBAST 开展
纳入分析(研究数据多来源于数据库,或为登记数 T2DM 发病风险预测模型的开发与验证工作,并严格遵
据),这可能会导致结果出现偏差。采用完整个案分 循多变量预测模型报告规范,进而尽可能地减少研究中
析法处理缺失数据的研究中,4 项 [9,14,20,24] 研究对剔 存在的偏倚。
除样本与纳入分析样本的基本特征进行了组间比较分 3.3.1 连续变量与缺失数据处理 本研究中,83.9%
析,发现差异无统计学意义,该处理方法相对合理; (26/31)的研究对连续变量进行了分类处理,但此方
而其余研究在采用完整个案分析法处理缺失数据后, 法可能导致重要信息丢失、变量间的关系被破坏及模型
在不确定数据缺失是否完全随机的情况下,并未对剔 预测能力的下降 [47] 。有研究者认为,对于连续变量,
除样本的特征进行分析,可引起偏倚。仅 1 项 [24] 研 宜保持其连续性,若连续变量间存在非线性关系,可运
究明确表示考虑了数据竞争问题,在相应问题上被评 用分段多项式函数(如样条函数)处理数据 [48] 。除了
价 为“ 是 ”。16 项 [10-13,15-16,18-19,24,26-27,32,34,35,38] 未报告缺失数据处理方法的研究外,91.7%(22/24)的
研究由于未报告模型的校准度,或仅以 H-L 拟合优度检 研究采用完整个案分析法处理缺失数据,该方法虽简单
验的统计量值和 P 值反映模型的校准度而未能提供校准 易用,但可能会消减数据特征、降低数据和研究的效力
图等因素,在相应问题上被评价为“否 / 可能否”,见表 4。 [49] 。多重插补、单一插补法的运用能有效降低数据缺
2.4.2 适用性评价结果 纳入模型总体及在各领域上的 失对统计分析、模型稳定性造成的不利影响,提高研究
适用性较好,见表 4。 精度和结果可靠性,是合适的数据缺失处理方法 [50] 。
3 讨论 3.3.2 模型的过度拟合和存在的乐观偏差 模型的不确
3.1 亚洲 T2DM 发病风险预测模型的研究尚处于 定性和参数的不确定性可导致模型的过度拟合,连续变
发展阶段 本研究系统检索了亚洲 T2DM 发病风 量的离散化处理、基于单因素分析的变量筛选方法等可
险预测模型相关研究,经过逐层筛选,最终纳入 使模型出现乐观偏差的可能性增高,而两者(模型的过
了 31 项 研 究。 纳 入 模 型 的 AUC 为 0.62~0.92, 其 中 度拟合、模型出现乐观偏差)均可致使预测模型的泛化
12 项 [12-14,18,22,25,33-37,39] 研究开发的 40 个模型的 能力下降 [51] 。本文纳入的研究中,48.4%(15/31)的
AUC>0.8,2 项 [18,36] 研究中的 2 个模型的 AUC>0.9, 研究考虑了模型的过度拟合问题,这也提示研究人员对
提示模型预测性能较好。所有纳入的研究均存在高偏倚 模型过度拟合问题及其存在的乐观偏差重视程度不够。
风险,主要原因为对连续变量的处理不合理、对缺失数 随机将数据集拆分为两个子集并将其中一个子集用于内
据的处理不合理、存在乐观偏差、忽略了模型的过度拟 部验证,已经被证实为一个不太恰当的测量乐观偏差的
合问题、未规范地对模型进行评价及缺乏外部验证等。 方法 [52-53] 。今后,在开发 T2DM 发病风险预测模型时,
3.2 亚洲 T2DM 发病风险预测模型存在同质化现象 可使用自举法、交叉验证法等对模型拟合进行校验,校
T2DM 发病风险预测模型包含的预测因子以年龄、性别、 验时须重复整套建模流程,包括变量转换、缺失值处理、
糖尿病家族史、BMI、腰围、FBG、HbA 1c 和血脂指标 变量筛选和模型拟合,否则可能无法衡量模型存在的实
为多见。一方面提示临床医务工作者应重视上述指标对 际乐观偏差水平 [54] 。此外,开发动态预测模型也可能
T2DM 发病的预警作用,加强对其的评估;另一方面也 是解决模型过度拟合的有效方法,如 ASGARI 等 [37] 通
说明 T2DM 发病风险预测模型存在较为严重的同质化问 过使用纵向数据(即重复测量数据,如 FBG)和事件
题。探索新的、个性化预测因子可能有助于突破现有发 发生时间数据进行联合建模,使开发的 T2DM 发病风险
展“瓶颈”,提升模型的预测性能,提高个体化治疗水 预测模型具备了动态性。联合模型的原则是先定义两个
平 [40-42] 。流行病学研究结果表明,心理因素、饮食习惯、 子模型,即混合效应模型和 Cox 模型,然后使用其共同
贫困、受教育程度、职业压力水平、睡眠障碍与 T2DM 的潜在结构将其链接起来。下一步,研究者可深入开发
发病高风险相关 [43-44] 。但由于上述部分指标缺乏统一 基于混合效应模型和 Cox 模型的纵向和生存数据联合模