Chinese General Practice ›› 2025, Vol. 28 ›› Issue (35): 4457-4463.DOI: 10.12114/j.issn.1007-9572.2024.0604
• Original Research • Previous Articles Next Articles
Received:
2024-11-10
Revised:
2025-03-10
Published:
2025-12-15
Online:
2025-10-15
Contact:
CHANG Wenxiu
通讯作者:
常文秀
作者简介:
作者贡献:
宋欣芫负责数据整理、文献检索及文章撰写;常文秀、张文玉负责研究构思设计、指导及修改;杨婷婷负责文献检索、数据分析处理与解释,图、表的绘制与展示;王恺负责研究指导、文章修改。
基金资助:
CLC Number:
Add to citation manager EndNote|Ris|BibTeX
URL: https://www.chinagp.net/EN/10.12114/j.issn.1007-9572.2024.0604
临床特征 | 赋值 | 临床特征 | 赋值 |
---|---|---|---|
随访时间 | 实测值 | 性别 | 女=0,男=1 |
基线eGFR | 实测值 | 糖尿病肾病 | 无=0,有=1 |
2年内eGFR下降百分比 | 实测值 | 高血压 | 无=0,有=1 |
年龄 | 实测值 | 慢性肾小球肾炎 | 无=0,有=1 |
体质指数 | 实测值 | 多囊肾病 | 无=0,有=1 |
收缩压 | 实测值 | 单肾 | 无=0,有=1 |
血红蛋白 | 实测值 | 其他疾病 | 无=0,有=1 |
白细胞 | 实测值 | 肾素-血管紧张素系统抑制剂 | 无=0,有=1 |
血小板 | 实测值 | 钙通道阻滞剂 | 无=0,有=1 |
白蛋白尿 | 实测值 | 利尿剂 | 无=0,有=1 |
血尿酸 | 实测值 | 其他药物 | 无=0,有=1 |
钠离子 | 实测值 | 透析 | 无=0,有=1 |
钾离子 | 实测值 | 随机尿试纸法检测的血尿 | 血尿0=0,血尿1+=1,血尿2+=2,血尿3+=3 |
氯离子 | 实测值 | ||
白蛋白校正钙 | 实测值 | ||
磷离子 | 实测值 | ||
C反应蛋白 | 实测值 | ||
低密度脂蛋白胆固醇 | 实测值 | ||
随机尿蛋白尿 | 实测值 |
Table 1 Clinical variables and their types in the CKD dataset
临床特征 | 赋值 | 临床特征 | 赋值 |
---|---|---|---|
随访时间 | 实测值 | 性别 | 女=0,男=1 |
基线eGFR | 实测值 | 糖尿病肾病 | 无=0,有=1 |
2年内eGFR下降百分比 | 实测值 | 高血压 | 无=0,有=1 |
年龄 | 实测值 | 慢性肾小球肾炎 | 无=0,有=1 |
体质指数 | 实测值 | 多囊肾病 | 无=0,有=1 |
收缩压 | 实测值 | 单肾 | 无=0,有=1 |
血红蛋白 | 实测值 | 其他疾病 | 无=0,有=1 |
白细胞 | 实测值 | 肾素-血管紧张素系统抑制剂 | 无=0,有=1 |
血小板 | 实测值 | 钙通道阻滞剂 | 无=0,有=1 |
白蛋白尿 | 实测值 | 利尿剂 | 无=0,有=1 |
血尿酸 | 实测值 | 其他药物 | 无=0,有=1 |
钠离子 | 实测值 | 透析 | 无=0,有=1 |
钾离子 | 实测值 | 随机尿试纸法检测的血尿 | 血尿0=0,血尿1+=1,血尿2+=2,血尿3+=3 |
氯离子 | 实测值 | ||
白蛋白校正钙 | 实测值 | ||
磷离子 | 实测值 | ||
C反应蛋白 | 实测值 | ||
低密度脂蛋白胆固醇 | 实测值 | ||
随机尿蛋白尿 | 实测值 |
指标中文名 | 指标英文名称 | 含义 | 计算公式 |
---|---|---|---|
准确率 | Accuracy | 预测正确的数量占总数量的百分比。准确率衡量的是分类器的分类准确程度,准确率值越大表示分类器分类结果与真实确诊结果越接近 | (TP+TN)/(TP+TN+FP+FN)×100% |
精确率 | Precision | 在所有被预测为正例的数目中实际为正例的概率 | TP/(TP+FP)×100% |
召回率 | Recall | 实际为正例的数目中被正确预测为正例的数目 | TP/(TP+FN)×100% |
F1分数 | F1-score | 兼顾分类模型的精确率和召回率,F1分数越高,模型性能越好 | 2×Precision×Recall/(Precision+Recall)×100% |
真阳性 | TP | 实为正例,分类器预测为正例的数目 | |
真阴性 | TN | 实为反例,分类器预测为反例的数目 | |
假阳性 | FP | 实为反例,分类器预测为正例的数目 | |
假阴性 | FN | 实为正例,分类器预测为反例的数目 |
Table 2 Evaluation indicators for model comparison
指标中文名 | 指标英文名称 | 含义 | 计算公式 |
---|---|---|---|
准确率 | Accuracy | 预测正确的数量占总数量的百分比。准确率衡量的是分类器的分类准确程度,准确率值越大表示分类器分类结果与真实确诊结果越接近 | (TP+TN)/(TP+TN+FP+FN)×100% |
精确率 | Precision | 在所有被预测为正例的数目中实际为正例的概率 | TP/(TP+FP)×100% |
召回率 | Recall | 实际为正例的数目中被正确预测为正例的数目 | TP/(TP+FN)×100% |
F1分数 | F1-score | 兼顾分类模型的精确率和召回率,F1分数越高,模型性能越好 | 2×Precision×Recall/(Precision+Recall)×100% |
真阳性 | TP | 实为正例,分类器预测为正例的数目 | |
真阴性 | TN | 实为反例,分类器预测为反例的数目 | |
假阳性 | FP | 实为反例,分类器预测为正例的数目 | |
假阴性 | FN | 实为正例,分类器预测为反例的数目 |
预测类别 | 实际类别 | |
---|---|---|
阳性 | 阴性 | |
阳性 | TP | FP |
阴性 | FN | TN |
Table 3 Confusion matrix
预测类别 | 实际类别 | |
---|---|---|
阳性 | 阴性 | |
阳性 | TP | FP |
阴性 | FN | TN |
模型 | 准确率 | 精确率 | 召回率 | F1分数 |
---|---|---|---|---|
LR | 92.0 | 68.0 | 62.6 | 64.4 |
MLP | 93.7 | 74.3 | 72.3 | 73.1 |
SVM | 90.1 | 88.3 | 22.8 | 33.4 |
XGBoost | 92.7 | 74.4 | 62.8 | 67.3 |
CNN | 94.8 | 80.3 | 78.2 | 78.4 |
Table 4 Comparison of results of cross-validation of different models
模型 | 准确率 | 精确率 | 召回率 | F1分数 |
---|---|---|---|---|
LR | 92.0 | 68.0 | 62.6 | 64.4 |
MLP | 93.7 | 74.3 | 72.3 | 73.1 |
SVM | 90.1 | 88.3 | 22.8 | 33.4 |
XGBoost | 92.7 | 74.4 | 62.8 | 67.3 |
CNN | 94.8 | 80.3 | 78.2 | 78.4 |
模型 | 准确率 | 精确率 | 召回率 | F1分数 |
---|---|---|---|---|
imbalance data | 94.8 | 80.3 | 78.2 | 78.4 |
SMOTE | 93.4 | 68.8 | 85.7 | 74.8 |
LW-CEL | 92.7 | 64.6 | 89.1 | 74.4 |
NW-CEL | 92.8 | 65.6 | 88.0 | 74.6 |
Table 5 Comparison of results for different balancing category methods
模型 | 准确率 | 精确率 | 召回率 | F1分数 |
---|---|---|---|---|
imbalance data | 94.8 | 80.3 | 78.2 | 78.4 |
SMOTE | 93.4 | 68.8 | 85.7 | 74.8 |
LW-CEL | 92.7 | 64.6 | 89.1 | 74.4 |
NW-CEL | 92.8 | 65.6 | 88.0 | 74.6 |
模型 | 选择的数据集 | 交叉验证结果 | |||
---|---|---|---|---|---|
准确率 | 精确率 | 召回率 | F1分数 | ||
LR | 2年时间平均数据集 | 92.0 | 68.0 | 62.6 | 64.4 |
基线数据集 | 89.5 | 60.3 | 38.5 | 45.9 | |
SVM | 2年时间平均数据集 | 93.7 | 74.3 | 72.3 | 73.1 |
基线数据集 | 91.2 | 76.7 | 37.1 | 47.9 | |
MLP | 2年时间平均数据集 | 90.1 | 88.3 | 22.8 | 33.4 |
基线数据集 | 88.1 | 0 | 0 | 0 | |
XGBoost | 2年时间平均数据集 | 92.7 | 74.4 | 62.8 | 67.3 |
基线数据集 | 91.4 | 68.6 | 50.8 | 57.3 | |
CNN | 2年时间平均数据集 | 94.8 | 80.3 | 78.2 | 78.4 |
基线数据集 | 91.1 | 73.6 | 47.0 | 51.5 |
Table 6 Comparative trial of treatments over two years
模型 | 选择的数据集 | 交叉验证结果 | |||
---|---|---|---|---|---|
准确率 | 精确率 | 召回率 | F1分数 | ||
LR | 2年时间平均数据集 | 92.0 | 68.0 | 62.6 | 64.4 |
基线数据集 | 89.5 | 60.3 | 38.5 | 45.9 | |
SVM | 2年时间平均数据集 | 93.7 | 74.3 | 72.3 | 73.1 |
基线数据集 | 91.2 | 76.7 | 37.1 | 47.9 | |
MLP | 2年时间平均数据集 | 90.1 | 88.3 | 22.8 | 33.4 |
基线数据集 | 88.1 | 0 | 0 | 0 | |
XGBoost | 2年时间平均数据集 | 92.7 | 74.4 | 62.8 | 67.3 |
基线数据集 | 91.4 | 68.6 | 50.8 | 57.3 | |
CNN | 2年时间平均数据集 | 94.8 | 80.3 | 78.2 | 78.4 |
基线数据集 | 91.1 | 73.6 | 47.0 | 51.5 |
模型 | 2年内eGFR变化率 | 交叉验证结果 | |||
---|---|---|---|---|---|
准确率 | 精确率 | 召回率 | F1分数 | ||
LR | 含有 | 92.0 | 68.0 | 62.6 | 64.4 |
不含有 | 91.4 | 68.0 | 55.4 | 60.0 | |
SVM | 含有 | 93.7 | 74.3 | 72.3 | 73.1 |
不含有 | 79.7 | 72.4 | 63.8 | 55.2 | |
MLP | 含有 | 90.1 | 88.3 | 22.8 | 33.4 |
不含有 | 88.1 | 0 | 0 | 0 | |
XGBoost | 含有 | 92.7 | 74.4 | 62.8 | 67.3 |
不含有 | 91.7 | 67.8 | 55.4 | 60.5 | |
CNN | 含有 | 94.8 | 80.3 | 78.2 | 78.4 |
不含有 | 93.1 | 66.8 | 77.8 | 60.3 |
Table 7 Comparative experiments on the rate of change of eGFR over two years
模型 | 2年内eGFR变化率 | 交叉验证结果 | |||
---|---|---|---|---|---|
准确率 | 精确率 | 召回率 | F1分数 | ||
LR | 含有 | 92.0 | 68.0 | 62.6 | 64.4 |
不含有 | 91.4 | 68.0 | 55.4 | 60.0 | |
SVM | 含有 | 93.7 | 74.3 | 72.3 | 73.1 |
不含有 | 79.7 | 72.4 | 63.8 | 55.2 | |
MLP | 含有 | 90.1 | 88.3 | 22.8 | 33.4 |
不含有 | 88.1 | 0 | 0 | 0 | |
XGBoost | 含有 | 92.7 | 74.4 | 62.8 | 67.3 |
不含有 | 91.7 | 67.8 | 55.4 | 60.5 | |
CNN | 含有 | 94.8 | 80.3 | 78.2 | 78.4 |
不含有 | 93.1 | 66.8 | 77.8 | 60.3 |
[1] |
|
[2] |
|
[3] |
|
[4] |
王李胜,童辉,杨建国,等. 人工智能在慢性肾脏病应用现状及展望[J]. 中国血液净化,2022,21(1):59-62. DOI:10.3969/j.issn.1671-4091.2022.01.014.
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] | |
[11] |
|
[12] |
关矛,林立言. 基于多元用户异常行为数据的用户分类模型研究与应用[J]. 电信工程技术与标准化,2024,37(11):1-6. DOI:10.13992/j.cnki.tetas.2024.11.001.
|
[13] |
骆正山,张景奇,骆济豪,等. 基于IMA-AmMLP模型的CO2驱最小混相压力预测[J]. 石油学报,2024,45(10):1522-1528.
|
[14] |
黄光成,周良,石建伟,等. 机器学习算法在疾病风险预测中的应用与比较[J]. 中国卫生资源,2020,23(4):432-436.
|
[15] |
曲文龙,李一漪,周磊. XGBoost算法在糖尿病血糖预测中的应用[J]. 吉林师范大学学报(自然科学版),2019,40(4):118-125. DOI:10.16862/j.cnki.issn1674-3873.2019.04.020.
|
[16] |
黄焕辉,荣玉军,陶禹诺. 基于网关插件及大数据技术的家庭智能设备识别与应用研究[J]. 电信工程技术与标准化,2024,37(11):7-13. DOI:10.13992/j.cnki.tetas.2024.11.015.
|
[17] |
王慧,戚倩倩,李雪,等. 皮肤肿瘤图像自动分类的研究进展[J]. 计算机工程与应用,2022,58(16):31-48.
|
[18] |
周兴雯,马春驰,王琳. 基于高分辨率卷积神经网络的皮肤常见肿瘤智能诊断模型构建[J]. 四川医学,2024,45(6):638-645. DOI:10.16252/j.cnki.issn1004-0501-2024.06.013.
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
马倩倩,孙东旭,石金铭,等. 基于支持向量机与XGboost的成年人群肿瘤患病风险预测研究[J]. 中国全科医学,2020,23(12):1486-1491. DOI:10.12114/j.issn.1007-9572.2020.00.066.
|
[1] | YANG Jian, WU Chuan'an, ZHOU Hairong, TIAN Feng, CHI Chunhua. Diagnostic Value of the Triglyceride Glucose-body Mass Index for Type 2 Diabetes Mellitus Combined with Metabolic Dysfunction-associated Fatty Liver Disease [J]. Chinese General Practice, 2025, 28(32): 4075-4081. |
[2] | LIAO Jiaojiao, WANG Zhaoyu, LI Zhaoji, ZHAO Wei, ZHAN Siyan, WANG Peng, TAO Liyuan. Predictive Value of Dynamic Changes in Non-high-density Lipoprotein Cholesterol for Carotid Intima-media Thickening: an Ambidirectional Cohort Study [J]. Chinese General Practice, 2025, 28(31): 3932-3941. |
[3] | JIA Gaopeng, CHEN Qiuyu. Construction and Validation of a Risk Prediction Model for Recurrent Angina after Percutaneous Coronary Intervention in Elderly Patients with Acute ST-segment Elevation Myocardial Infarction: Based on CYP2C19-related Genetic Testing [J]. Chinese General Practice, 2025, 28(30): 3779-3786. |
[4] | LI Ling, LI Yaping, QIAN Shixing, NIE Jing, LU Chunhua, LI Xia. Research on Influencing Factors and Risk Prediction of Cognitive Function in Community-dwelling Middle-aged and Elderly People [J]. Chinese General Practice, 2025, 28(30): 3773-3778. |
[5] | JIANG Qixia, ZHU Yuling, ZHU Wenjun, LI Xiuyun, XIE Haoting, WANG Huajun, YUAN Siming. Accuracy and Cut-off Values of "Five Points" Flap Temperature and "Single Point" Flap Temperature in Predicting Vascular Crisis [J]. Chinese General Practice, 2025, 28(24): 3013-3018. |
[6] | LIU Yinyin, SUI Hongping, LI Tingting, JIANG Tongtong, SHI Tieying, XIA Yunlong. Advances in Risk Prediction Models for Cardiotoxicity Associated with Breast Cancer Treatment [J]. Chinese General Practice, 2025, 28(24): 3072-3078. |
[7] | WANG Rupeng, NAN Jing, HU Yiran, YANG Shenghua, JIN Zening. Predictive Value of the Triglyceride-Glucose Body Mass Index for Slow Flow/No-reflow Phenomenon in Patients with Type 2 Diabetes Mellitus and Acute Myocardial Infarction Undergoing Emergency Percutaneous Coronary Intervention [J]. Chinese General Practice, 2025, 28(24): 2985-2992. |
[8] | ZHOU Qian, WU Xiaomin, WANG Baohua, YAN Ruohan, YU Miao, WU Jing. Study on Nomogram Prediction Model for Risk of Gastric Cancer [J]. Chinese General Practice, 2025, 28(23): 2870-2877. |
[9] | ZHAO Xiaoqing, GUO Tongtong, ZHANG Xinyi, LI Linhong, ZHANG Ya, JI Lihong, DONG Zhiwei, GAO Qianqian, CAI Weiqing, ZHENG Wengui, JING Qi. Construction and Validation of a Risk Prediction Model for Cognitive Impairment in Community-dwelling Older Adults [J]. Chinese General Practice, 2025, 28(22): 2776-2783. |
[10] | XIONG Xin, LI Yang, SHI Feng, YANG Lian, DUAN Wei, CHEN Bei, LI Yong, ZHAO Linwei, FU Quanshui, FAN Xiaoping, YANG Guoqing. Research on the Measurement System and Calibration of Thoracolumbar Vertebral Density Based on Artificial Intelligence [J]. Chinese General Practice, 2025, 28(19): 2398-2406. |
[11] | LUO Yunzhao, JIANG Hongchuan, XU Feng. Predicting Response to Neoadjuvant Therapy in Breast Cancer Using Deep Learning on Primary Core Needle Biopsy Slides [J]. Chinese General Practice, 2025, 28(19): 2407-2413. |
[12] | ZHANG Bingqing, WANG Zhongkai, WU Changyong, SUN Huang, LI Ruijie, LIU Wenjie, LUO Yihua, ZHENG Lihui, PENG Yunzhu. Changes and Trend Prediction in the Global Burden of Congenital Heart Defects, 1990-2021 [J]. Chinese General Practice, 2025, 28(18): 2253-2261. |
[13] | LIU Feiran, CHEN Minghuang, ZHAO Shuaihong, BAI Wenpei. Application of Random Forest Algorithm in Pregnancy Prediction after Fallopian Tube Recanalization [J]. Chinese General Practice, 2025, 28(11): 1361-1366. |
[14] | WANG Yiquan, CHEN Wanjia, LIU Wangyi, ZHANG Luyun, DENG Yueyi. The Prognosis of Stage 4 Chronic Kidney Diseasetreated with Fermented Cordyceps Sinensis Powder: Based on a Retrospective Cohort Study [J]. Chinese General Practice, 2025, 28(09): 1084-1091. |
[15] | CHEN Shenglan, ZHENG Yongtao, HU Wangcheng, NI Zuowei, XIA Bing, YE Chunmei, DU Chixin, CHEN Xiaodan. Risk Prediction Model for High Myopia in Primary and Secondary School Students: Based on Nested Case-control Study [J]. Chinese General Practice, 2025, 28(09): 1115-1121. |
Viewed | ||||||
Full text |
|
|||||
Abstract |
|
|||||