中国全科医学 ›› 2025, Vol. 28 ›› Issue (04): 499-509.DOI: 10.12114/j.issn.1007-9572.2023.0323
• 论著 • 上一篇
岳海涛1, 何婵婵1, 成羽攸1, 张森诚1, 吴悠2,*(), 马晶1,*(
)
收稿日期:
2024-03-16
修回日期:
2024-09-11
出版日期:
2025-02-05
发布日期:
2024-12-03
通讯作者:
吴悠, 马晶
岳海涛、何婵婵为共同第一作者
作者贡献:
岳海涛、何婵婵负责数据分析及解读、文章撰写、文章修改;成羽攸、张森诚协助数据分析及文章撰写;吴悠、马晶负责研究设计、文章的质量控制与审查,监督管理,对文章整体负责。
YUE Haitao1, HE Chanchan1, CHENG Yuyou1, ZHANG Sencheng1, WU You2,*(), MA Jing1,*(
)
Received:
2024-03-16
Revised:
2024-09-11
Published:
2025-02-05
Online:
2024-12-03
Contact:
WU You, MA Jing
About author:
YUE Haitao and HE Chanchan are co-first authors
摘要: 背景 冠状动脉粥样硬化性心脏病(以下简称冠心病)是全球重要的死亡原因之一。目前关于冠心病风险评估的研究在逐年增长。然而,在这些研究中常忽略了数据不平衡的问题,而解决该问题对于提高分类算法中识别冠心病风险的准确性至关重要。 目的 探索冠心病的影响因素,通过使用2种平衡数据的方法,基于5种算法建立冠心病风险相关的预测模型,比较这5种模型对冠心病风险的预测价值。 方法 基于2021年美国国家行为风险因素监测系统(BRFSS)横断面调查数据筛选出112 606名研究对象的健康相关风险行为、慢性健康状况等24个变量信息,结局指标为自我报告是否患有冠心病并据此分为冠心病组和非冠心病组。通过进行单因素分析和逐步Logistic回归分析探索冠心病发生的影响因素并筛选出纳入预测模型的变量。随机抽取112 606名受访者的10%(共计11 261名),以8∶2的比例随机划分为训练与测试的数据集,采用随机过采样和合成少数过采样技术(SMOTE)两种过采样的方法处理不平衡数据,基于k最邻近算法(KNN)、Logistic回归、支持向量机(SVM)、决策树和XGBoost算法分别建立冠心病预测模型。 结果 两组年龄、性别、BMI、种族、婚姻状态、教育水平、收入水平、家里有几个孩子、是否被告知患高血压、是否被告知处于高血压前期、是否被告知患妊娠高血压、现在是否在服用高血压药物、是否被告知患有高脂血症、是否被告知患有糖尿病、吸烟情况、过去30 d内是否至少喝过1次酒、是否为重度饮酒者、是否为酗酒者、过去30 d内是否有体育锻炼、心理健康状况以及自我健康评价比较,差异有统计学意义(P<0.05)。逐步Logistic回归分析结果显示:年龄、性别、BMI、种族、教育水平、收入水平、是否被告知患高血压、是否被告知处于高血压前期、是否被告知患妊娠高血压、现在是否在服用高血压药物、是否被告知患有高脂血症、是否被告知患有糖尿病、吸烟情况、过去30 d内是否至少喝过1次酒、是否为重度饮酒者、是否为酗酒者以及自我健康评价为冠心病的影响因素(P<0.05)。风险模型构建的分析结果显示:k最邻近算法、Logistic回归、支持向量机、决策树和XGBoost采用SMOTE处理不平衡数据的总体分类精度分别为59.2%、67.4%、66.2%、69.2%和85.9%,召回率分别为75.2%、71.4%、70.5%、62.9%和34.8%,精确度分别为15.4%、18.2%、17.5%、17.6%和28.7%,F值分别为0.256、0.290、0.280、0.275和0.315,受试者工作特征曲线下面积分别为0.80、0.78、0.72、0.72和0.82;采用随机过采样处理不平衡数据的总体分类精度分别为62.5%、68.5%、69.0%、60.2%和70.1%,召回率分别为70.0%、69.5%、71.9%、69.0%和67.6%;精确度分别为15.8%、18.4%、19.1%、14.8%和19.0%,F值分别为0.258、0.291、0.302、0.244和0.297,受试者工作特征曲线下面积分别为0.80、0.77、0.72、0.72和0.83。 结论 本研究不仅确认了已知冠心病的影响因素,还发现了自我健康评价水平、收入水平和教育水平对冠心病具有潜在影响。在使用2种数据平衡方法后,5种算法的性能显著提高。其中XGBoost模型表现最佳,可作为未来优化冠心病预测模型的参考。此外,鉴于XGBoost模型的优异性能以及逐步Logistic回归的操作便捷和可解释性,推荐在冠心病风险预测模型中结合使用数据平衡后的XGBoost和逐步Logistic回归分析。
中图分类号:
变量 | 英文问题 | 中文问题 | 赋值 |
---|---|---|---|
年龄 | What is your age? | 您的年龄是多少? | 45~54岁=1,55~64岁=2,≥65岁=3 |
种族 | Which one or more of the following would you say is your race? | 您属于以下哪一个或多个种族? | 白种人=1,黑种人=2,亚洲人=3,美印第安人=4,拉丁裔=5,其他=6 |
性别 | Are you male or female? | 您的性别是男性还是女性? | 男=1,女=2 |
婚姻状态 | Aer you married? | 您已婚吗? | 未婚=1,已婚=2 |
教育水平 | What is the highest grade or year of school you completed? | 您完成的最高学历是? | 初中及以下=1,高中=2,上过大学或技术学校(没毕业)=3,大学或技术学校毕业=4 |
收入水平 | Is your annual household income from all sources? | 您全家每年从所有来源获得的收入是多少? | <15 000美元=1,≥15 000美元且<25 000美元=2,≥25 000美元且<35 000美元=3,≥35 000美元且<50 000美元=4,≥50 000美元且<100 000美元=5,≥100 000美元且<200 000美元=6,≥200 000美元=7 |
家里有几个孩子 | How many children less than 18 years of age live in your household? | 您家里有多少未满18岁的孩子? | 0个=1,1个=2,2个=3,3个=4,≥4个=5 |
是否租房 | Do you own or rent your home? | 您的住房是自有还是租赁? | 否=0,是=1 |
是否被告知患高血压 | Have you ever been told by a doctor,nurse,or other health professional that you have high blood pressure? | 医生、护士或其他健康专业人员是否曾告诉您,您有高血压? | 否=0,是=1 |
是否被告知患妊娠高血压 | Have you ever been told by a doctor,nurse,or other health professional that you have told only during pregnancy? | 医生、护士或其他健康专业人员是否曾告诉您,您只在妊娠期间有高血压? | 否=0,是=1 |
是否被告知处于高血压前期 | Have you ever been told by a doctor,nurse,or other health professional that you have told borderline high or prehypertensive or elevated blood pressure? | 医生、护士或其他健康专业人员是否曾告诉您,您的血压处于边缘高值或前高血压状态? | 否=0,是=1 |
现在是否在服用高血压药物 | Are you currently taking prescription medicine for your high blood pressure? | 您目前是否正在服用处方药物控制高血压? | 否=0,是=1 |
是否被告知患有高脂血症 | Have you ever been told by a doctor,nurse or other health professional that your cholesterol is high? | 医生、护士或其他健康专业人员是否曾告诉您,您的胆固醇水平高? | 否=0,是=1 |
是否被告知患有糖尿病 | (Ever told)(you had)diabetes? | 医生、护士或其他健康专业人员是否曾告诉您,您患有糖尿病? | 否=0,是=1 |
是否被告知患处于糖尿病前期 | (Ever told)(you had)prediabetes or borderline diabetes? | 医生、护士或其他健康专业人员是否曾告诉您,您患有前期糖尿病或血糖边缘升高? | 否=0,是=1 |
吸烟情况 | Do you now smoke cigarettes every day,some days,or not at all? | 您现在是否每天吸烟,偶尔吸烟,还是根本不吸烟? | 从不吸烟=0,已经戒烟=1,现在偶尔吸烟=2,现在每天吸烟=3 |
过去30 d内是否至少喝过1次酒 | During the past 30 days,on the days when you drank,about how many drinks did you drink on the average? | 在过去的30天里,您喝酒的日子平均每天喝多少杯? | 0 d=0,≥1 d=1 |
是否为重度饮酒者 | Heavy drinkers (adult men having more than 14 drinks per week and adult women having more than 7 drinks per week) | 成年男性每周饮酒超过14杯,成年女性每周饮酒超过7杯 | 否=0,是=1 |
是否为酗酒者 | Binge drinkers (males having five or more drinks on one occasion,females having four or more drinks on one occasion) | 男性一次性饮酒5杯或以上,女性一次性饮酒4杯或以上 | 否=0,是=1 |
过去30 d内是否有体育锻炼 | During the past month,other than your regular job,did you participate in any physical activities or exercises such as running,calisthenics,golf,gardening,or walking for exercise? | 在过去的一个月中,除了您的常规工作外,您是否参加过跑步、健身操、高尔夫、园艺或散步等体育活动或锻炼? | 否=0,是=1 |
心理健康状况 | Now thinking about your mental health,which includes stress,depression,and problems with emotions,for how many days during the past 30 days was your mental health not good? | 现在让我们来谈谈您的心理健康,包括压力、抑郁以及情绪问题,在过去30 d里,有多少天您的心理健康状况不佳? | 非常好(0 d)=1,好(1~7 d)=2,一般(8~14 d)=3,不好(15~21 d)=4,非常不好(22~30 d)=5 |
自我健康评价 | Would you say that in general your health is? | 您认为您的总体健康状况如何? | 非常不好=1,不好=2,一般=3,好=4,非常好=5 |
BMI | About how much do you weigh without shoes? | 您不穿鞋时,您的体重大约是多少? | 连续变量 |
About how tall are you ? | 您的身高是多少? | ||
是否为冠心病0 | (Ever told) (you had) coronary heart disease? | 医生、护士或其他健康专业人员是否曾告诉您,您患有冠心病? | 否=0,是=1 |
表1 变量信息及其赋值
Table 1 Variables information and their assignments
变量 | 英文问题 | 中文问题 | 赋值 |
---|---|---|---|
年龄 | What is your age? | 您的年龄是多少? | 45~54岁=1,55~64岁=2,≥65岁=3 |
种族 | Which one or more of the following would you say is your race? | 您属于以下哪一个或多个种族? | 白种人=1,黑种人=2,亚洲人=3,美印第安人=4,拉丁裔=5,其他=6 |
性别 | Are you male or female? | 您的性别是男性还是女性? | 男=1,女=2 |
婚姻状态 | Aer you married? | 您已婚吗? | 未婚=1,已婚=2 |
教育水平 | What is the highest grade or year of school you completed? | 您完成的最高学历是? | 初中及以下=1,高中=2,上过大学或技术学校(没毕业)=3,大学或技术学校毕业=4 |
收入水平 | Is your annual household income from all sources? | 您全家每年从所有来源获得的收入是多少? | <15 000美元=1,≥15 000美元且<25 000美元=2,≥25 000美元且<35 000美元=3,≥35 000美元且<50 000美元=4,≥50 000美元且<100 000美元=5,≥100 000美元且<200 000美元=6,≥200 000美元=7 |
家里有几个孩子 | How many children less than 18 years of age live in your household? | 您家里有多少未满18岁的孩子? | 0个=1,1个=2,2个=3,3个=4,≥4个=5 |
是否租房 | Do you own or rent your home? | 您的住房是自有还是租赁? | 否=0,是=1 |
是否被告知患高血压 | Have you ever been told by a doctor,nurse,or other health professional that you have high blood pressure? | 医生、护士或其他健康专业人员是否曾告诉您,您有高血压? | 否=0,是=1 |
是否被告知患妊娠高血压 | Have you ever been told by a doctor,nurse,or other health professional that you have told only during pregnancy? | 医生、护士或其他健康专业人员是否曾告诉您,您只在妊娠期间有高血压? | 否=0,是=1 |
是否被告知处于高血压前期 | Have you ever been told by a doctor,nurse,or other health professional that you have told borderline high or prehypertensive or elevated blood pressure? | 医生、护士或其他健康专业人员是否曾告诉您,您的血压处于边缘高值或前高血压状态? | 否=0,是=1 |
现在是否在服用高血压药物 | Are you currently taking prescription medicine for your high blood pressure? | 您目前是否正在服用处方药物控制高血压? | 否=0,是=1 |
是否被告知患有高脂血症 | Have you ever been told by a doctor,nurse or other health professional that your cholesterol is high? | 医生、护士或其他健康专业人员是否曾告诉您,您的胆固醇水平高? | 否=0,是=1 |
是否被告知患有糖尿病 | (Ever told)(you had)diabetes? | 医生、护士或其他健康专业人员是否曾告诉您,您患有糖尿病? | 否=0,是=1 |
是否被告知患处于糖尿病前期 | (Ever told)(you had)prediabetes or borderline diabetes? | 医生、护士或其他健康专业人员是否曾告诉您,您患有前期糖尿病或血糖边缘升高? | 否=0,是=1 |
吸烟情况 | Do you now smoke cigarettes every day,some days,or not at all? | 您现在是否每天吸烟,偶尔吸烟,还是根本不吸烟? | 从不吸烟=0,已经戒烟=1,现在偶尔吸烟=2,现在每天吸烟=3 |
过去30 d内是否至少喝过1次酒 | During the past 30 days,on the days when you drank,about how many drinks did you drink on the average? | 在过去的30天里,您喝酒的日子平均每天喝多少杯? | 0 d=0,≥1 d=1 |
是否为重度饮酒者 | Heavy drinkers (adult men having more than 14 drinks per week and adult women having more than 7 drinks per week) | 成年男性每周饮酒超过14杯,成年女性每周饮酒超过7杯 | 否=0,是=1 |
是否为酗酒者 | Binge drinkers (males having five or more drinks on one occasion,females having four or more drinks on one occasion) | 男性一次性饮酒5杯或以上,女性一次性饮酒4杯或以上 | 否=0,是=1 |
过去30 d内是否有体育锻炼 | During the past month,other than your regular job,did you participate in any physical activities or exercises such as running,calisthenics,golf,gardening,or walking for exercise? | 在过去的一个月中,除了您的常规工作外,您是否参加过跑步、健身操、高尔夫、园艺或散步等体育活动或锻炼? | 否=0,是=1 |
心理健康状况 | Now thinking about your mental health,which includes stress,depression,and problems with emotions,for how many days during the past 30 days was your mental health not good? | 现在让我们来谈谈您的心理健康,包括压力、抑郁以及情绪问题,在过去30 d里,有多少天您的心理健康状况不佳? | 非常好(0 d)=1,好(1~7 d)=2,一般(8~14 d)=3,不好(15~21 d)=4,非常不好(22~30 d)=5 |
自我健康评价 | Would you say that in general your health is? | 您认为您的总体健康状况如何? | 非常不好=1,不好=2,一般=3,好=4,非常好=5 |
BMI | About how much do you weigh without shoes? | 您不穿鞋时,您的体重大约是多少? | 连续变量 |
About how tall are you ? | 您的身高是多少? | ||
是否为冠心病0 | (Ever told) (you had) coronary heart disease? | 医生、护士或其他健康专业人员是否曾告诉您,您患有冠心病? | 否=0,是=1 |
项目 | 非冠心病组(n=112 606) | 冠心病组(n=11 261) | χ2(t)值 | P值 |
---|---|---|---|---|
年龄[例(%)] | 1 279.863 | <0.001 | ||
45~54岁 | 17 705(17.3) | 697(6.7) | ||
55~64岁 | 27 109(26.5) | 2 082(20.0) | ||
≥65岁 | 57 403(56.2) | 7 610(73.3) | ||
性别[例(%)] | 815.090 | <0.001 | ||
男 | 42 771(41.8) | 5 860(56.4) | ||
女 | 59 446(58.2) | 4 529(43.6) | ||
种族[例(%)] | 246.436 | <0.001 | ||
白种人 | 79 561(77.8) | 8 619(83.0) | ||
黑种人 | 8 837(8.6) | 685(6.6) | ||
亚洲人 | 1 377(1.3) | 74(0.7) | ||
美印第安人 | 2045(2.0) | 206(2.0) | ||
拉丁裔 | 7 440(7.3) | 439(4.2) | ||
其他 | 2 957(2.9) | 366(3.5) | ||
婚姻状态[例(%)] | 9.609 | 0.002 | ||
未婚 | 54 208(53.0) | 5 675(54.6) | ||
已婚 | 48 009(47.0) | 4 714(45.4) | ||
教育水平[例(%)] | 113.105 | <0.001 | ||
初中及以下 | 6 990(6.8) | 881(8.5) | ||
高中 | 31 914(31.2) | 3 497(33.7) | ||
上过大学或技术学校(没毕业) | 32 410(31.7) | 3 318(31.9) | ||
大学或技术学校毕业 | 30 903(30.2) | 2 693(25.9) | ||
收入水平[例(%)] | 405.507 | <0.001 | ||
<15 000美元 | 4 078(4.0) | 476(4.6) | ||
15 000~ <25 000美元 | 5 448(5.3) | 788(7.6) | ||
25 000~ <35 000美元 | 6 821(6.7) | 906(8.7) | ||
35 000~ <50 000美元 | 9 694(9.5) | 1 277(12.3) | ||
50 000~ <100 000美元 | 20 512(20.1) | 2 237(21.5) | ||
100 000~ <200 000美元 | 24 461(23.9) | 2 234(21.5) | ||
≥200 000美元 | 31 203(30.5) | 2 471(23.8) | ||
家里有几个孩子[例(%)] | 230.841 | <0.001 | ||
0个 | 90 278(88.3) | 9 685(93.2) | ||
1个 | 6 624(6.5) | 405(3.9) | ||
2个 | 3 432(3.4) | 178(1.7) | ||
3个 | 1 269(1.2) | 76(0.7) | ||
≥4个 | 614(0.6) | 45(0.4) | ||
是否租房[例(%)] | 0.047 | 0.828 | ||
否 | 79 741(78.0) | 8 095(77.9) | ||
是 | 22 476(22.0) | 2 294(22.1) | ||
是否被告知患高血压[例(%)] | 2 630.292 | <0.001 | ||
否 | 47 417(46.4) | 2 096(20.2) | ||
是 | 54 800(53.6) | 8 293(79.8) | ||
是否被告知患妊娠高血压[例(%)] | 39.430 | <0.001 | ||
否 | 100 969(99.6) | 10 334(99.8) | ||
是 | 1 248(0.4) | 55(0.2) | ||
是否被告知处于高血压前期[例(%)] | 6.689 | 0.010 | ||
否 | 101 801(98.8) | 10 364(99.5) | ||
是 | 416(1.2) | 25(0.5) | ||
现在是否在服用高血压药物[例(%)] | 33.288 | <0.001 | ||
否 | 95 954(93.9) | 9 899(95.3) | ||
是 | 6 263(6.1) | 490(4.7) | ||
是否被告知患有高脂血症[例(%)] | 2 137.430 | <0.001 | ||
否 | 53 563(52.4) | 2 971(28.6) | ||
是 | 48 654(47.6) | 7 418(71.4) | ||
是否被告知患有糖尿病[例(%)] | 1 915.413 | <0.001 | ||
否 | 81 820(80.0) | 6 387(61.5) | ||
是 | 20 397(20.0) | 4 002(38.5) | ||
是否被告知处于糖尿病前期[例(%)] | 0.210 | 0.646 | ||
否 | 99 015(96.9) | 10 055(96.8) | ||
是 | 3 202(3.1) | 334(3.2) | ||
吸烟情况[例(%)] | 813.007 | <0.001 | ||
从不吸烟 | 53 198(52.0) | 3 999(38.5) | ||
已经戒烟 | 33 232(32.5) | 4 724(45.5) | ||
现在偶尔吸烟 | 3 904(3.8) | 412(4.0) | ||
现在每天吸烟 | 11 883(11.6) | 1 254(12.1) | ||
过去30 d内是否至少喝过1次酒[例(%)] | 252.923 | <0.001 | ||
否 | 59 061(57.8) | 6 841(65.8) | ||
是 | 43 156(42.2) | 3 548(34.2) | ||
是否为重度饮酒者[例(%)] | 68.305 | <0.001 | ||
否 | 97 308(95.2) | 10 076(97.0) | ||
是 | 4 909(4.8) | 313(3.0) | ||
是否为酗酒者[例(%)] | 115.244 | <0.001 | ||
否 | 93 784(91.7) | 9 843(94.7) | ||
是 | 8 433(8.3) | 546(5.3) | ||
过去30 d内是否有体育锻炼[例(%)] | 444.098 | <0.001 | ||
否 | 31 781(31.1) | 4 282(41.2) | ||
是 | 70 436(68.9) | 6 107(58.8) | ||
心理健康状况 | 285.921 | <0.001 | ||
非常不好 | 6 443(6.30) | 1 028(9.9) | ||
不好 | 902(0.9) | 127(1.2) | ||
一般 | 5 276(5.2) | 701(6.7) | ||
好 | 4 943(4.8) | 553(5.3) | ||
非常好 | 84 653(82.8) | 7 980(76.8) | ||
自我健康评价[例(%)] | 5 459.580 | <0.001 | ||
非常不好 | 5 500(5.4) | 1 973(19.0) | ||
不好 | 17 252(16.9) | 3 339(32.1) | ||
一般 | 36 093(35.3) | 3 334(32.1) | ||
好 | 31 637(31.0) | 1 469(14.10) | ||
非常好 | 11 735(11.5) | 274(2.6) | ||
BMI ( | 29.22±6.72 | 30.07±6.78 | -12.195a | <0.001 |
表2 冠心病与非冠心病组基本特征比较
Table 2 Sociodemographic characteristics of participants in the coronary and non-coronary groups
项目 | 非冠心病组(n=112 606) | 冠心病组(n=11 261) | χ2(t)值 | P值 |
---|---|---|---|---|
年龄[例(%)] | 1 279.863 | <0.001 | ||
45~54岁 | 17 705(17.3) | 697(6.7) | ||
55~64岁 | 27 109(26.5) | 2 082(20.0) | ||
≥65岁 | 57 403(56.2) | 7 610(73.3) | ||
性别[例(%)] | 815.090 | <0.001 | ||
男 | 42 771(41.8) | 5 860(56.4) | ||
女 | 59 446(58.2) | 4 529(43.6) | ||
种族[例(%)] | 246.436 | <0.001 | ||
白种人 | 79 561(77.8) | 8 619(83.0) | ||
黑种人 | 8 837(8.6) | 685(6.6) | ||
亚洲人 | 1 377(1.3) | 74(0.7) | ||
美印第安人 | 2045(2.0) | 206(2.0) | ||
拉丁裔 | 7 440(7.3) | 439(4.2) | ||
其他 | 2 957(2.9) | 366(3.5) | ||
婚姻状态[例(%)] | 9.609 | 0.002 | ||
未婚 | 54 208(53.0) | 5 675(54.6) | ||
已婚 | 48 009(47.0) | 4 714(45.4) | ||
教育水平[例(%)] | 113.105 | <0.001 | ||
初中及以下 | 6 990(6.8) | 881(8.5) | ||
高中 | 31 914(31.2) | 3 497(33.7) | ||
上过大学或技术学校(没毕业) | 32 410(31.7) | 3 318(31.9) | ||
大学或技术学校毕业 | 30 903(30.2) | 2 693(25.9) | ||
收入水平[例(%)] | 405.507 | <0.001 | ||
<15 000美元 | 4 078(4.0) | 476(4.6) | ||
15 000~ <25 000美元 | 5 448(5.3) | 788(7.6) | ||
25 000~ <35 000美元 | 6 821(6.7) | 906(8.7) | ||
35 000~ <50 000美元 | 9 694(9.5) | 1 277(12.3) | ||
50 000~ <100 000美元 | 20 512(20.1) | 2 237(21.5) | ||
100 000~ <200 000美元 | 24 461(23.9) | 2 234(21.5) | ||
≥200 000美元 | 31 203(30.5) | 2 471(23.8) | ||
家里有几个孩子[例(%)] | 230.841 | <0.001 | ||
0个 | 90 278(88.3) | 9 685(93.2) | ||
1个 | 6 624(6.5) | 405(3.9) | ||
2个 | 3 432(3.4) | 178(1.7) | ||
3个 | 1 269(1.2) | 76(0.7) | ||
≥4个 | 614(0.6) | 45(0.4) | ||
是否租房[例(%)] | 0.047 | 0.828 | ||
否 | 79 741(78.0) | 8 095(77.9) | ||
是 | 22 476(22.0) | 2 294(22.1) | ||
是否被告知患高血压[例(%)] | 2 630.292 | <0.001 | ||
否 | 47 417(46.4) | 2 096(20.2) | ||
是 | 54 800(53.6) | 8 293(79.8) | ||
是否被告知患妊娠高血压[例(%)] | 39.430 | <0.001 | ||
否 | 100 969(99.6) | 10 334(99.8) | ||
是 | 1 248(0.4) | 55(0.2) | ||
是否被告知处于高血压前期[例(%)] | 6.689 | 0.010 | ||
否 | 101 801(98.8) | 10 364(99.5) | ||
是 | 416(1.2) | 25(0.5) | ||
现在是否在服用高血压药物[例(%)] | 33.288 | <0.001 | ||
否 | 95 954(93.9) | 9 899(95.3) | ||
是 | 6 263(6.1) | 490(4.7) | ||
是否被告知患有高脂血症[例(%)] | 2 137.430 | <0.001 | ||
否 | 53 563(52.4) | 2 971(28.6) | ||
是 | 48 654(47.6) | 7 418(71.4) | ||
是否被告知患有糖尿病[例(%)] | 1 915.413 | <0.001 | ||
否 | 81 820(80.0) | 6 387(61.5) | ||
是 | 20 397(20.0) | 4 002(38.5) | ||
是否被告知处于糖尿病前期[例(%)] | 0.210 | 0.646 | ||
否 | 99 015(96.9) | 10 055(96.8) | ||
是 | 3 202(3.1) | 334(3.2) | ||
吸烟情况[例(%)] | 813.007 | <0.001 | ||
从不吸烟 | 53 198(52.0) | 3 999(38.5) | ||
已经戒烟 | 33 232(32.5) | 4 724(45.5) | ||
现在偶尔吸烟 | 3 904(3.8) | 412(4.0) | ||
现在每天吸烟 | 11 883(11.6) | 1 254(12.1) | ||
过去30 d内是否至少喝过1次酒[例(%)] | 252.923 | <0.001 | ||
否 | 59 061(57.8) | 6 841(65.8) | ||
是 | 43 156(42.2) | 3 548(34.2) | ||
是否为重度饮酒者[例(%)] | 68.305 | <0.001 | ||
否 | 97 308(95.2) | 10 076(97.0) | ||
是 | 4 909(4.8) | 313(3.0) | ||
是否为酗酒者[例(%)] | 115.244 | <0.001 | ||
否 | 93 784(91.7) | 9 843(94.7) | ||
是 | 8 433(8.3) | 546(5.3) | ||
过去30 d内是否有体育锻炼[例(%)] | 444.098 | <0.001 | ||
否 | 31 781(31.1) | 4 282(41.2) | ||
是 | 70 436(68.9) | 6 107(58.8) | ||
心理健康状况 | 285.921 | <0.001 | ||
非常不好 | 6 443(6.30) | 1 028(9.9) | ||
不好 | 902(0.9) | 127(1.2) | ||
一般 | 5 276(5.2) | 701(6.7) | ||
好 | 4 943(4.8) | 553(5.3) | ||
非常好 | 84 653(82.8) | 7 980(76.8) | ||
自我健康评价[例(%)] | 5 459.580 | <0.001 | ||
非常不好 | 5 500(5.4) | 1 973(19.0) | ||
不好 | 17 252(16.9) | 3 339(32.1) | ||
一般 | 36 093(35.3) | 3 334(32.1) | ||
好 | 31 637(31.0) | 1 469(14.10) | ||
非常好 | 11 735(11.5) | 274(2.6) | ||
BMI ( | 29.22±6.72 | 30.07±6.78 | -12.195a | <0.001 |
变量 | B | SE | Waldχ2值 | P值 | OR(95%CI) |
---|---|---|---|---|---|
年龄(以45~54岁为参照) | |||||
55-64岁 | 0.374 | 0.047 | 64.120 | <0.001 | 1.454(1.327~1.594) |
≥65岁 | 0.887 | 0.044 | 412.301 | <0.001 | 2.428(2.231~2.647) |
性别(以男为参照) | |||||
女 | -0.554 | 0.023 | 600.886 | <0.001 | 0.575(0.550~0.601) |
种族(以白种人为参照) | |||||
黑种人 | -0.475 | 0.044 | 118.304 | <0.001 | 0.622(0.570~0.677) |
亚洲人 | -0.581 | 0.125 | 21.619 | <0.001 | 0.559(0.434~0.709) |
美印第安人 | -0.106 | 0.079 | 1.807 | 0.179 | 0.900(0.769~1.047) |
拉丁裔 | -0.572 | 0.055 | 110.131 | <0.001 | 0.564(0.507~0.627) |
其他 | 0.051 | 0.061 | 0.694 | 0.405 | 1.052(0.933~1.183) |
教育水平(以初中及以下为参照) | |||||
高中 | 0.039 | 0.044 | 0.815 | 0.367 | 1.040(0.955~1.134) |
上过大学或技术学校(没毕业) | 0.11 | 0.044 | 6.134 | 0.013 | 1.116(0.955~1.219) |
大学或技术学校毕业 | 0.142 | 0.047 | 9.216 | 0.002 | 1.152(1.052~1.263) |
收入水平(以<15 000美元为参照) | |||||
15 000~<25 000美元 | 0.027 | 0.065 | 0.175 | 0.676 | 1.028(1.052~1.169) |
25 000~<35 000美元 | 0.007 | 0.064 | 0.012 | 0.912 | 1.007(0.889~1.142) |
35 000~<50 000美元 | 0.045 | 0.061 | 0.549 | 0.459 | 1.046(0.929~1.142) |
50 000~<100 000美元 | -0.048 | 0.058 | 0.693 | 0.405 | 0.953(0.851~1.142) |
100 000~<200 000美元 | -0.134 | 0.058 | 5.240 | 0.022 | 0.875(0.781~0.982) |
≥200 000美元 | -0.115 | 0.059 | 3.819 | 0.051 | 0.891(0.795~1.001) |
是否被告知患高血压(以否为参照) | |||||
是 | 0.751 | 0.028 | 729.208 | <0.001 | 2.118(2.006~2.237) |
是否被告知处于高血压前期(以否为参照) | |||||
是 | 0.427 | 0.214 | 3.986 | 0.046 | 1.532(2.006~2.282) |
现在是否在服用高血压药物(以否为参照) | |||||
是 | -0.482 | 0.051 | 90.103 | <0.001 | 0.617(0.558~0.681) |
是否被告知患有高脂血症(以否为参照) | |||||
是 | 0.622 | 0.024 | 668.066 | <0.001 | 1.863(1.778~1.954) |
是否被告知患有糖尿病(以否为参照) | |||||
是 | 0.327 | 0.024 | 180.769 | <0.001 | 1.387(1.322~1.455) |
吸烟情况(以从不吸烟为参照) | |||||
已经戒烟 | 0.342 | 0.024 | 197.654 | <0.001 | 1.408(1.342~1.477) |
现在偶尔吸烟 | 0.234 | 0.058 | 16.079 | <0.001 | 1.264(1.126~1.416) |
现在每天吸烟 | 0.194 | 0.038 | 26.602 | <0.001 | 1.214(1.127~1.306) |
过去30 d内是否至少喝过1次酒(以否为参照) | |||||
是 | -0.096 | 0.025 | 14.464 | <0.001 | 0.908(0.864~0.954) |
是否为重度饮酒者(以否为参照) | |||||
是 | -0.191 | 0.070 | 7.405 | 0.007 | 0.826(0.719~0.954) |
是否为酗酒者(以否为参照) | |||||
是 | -0.197 | 0.056 | 12.454 | <0.001 | 0.821(0.719~0.915) |
自我健康评价(以非常不好为参照) | |||||
不好 | -0.546 | 0.034 | 255.323 | <0.001 | 0.579(0.719~0.915) |
一般 | -1.215 | 0.035 | 1 238.794 | <0.001 | 0.297(0.277~0.318) |
好 | -1.758 | 0.041 | 1 840.236 | <0.001 | 0.172(0.159~0.187) |
非常好 | -2.185 | 0.070 | 987.994 | <0.001 | 0.112(0.159~0.129) |
BMI | -0.006 | 0.002 | 12.195 | <0.001 | 0.994(0.991~0.997) |
表3 Logistic回归分析结果
Table 3 Results of Logistic regression analysis
变量 | B | SE | Waldχ2值 | P值 | OR(95%CI) |
---|---|---|---|---|---|
年龄(以45~54岁为参照) | |||||
55-64岁 | 0.374 | 0.047 | 64.120 | <0.001 | 1.454(1.327~1.594) |
≥65岁 | 0.887 | 0.044 | 412.301 | <0.001 | 2.428(2.231~2.647) |
性别(以男为参照) | |||||
女 | -0.554 | 0.023 | 600.886 | <0.001 | 0.575(0.550~0.601) |
种族(以白种人为参照) | |||||
黑种人 | -0.475 | 0.044 | 118.304 | <0.001 | 0.622(0.570~0.677) |
亚洲人 | -0.581 | 0.125 | 21.619 | <0.001 | 0.559(0.434~0.709) |
美印第安人 | -0.106 | 0.079 | 1.807 | 0.179 | 0.900(0.769~1.047) |
拉丁裔 | -0.572 | 0.055 | 110.131 | <0.001 | 0.564(0.507~0.627) |
其他 | 0.051 | 0.061 | 0.694 | 0.405 | 1.052(0.933~1.183) |
教育水平(以初中及以下为参照) | |||||
高中 | 0.039 | 0.044 | 0.815 | 0.367 | 1.040(0.955~1.134) |
上过大学或技术学校(没毕业) | 0.11 | 0.044 | 6.134 | 0.013 | 1.116(0.955~1.219) |
大学或技术学校毕业 | 0.142 | 0.047 | 9.216 | 0.002 | 1.152(1.052~1.263) |
收入水平(以<15 000美元为参照) | |||||
15 000~<25 000美元 | 0.027 | 0.065 | 0.175 | 0.676 | 1.028(1.052~1.169) |
25 000~<35 000美元 | 0.007 | 0.064 | 0.012 | 0.912 | 1.007(0.889~1.142) |
35 000~<50 000美元 | 0.045 | 0.061 | 0.549 | 0.459 | 1.046(0.929~1.142) |
50 000~<100 000美元 | -0.048 | 0.058 | 0.693 | 0.405 | 0.953(0.851~1.142) |
100 000~<200 000美元 | -0.134 | 0.058 | 5.240 | 0.022 | 0.875(0.781~0.982) |
≥200 000美元 | -0.115 | 0.059 | 3.819 | 0.051 | 0.891(0.795~1.001) |
是否被告知患高血压(以否为参照) | |||||
是 | 0.751 | 0.028 | 729.208 | <0.001 | 2.118(2.006~2.237) |
是否被告知处于高血压前期(以否为参照) | |||||
是 | 0.427 | 0.214 | 3.986 | 0.046 | 1.532(2.006~2.282) |
现在是否在服用高血压药物(以否为参照) | |||||
是 | -0.482 | 0.051 | 90.103 | <0.001 | 0.617(0.558~0.681) |
是否被告知患有高脂血症(以否为参照) | |||||
是 | 0.622 | 0.024 | 668.066 | <0.001 | 1.863(1.778~1.954) |
是否被告知患有糖尿病(以否为参照) | |||||
是 | 0.327 | 0.024 | 180.769 | <0.001 | 1.387(1.322~1.455) |
吸烟情况(以从不吸烟为参照) | |||||
已经戒烟 | 0.342 | 0.024 | 197.654 | <0.001 | 1.408(1.342~1.477) |
现在偶尔吸烟 | 0.234 | 0.058 | 16.079 | <0.001 | 1.264(1.126~1.416) |
现在每天吸烟 | 0.194 | 0.038 | 26.602 | <0.001 | 1.214(1.127~1.306) |
过去30 d内是否至少喝过1次酒(以否为参照) | |||||
是 | -0.096 | 0.025 | 14.464 | <0.001 | 0.908(0.864~0.954) |
是否为重度饮酒者(以否为参照) | |||||
是 | -0.191 | 0.070 | 7.405 | 0.007 | 0.826(0.719~0.954) |
是否为酗酒者(以否为参照) | |||||
是 | -0.197 | 0.056 | 12.454 | <0.001 | 0.821(0.719~0.915) |
自我健康评价(以非常不好为参照) | |||||
不好 | -0.546 | 0.034 | 255.323 | <0.001 | 0.579(0.719~0.915) |
一般 | -1.215 | 0.035 | 1 238.794 | <0.001 | 0.297(0.277~0.318) |
好 | -1.758 | 0.041 | 1 840.236 | <0.001 | 0.172(0.159~0.187) |
非常好 | -2.185 | 0.070 | 987.994 | <0.001 | 0.112(0.159~0.129) |
BMI | -0.006 | 0.002 | 12.195 | <0.001 | 0.994(0.991~0.997) |
项目 | 总样本(n=112 606) | 随机样本(n=11 261) | χ2(t)值 | P值 |
---|---|---|---|---|
年龄[例(%)] | 0.063 | 0.969 | ||
45~54岁 | 65 013(57.7) | 6 504(57.8) | ||
55~64岁 | 18 402(16.3) | 1 848(16.4) | ||
≥65岁 | 29 191(25.9) | 2 909(25.9) | ||
性别[例(%)] | 0.546 | 0.460 | ||
男 | 48 631(43.2) | 4 904(43.5) | ||
女 | 63 975(56.8) | 6 357(56.5) | ||
种族[例(%)] | 4.341 | 0.501 | ||
白种人 | 88 180(78.3) | 8 783(78.0) | ||
黑种人 | 9 522(8.5) | 942(8.4) | ||
亚洲人 | 1 451(1.3) | 168(1.5) | ||
美印第安人 | 2 251(2.0) | 238(2.1) | ||
拉丁裔 | 7 879(7.0) | 789(7.0) | ||
其他 | 3 323(3.0) | 341(3.0) | ||
教育水平[例(%)] | 1.593 | 0.661 | ||
初中及以下 | 7 871(7.0) | 798(7.1) | ||
高中 | 35 411(31.4) | 3 522(31.3) | ||
上过大学或技术学校(没毕业) | 35 728(31.7) | 3 628(31.2) | ||
大学或技术学校毕业 | 33 596(29.8) | 3 313(29.4) | ||
收入水平[例(%)] | 5.847 | 0.440 | ||
<15 000美元 | 4 554(4.0) | 479(4.3) | ||
15 000~ <25 000美元 | 6 236(5.5) | 626(5.6) | ||
25 000~ <35 000美元 | 7 727(6.9) | 758(6.9) | ||
35 000~ <50 000美元 | 10 971(9.7) | 1 097(9.7) | ||
50 000~ <100 000美元 | 22 749(20.2) | 2 211(19.6) | ||
100 000~ <200 000美元 | 26 695(23.7) | 2 756(24.5) | ||
≥200 000美元 | 33 674(29.9) | 3 334(29.6) | ||
是否被告知患高血压[例(%)] | 0.304 | 0.581 | ||
否 | 49 513(44.0) | 4 921(43.7) | ||
是 | 63 093(56.0) | 6 340(56.3) | ||
是否被告知处于高血压前期[例(%)] | 0.492 | 0.483 | ||
否 | 112 165(99.6) | 11 212(99.6) | ||
是 | 441(0.4) | 49(0.4) | ||
现在是否在服用高血压药物[例(%)] | 0.046 | 0.830 | ||
否 | 105 853(94.0) | 10 580(94.0) | ||
是 | 6 753(6.0) | 681(6.0) | ||
是否被告知患有高脂血症[例(%)] | 0.077 | 0.782 | ||
否 | 56 534(50.2) | 5 669(50.3) | ||
是 | 56 072(49.8) | 5 592(49.7) | ||
是否被告知患有糖尿病[例(%)] | 0.724 | 0.395 | ||
否 | 88 207(78.3) | 8 860(78.7) | ||
是 | 24 399(21.7) | 2 401(21.3) | ||
吸烟情况[例(%)] | 6.211 | 0.102 | ||
从不吸烟 | 57 197(50.8) | 5 745(51.0) | ||
已经戒烟 | 37 956(33.7) | 3 856(34.2) | ||
现在偶尔吸烟 | 4 316(3.8) | 433(3.8) | ||
现在每天吸烟 | 13 137(11.7) | 1 227(10.9) | ||
过去30 d内是否至少喝过1次酒[例(%)] | 0.051 | 0.821 | ||
否 | 65 902(58.5) | 6 578(58.4) | ||
是 | 46 704(41.5) | 4 683(41.6) | ||
是否为重度饮酒者[例(%)] | 0.019 | 0.891 | ||
否 | 107 384(95.4) | 10 742(95.4) | ||
是 | 5 222(4.6) | 519(4.6) | ||
是否为酗酒者[例(%)] | 0.072 | 0.789 | ||
否 | 103 627(92.0) | 10 355(92.0) | ||
是 | 8 979(8.0) | 906(8.0) | ||
自我健康评价[例(%)] | 1.938 | 0.747 | ||
非常不好 | 7 473(6.6) | 749(6.7) | ||
不好 | 20 591(18.3) | 2 044(18.2) | ||
一般 | 39 427(35.0) | 3 917(34.8) | ||
好 | 33 106(29.4) | 3 376(30.0) | ||
非常好 | 12 009(10.7) | 1 175(10.4) | ||
BMI ( | 29.29±6.73 | 29.33±6.74 | -0.673a | 0.779 |
表4 总体样本与随机样本基本特征比较
Table 4 Comparison of general information between the overall sample and random sample
项目 | 总样本(n=112 606) | 随机样本(n=11 261) | χ2(t)值 | P值 |
---|---|---|---|---|
年龄[例(%)] | 0.063 | 0.969 | ||
45~54岁 | 65 013(57.7) | 6 504(57.8) | ||
55~64岁 | 18 402(16.3) | 1 848(16.4) | ||
≥65岁 | 29 191(25.9) | 2 909(25.9) | ||
性别[例(%)] | 0.546 | 0.460 | ||
男 | 48 631(43.2) | 4 904(43.5) | ||
女 | 63 975(56.8) | 6 357(56.5) | ||
种族[例(%)] | 4.341 | 0.501 | ||
白种人 | 88 180(78.3) | 8 783(78.0) | ||
黑种人 | 9 522(8.5) | 942(8.4) | ||
亚洲人 | 1 451(1.3) | 168(1.5) | ||
美印第安人 | 2 251(2.0) | 238(2.1) | ||
拉丁裔 | 7 879(7.0) | 789(7.0) | ||
其他 | 3 323(3.0) | 341(3.0) | ||
教育水平[例(%)] | 1.593 | 0.661 | ||
初中及以下 | 7 871(7.0) | 798(7.1) | ||
高中 | 35 411(31.4) | 3 522(31.3) | ||
上过大学或技术学校(没毕业) | 35 728(31.7) | 3 628(31.2) | ||
大学或技术学校毕业 | 33 596(29.8) | 3 313(29.4) | ||
收入水平[例(%)] | 5.847 | 0.440 | ||
<15 000美元 | 4 554(4.0) | 479(4.3) | ||
15 000~ <25 000美元 | 6 236(5.5) | 626(5.6) | ||
25 000~ <35 000美元 | 7 727(6.9) | 758(6.9) | ||
35 000~ <50 000美元 | 10 971(9.7) | 1 097(9.7) | ||
50 000~ <100 000美元 | 22 749(20.2) | 2 211(19.6) | ||
100 000~ <200 000美元 | 26 695(23.7) | 2 756(24.5) | ||
≥200 000美元 | 33 674(29.9) | 3 334(29.6) | ||
是否被告知患高血压[例(%)] | 0.304 | 0.581 | ||
否 | 49 513(44.0) | 4 921(43.7) | ||
是 | 63 093(56.0) | 6 340(56.3) | ||
是否被告知处于高血压前期[例(%)] | 0.492 | 0.483 | ||
否 | 112 165(99.6) | 11 212(99.6) | ||
是 | 441(0.4) | 49(0.4) | ||
现在是否在服用高血压药物[例(%)] | 0.046 | 0.830 | ||
否 | 105 853(94.0) | 10 580(94.0) | ||
是 | 6 753(6.0) | 681(6.0) | ||
是否被告知患有高脂血症[例(%)] | 0.077 | 0.782 | ||
否 | 56 534(50.2) | 5 669(50.3) | ||
是 | 56 072(49.8) | 5 592(49.7) | ||
是否被告知患有糖尿病[例(%)] | 0.724 | 0.395 | ||
否 | 88 207(78.3) | 8 860(78.7) | ||
是 | 24 399(21.7) | 2 401(21.3) | ||
吸烟情况[例(%)] | 6.211 | 0.102 | ||
从不吸烟 | 57 197(50.8) | 5 745(51.0) | ||
已经戒烟 | 37 956(33.7) | 3 856(34.2) | ||
现在偶尔吸烟 | 4 316(3.8) | 433(3.8) | ||
现在每天吸烟 | 13 137(11.7) | 1 227(10.9) | ||
过去30 d内是否至少喝过1次酒[例(%)] | 0.051 | 0.821 | ||
否 | 65 902(58.5) | 6 578(58.4) | ||
是 | 46 704(41.5) | 4 683(41.6) | ||
是否为重度饮酒者[例(%)] | 0.019 | 0.891 | ||
否 | 107 384(95.4) | 10 742(95.4) | ||
是 | 5 222(4.6) | 519(4.6) | ||
是否为酗酒者[例(%)] | 0.072 | 0.789 | ||
否 | 103 627(92.0) | 10 355(92.0) | ||
是 | 8 979(8.0) | 906(8.0) | ||
自我健康评价[例(%)] | 1.938 | 0.747 | ||
非常不好 | 7 473(6.6) | 749(6.7) | ||
不好 | 20 591(18.3) | 2 044(18.2) | ||
一般 | 39 427(35.0) | 3 917(34.8) | ||
好 | 33 106(29.4) | 3 376(30.0) | ||
非常好 | 12 009(10.7) | 1 175(10.4) | ||
BMI ( | 29.29±6.73 | 29.33±6.74 | -0.673a | 0.779 |
项目 | 训练集(n=9 009) | 测试集(n=2 252) | χ2(t)值 | P值 |
---|---|---|---|---|
年龄[例(%)] | 0.901 | 0.637 | ||
45~54岁 | 5 184(57.5) | 1 320(58.6) | ||
55~64岁 | 1 489(16.5) | 359(15.9) | ||
≥65岁 | 1 489(25.9) | 359(25.4) | ||
性别[例(%)] | 0.063 | 0.802 | ||
男 | 5 091(56.5) | 1 266(56.2) | ||
女 | 3 918(43.5) | 986(43.8) | ||
种族[例(%)] | 4.190 | 0.522 | ||
白种人 | 7 032(78.1) | 1 751(77.8) | ||
黑种人 | 741(8.2) | 201(8.9) | ||
亚洲人 | 136(1.5) | 32(1.4) | ||
美印第安人 | 200(2.2) | 38(1.7) | ||
拉丁裔 | 624(6.9) | 165(7.3) | ||
其他 | 276(3.1) | 65(2.9) | ||
教育水平[例(%)] | 0.900 | 0.993 | ||
初中及以下 | 641(7.1) | 157(7.0) | ||
高中 | 2 819(31.3) | 703(31.2) | ||
上过大学或技术学校(没毕业) | 2 898(32.2) | 730(32.4) | ||
大学或技术学校毕业 | 2 651(29.4) | 662(29.4) | ||
收入水平[例(%)] | 6.916 | 0.329 | ||
<15 000美元 | 389(4.3) | 90(4.0) | ||
15 000~ <25 000美元 | 522(5.8) | 104(4.6) | ||
25 000~ <35 000美元 | 598(6.6) | 160(7.1) | ||
35 000~ <50 000美元 | 862(9.6) | 235(10.4) | ||
50 000~ <100 000美元 | 1 767(19.6) | 444(19.7) | ||
100 000~ <200 000美元 | 2 206(24.5) | 550(24.4) | ||
≥200 000美元 | 2 665(29.6) | 669(29.7) | ||
是否被告知患高血压[例(%)] | 0.187 | 0.665 | ||
否 | 3 946(43.8) | 975(43.3) | ||
是 | 5 063(56.2) | 1 277(56.7) | ||
是否被告知处于高血压前期[例(%)] | 0.001 | 0.969 | ||
否 | 8 876(98.5) | 2 219(98.5) | ||
是 | 133(1.5) | 33(1.5) | ||
现在是否在服用高血压药物[例(%)] | 1.223 | 0.269 | ||
否 | 8 453(93.8) | 2 127(94.4) | ||
是 | 556(6.2) | 125(5.6) | ||
是否被告知患有高脂血症[例(%)] | 0.393 | 0.531 | ||
否 | 4 522(50.2) | 1 147(50.9) | ||
是 | 4 487(49.8) | 1 105(49.1) | ||
是否被告知患有糖尿病[例(%)] | 0.259 | 0.611 | ||
否 | 7 097(78.8) | 1 763(78.3) | ||
是 | 1 912(21.2) | 489(21.7) | ||
吸烟情况[例(%)] | 6.129 | 0.106 | ||
从不吸烟 | 4 549(50.5) | 1 196(53.1) | ||
已经戒烟 | 3 131(34.8) | 725(32.2) | ||
现在偶尔吸烟 | 343(3.8) | 90(4.0) | ||
现在每天吸烟 | 986(10.9) | 241(10.7) | ||
过去30 d内是否至少喝过1次酒[例(%)] | 0.046 | 0.830 | ||
否 | 5 267(58.5) | 1 311(58.2) | ||
是 | 3 742(41.5) | 941(41.8) | ||
是否为重度饮酒者[例(%)] | 0.062 | 0.804 | ||
否 | 8 596(95.4) | 2 146(95.3) | ||
是 | 413(4.6) | 106(4.7) | ||
是否为酗酒者[例(%)] | 0.011 | 0.918 | ||
否 | 8 283(91.9) | 2 072(92.0) | ||
是 | 726(8.1) | 180(8.0) | ||
自我健康评价[例(%)] | 3.294 | 0.510 | ||
非常不好 | 616(6.8) | 133(5.9) | ||
不好 | 1 626(18.0) | 418(18.6) | ||
一般 | 3 126(34.7) | 791(35.1) | ||
好 | 2 710(30.1) | 666(29.6) | ||
非常好 | 931(10.3) | 244(10.8) | ||
BMI ( | 29.35±6.78 | 29.28±6.49 | 0.428a | 0.668 |
表5 训练集样本与测试集样本基本特征比较
Table 5 Comparison of general information between the training set and test set samples
项目 | 训练集(n=9 009) | 测试集(n=2 252) | χ2(t)值 | P值 |
---|---|---|---|---|
年龄[例(%)] | 0.901 | 0.637 | ||
45~54岁 | 5 184(57.5) | 1 320(58.6) | ||
55~64岁 | 1 489(16.5) | 359(15.9) | ||
≥65岁 | 1 489(25.9) | 359(25.4) | ||
性别[例(%)] | 0.063 | 0.802 | ||
男 | 5 091(56.5) | 1 266(56.2) | ||
女 | 3 918(43.5) | 986(43.8) | ||
种族[例(%)] | 4.190 | 0.522 | ||
白种人 | 7 032(78.1) | 1 751(77.8) | ||
黑种人 | 741(8.2) | 201(8.9) | ||
亚洲人 | 136(1.5) | 32(1.4) | ||
美印第安人 | 200(2.2) | 38(1.7) | ||
拉丁裔 | 624(6.9) | 165(7.3) | ||
其他 | 276(3.1) | 65(2.9) | ||
教育水平[例(%)] | 0.900 | 0.993 | ||
初中及以下 | 641(7.1) | 157(7.0) | ||
高中 | 2 819(31.3) | 703(31.2) | ||
上过大学或技术学校(没毕业) | 2 898(32.2) | 730(32.4) | ||
大学或技术学校毕业 | 2 651(29.4) | 662(29.4) | ||
收入水平[例(%)] | 6.916 | 0.329 | ||
<15 000美元 | 389(4.3) | 90(4.0) | ||
15 000~ <25 000美元 | 522(5.8) | 104(4.6) | ||
25 000~ <35 000美元 | 598(6.6) | 160(7.1) | ||
35 000~ <50 000美元 | 862(9.6) | 235(10.4) | ||
50 000~ <100 000美元 | 1 767(19.6) | 444(19.7) | ||
100 000~ <200 000美元 | 2 206(24.5) | 550(24.4) | ||
≥200 000美元 | 2 665(29.6) | 669(29.7) | ||
是否被告知患高血压[例(%)] | 0.187 | 0.665 | ||
否 | 3 946(43.8) | 975(43.3) | ||
是 | 5 063(56.2) | 1 277(56.7) | ||
是否被告知处于高血压前期[例(%)] | 0.001 | 0.969 | ||
否 | 8 876(98.5) | 2 219(98.5) | ||
是 | 133(1.5) | 33(1.5) | ||
现在是否在服用高血压药物[例(%)] | 1.223 | 0.269 | ||
否 | 8 453(93.8) | 2 127(94.4) | ||
是 | 556(6.2) | 125(5.6) | ||
是否被告知患有高脂血症[例(%)] | 0.393 | 0.531 | ||
否 | 4 522(50.2) | 1 147(50.9) | ||
是 | 4 487(49.8) | 1 105(49.1) | ||
是否被告知患有糖尿病[例(%)] | 0.259 | 0.611 | ||
否 | 7 097(78.8) | 1 763(78.3) | ||
是 | 1 912(21.2) | 489(21.7) | ||
吸烟情况[例(%)] | 6.129 | 0.106 | ||
从不吸烟 | 4 549(50.5) | 1 196(53.1) | ||
已经戒烟 | 3 131(34.8) | 725(32.2) | ||
现在偶尔吸烟 | 343(3.8) | 90(4.0) | ||
现在每天吸烟 | 986(10.9) | 241(10.7) | ||
过去30 d内是否至少喝过1次酒[例(%)] | 0.046 | 0.830 | ||
否 | 5 267(58.5) | 1 311(58.2) | ||
是 | 3 742(41.5) | 941(41.8) | ||
是否为重度饮酒者[例(%)] | 0.062 | 0.804 | ||
否 | 8 596(95.4) | 2 146(95.3) | ||
是 | 413(4.6) | 106(4.7) | ||
是否为酗酒者[例(%)] | 0.011 | 0.918 | ||
否 | 8 283(91.9) | 2 072(92.0) | ||
是 | 726(8.1) | 180(8.0) | ||
自我健康评价[例(%)] | 3.294 | 0.510 | ||
非常不好 | 616(6.8) | 133(5.9) | ||
不好 | 1 626(18.0) | 418(18.6) | ||
一般 | 3 126(34.7) | 791(35.1) | ||
好 | 2 710(30.1) | 666(29.6) | ||
非常好 | 931(10.3) | 244(10.8) | ||
BMI ( | 29.35±6.78 | 29.28±6.49 | 0.428a | 0.668 |
模型 | 总体分类精度 | 召回率 | 精确度 | F值 | AUC |
---|---|---|---|---|---|
SMOTE | |||||
KNN | 0.592 | 0.752 | 0.154 | 0.256 | 0.800 |
逻辑回归 | 0.674 | 0.714 | 0.182 | 0.290 | 0.770 |
支持向量机 | 0.662 | 0.705 | 0.175 | 0.280 | 0.720 |
决策树 | 0.692 | 0.629 | 0.176 | 0.275 | 0.720 |
XGBoost | 0.859 | 0.348 | 0.287 | 0.315 | 0.830 |
Random over-sampling | |||||
KNN | 0.625 | 0.700 | 0.158 | 0.258 | 0.800 |
逻辑回归 | 0.685 | 0.695 | 0.184 | 0.291 | 0.780 |
支持向量机 | 0.690 | 0.719 | 0.191 | 0.302 | 0.720 |
决策树 | 0.602 | 0.690 | 0.148 | 0.244 | 0.720 |
XGBoost | 0.701 | 0.676 | 0.190 | 0.297 | 0.820 |
Unbalanced | |||||
KNN | 0.907 | 0 | NaN | NaN | NaN |
逻辑回归 | 0.907 | 0 | NaN | NaN | NaN |
支持向量机 | 0.907 | 0 | NaN | NaN | NaN |
决策树 | 0.907 | 0 | NaN | NaN | NaN |
XGBoost | 0.908 | 0.029 | 0.600 | 0.055 | NaN |
表6 冠心病风险预测模型的预测效能指标
Table 6 Indicators of predictive efficacy for the model predicting the risk of coronary heart disease
模型 | 总体分类精度 | 召回率 | 精确度 | F值 | AUC |
---|---|---|---|---|---|
SMOTE | |||||
KNN | 0.592 | 0.752 | 0.154 | 0.256 | 0.800 |
逻辑回归 | 0.674 | 0.714 | 0.182 | 0.290 | 0.770 |
支持向量机 | 0.662 | 0.705 | 0.175 | 0.280 | 0.720 |
决策树 | 0.692 | 0.629 | 0.176 | 0.275 | 0.720 |
XGBoost | 0.859 | 0.348 | 0.287 | 0.315 | 0.830 |
Random over-sampling | |||||
KNN | 0.625 | 0.700 | 0.158 | 0.258 | 0.800 |
逻辑回归 | 0.685 | 0.695 | 0.184 | 0.291 | 0.780 |
支持向量机 | 0.690 | 0.719 | 0.191 | 0.302 | 0.720 |
决策树 | 0.602 | 0.690 | 0.148 | 0.244 | 0.720 |
XGBoost | 0.701 | 0.676 | 0.190 | 0.297 | 0.820 |
Unbalanced | |||||
KNN | 0.907 | 0 | NaN | NaN | NaN |
逻辑回归 | 0.907 | 0 | NaN | NaN | NaN |
支持向量机 | 0.907 | 0 | NaN | NaN | NaN |
决策树 | 0.907 | 0 | NaN | NaN | NaN |
XGBoost | 0.908 | 0.029 | 0.600 | 0.055 | NaN |
[1] |
马丽媛,王增武,樊静,等. 《中国心血管健康与疾病报告2021》要点解读[J]. 中国全科医学,2022,25(27):3331-3346. DOI:10.12114/j.issn.1007-9572.2022.0506.
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
马婧怡,刘相佟,吕世云,等. 北京市成年人冠心病七年发病风险评估与预测模型[J]. 心肺血管病杂志,2022,41(1):25-30,50. DOI:10.3969/j.issn.1007-5062.2022.01.006.
|
[10] | |
[11] |
王晓丽,施天行,彭德荣,等. 两种机器学习算法构建老年冠心病患病风险评估模型的效能比较研究[J]. 中华全科医学,2021,19(4):523-527. DOI:10.16766/j.cnki.issn.1674-4152.001852.
|
[12] |
谭志军,梁英,石福艳,等. 基于企业健康管理的劳动力人群冠心病风险评估模型研究[J]. 现代预防医学,2017,44(12):2192-2195,2210.
|
[13] |
|
[14] |
齐俊锋,韩胜红,李俊琳,等. 心血管病危险因素的风险特征分析及疾病预测模型研究[J]. 现代预防医学,2022,49(18):3283-3287. DOI:10.20043/j.cnki.MPM.202111359.
|
[15] |
Delaware Department of Health and Social Services,Division of Public Health,Delaware Behavioral Risk Factor Survey (BRFS) [EB/OL]. [2023-04-30].
|
[16] |
The behavioral risk factor surveillance system[EB/OL].(2022-12-02)[2023-04-30].
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|
[33] |
|
[34] |
|
[35] |
|
[36] |
|
[37] |
|
[38] |
|
[39] |
|
[40] |
白皙,罗云云,周智博,等. 基于机器学习算法的大于胎龄儿风险预测模型[J]. 中华流行病学杂志,2021,42(12):2143-2148. DOI:10.3760/cma.j.cn112338-20210824-00677.
|
[41] |
马倩倩,孙东旭,石金铭,等. 基于支持向量机与XGboost的成年人群肿瘤患病风险预测研究[J]. 中国全科医学,2020,23(12):1486-1491. DOI:10.12114/j.issn.1007-9572.2020.00.066.
|
[1] | 程璐, 秦存, 柏品清, 王健英, 任亚萍, 胡晓娟, 张宝军, 张磊, 周一心. 儿童中医体质与血脂代谢的相关性:基于浦东新区儿童青少年生长发育及健康队列[J]. 中国全科医学, 2025, 28(06): 751-755. |
[2] | 石小天, 王珊, 杨华昱, 杨一帆, 李旭, 窦国泽, 马清. 基于血常规炎性指标构建衰弱/衰弱前期发生风险列线图模型研究[J]. 中国全科医学, 2025, 28(05): 587-593. |
[3] | 杜慧杰, 刘星雨, 徐明欢, 杨学智, 张慧琴, 莫佳丽, 卢依, 况杰. 急性缺血性脑卒中预后预测研究的应用进展:以机器学习预测模型为例[J]. 中国全科医学, 2025, 28(05): 554-560. |
[4] | 杨红, 刘成, 刘森, 邵琪琪, 夭元昊, 付真彦. 残余胆固醇与进展为主要不良心血管事件的非罪犯病变易损斑块的相关性研究[J]. 中国全科医学, 2025, 28(03): 299-304. |
[5] | 张铭, 王文娟, 郝问, 陈吉彬, 夏伟, 邵一兵, 王宾. 阻塞性睡眠呼吸暂停与急性冠脉综合征的相关性:临床研究的现状及展望[J]. 中国全科医学, 2025, 28(03): 257-261. |
[6] | 卢静, 孙国珍, 王洁, 高敏, 于甜栖, 孙姝怡, 王琴, 温高芹. 慢性心力衰竭患者社会衰弱现状及其影响因素可解释性分析研究[J]. 中国全科医学, 2025, 28(02): 220-227. |
[7] | 张冬莹, 叶培韬, 李洽胜, 简文华, 梁振宇, 郑劲平. 肺部听诊音数据库建库技术及方法研究[J]. 中国全科医学, 2024, 27(36): 4598-4608. |
[8] | 孙雪纯, 杜智勇, 于华惠, 吕倩雯, 焦晓璐, 王钰, 秦彦文. 溶血磷脂类代谢物对急性冠脉综合征患者经皮冠状动脉介入治疗术后主要不良心血管事件的预测价值:一项前瞻性队列研究[J]. 中国全科医学, 2024, 27(36): 4540-4545. |
[9] | 贾佳, 刘嘉慧, 季文君, 郑博, 王新刚, 范芳芳, 李寅, 张龙, 张岩. 急性心肌梗死患者血浆前蛋白转化酶枯草溶菌素9水平的影响因素研究[J]. 中国全科医学, 2024, 27(36): 4568-4574. |
[10] | 罗琴, 苟连平, 陈银, 苏凤. 小腿围和上臂围及Ishii评分对冠心病合并肌少症患者的诊断价值比较研究[J]. 中国全科医学, 2024, 27(35): 4403-4411. |
[11] | 古珊也, 周子懿, 蔡业峰. 糖脂代谢病发生非痴呆型血管性认知障碍的风险预测研究[J]. 中国全科医学, 2024, 27(35): 4412-4416. |
[12] | 贾高鹏, 曲泽, 李桂梅, 皇甫卫忠, 赵子豪, 闫爽, 陈秋雨, 张越. 药物涂层球囊治疗老年患者冠状动脉大血管原位病变的有效性和安全性:一项队列研究[J]. 中国全科医学, 2024, 27(33): 4125-4131. |
[13] | 刘忠典, 许琪, 陈伊静, 覃玲巧, 陈淑萍, 唐薇婷, 钟秋安. 心血管疾病中高风险人群颈动脉粥样硬化的识别:基于机器学习的预测模型及验证[J]. 中国全科医学, 2024, 27(30): 3763-3771. |
[14] | 李勇, 李占虎, 靳博伟, 李原, 张宏博, 苏亚坤, 闫小菊. 急性冠脉综合征患者血清补体C1q/肿瘤坏死因子相关蛋白5水平与冠状动脉病变程度及心肌纤维化蛋白指标的相关性研究[J]. 中国全科医学, 2024, 27(27): 3365-3371. |
[15] | 王凯阳, 余小林, 马玲, 陶静, 永佳蕙, 杨毅宁. 甲状腺功能异常对冠心病患者经皮冠状动脉介入治疗术后心脏结构及功能的影响:一项大型单中心回顾性队列研究[J]. 中国全科医学, 2024, 27(27): 3351-3358. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||