吉林省松原市吉林油田总医院,吉林省松原市,138001;
摘要:针对II型糖尿病早期诊断难题,本研究构建了基于机器学习的诊断模型。采用NHANES及中国东北地区体检数据集,经SMOTE和MICE方法预处理后,训练评估8种机器学习算法。XGBoost模型表现最佳,在NHANES数据集上准确率0.87、AUC值0.90,在中国东北地区体检数据集上准确率0.85、AUC值0.91,泛化能力强。该模型助力II型糖尿病早期干预治疗,改善患者预后,为医疗诊断模型选择提供参考。
关键词:糖尿病;机器学习;早期诊断;分类模型;ROC曲线
参考文献
[1]廖涌.中国糖尿病的流行病学现状及展望[J].重庆医科大学学报,2015,40(7):4.
[2]文世林.糖尿病流行的全球趋势和国内现状[J].河南诊断与治疗杂志,2002,16(1):3.
[3]刘佳璇,李代伟,任李娟,等.面向不平衡医疗数据的多阶段混合特征选择算法[J].计算机工程与应用,2025,61(2):158-169.