
info@juzhikan.asia
游雨欢 周燕玲* 黄洋洋
江西中医药大学计算机学院,江西南昌,330004;
摘要:该研究针对高维质谱数据噪声干扰、低丰度信号识别困难及传统模型在慢阻肺(COPD)代谢组学分型中的局限性,构建了基于Stacking的多模型融合框架。采用随机森林与XGBoost作为基模型,逻辑回归为元模型,结合领域知识驱动的特征选择策略与动态权重分配机制,有效提升了小样本场景下模型的稳定性与鲁棒性。实验表明,该框架在独立测试集上取得93.75%的准确率,显著优于单一模型。配套开发的智能医疗质谱数据分析平台实现了数据预处理、可视化、疾病预测及AI辅助分析功能,集成星火大模型API,支持自然语言交互、图表生成与知识问答。平台通过多模态数据处理与智能算法融合,为COPD精准诊疗提供了新型生物标志物组合与智能化决策工具,展现了机器学习与大模型技术在医疗数据分析领域的协同应用潜力。
关键词:质谱数据;慢阻肺;Stacking集成学习;随机森林;XGBoost;逻辑回归;智能医疗平台
参考文献
[1]苏远杰.基于质谱数据的核心岩藻糖鉴定方法与算法研究[D].西安电子科技大学,2021.
[2]胡强.基于质谱数据的智能识别技术研究[D].安徽大学,2021.
[3]刘鸿达,孙旭辉,李沂滨,等.基于卷积神经网络的图像分类深度学习模型综述[J/OL].计算机工程与应用,1-29[2025-03-12].http://kns.cnki.net/kcms/detail/11.2127.TP.20250213.1223.013.html.
[4]刘新平.基于代谢组学质谱数据的癌症检测技术研究[D].杭州电子科技大学,2023.
[5]吴菊华,郑稳,聂亚,陶雷.基于机器学习的慢阻肺患者再入院预测研究[J].广东工业大学学报,2025,42(1):15-23
[6] Kawata N, et al. Expiratory gas analysis using mass spectrometry in chronic obstructive pulmonary disease. Eur Respir J. 2019;54(suppl 63):PA4276.
[7]严勇,王鑫,杨慧中.基于决策树与质谱分析数据的癌症判别[J].无锡职业技术学院学报,2013,12(01):31-33.
[8]姬英超.基于机器学习的汽油质谱分析与应用研究[D].西安石油大学,2023.
[9]董哲原.基于质谱数据的疾病诊断及其可视化方法研究[D].吉林化工学院,2023.
[10]郭小川,冯贞贞,刘文瑞,等.基于Stacking集成算法的中医证候诊断模型建立——以肺癌为例[J].中医杂志,2024,65(17):1775-1783.
[11]周义.质谱数据处理算法的研究与应用设计[D].宁波大学,2017.