机器学习驱动的肺功能参考方程:与GAMLSS和GLI标准的比较及其在约旦成人中的应用价值

【字体: 时间:2025年10月05日 来源:European Clinical Respiratory Journal 1.4

编辑推荐:

  本研究系统评估了机器学习(ML)在构建肺功能参考方程中的效能,与传统GAMLSS模型及全球标准(GLI)进行对比。结果表明,ML模型在预测FEV1、FVC等指标时表现出优异的校准能力和临床一致性,尤其适用于特定人群(如约成人)的呼吸功能评估,为呼吸疾病诊断提供了更精准、易用的工具。

  
引言
肺功能检测在呼吸医学中具有核心地位,通过测量一秒用力呼气容积(FEV1)、用力肺活量(FVC)及其比值(FEV1/FVC)等参数,为肺部疾病的诊断与管理提供客观依据。准确解读肺功能数据依赖于能够反映特定人群生理标准的参考方程。尽管广义加性模型(GAMLSS)在临床上被广泛接受,但其复杂性和应用难度限制了在资源有限环境中的推广。机器学习(ML)作为一种数据驱动的建模方法,能够捕捉预测变量与结果之间的复杂非线性关系,且无需预设分布形式,为肺功能参考方程的构建提供了新的可能。
方法
本研究采用两阶段设计。第一阶段利用此前用于构建约旦GAMLSS方程的同一数据集(包含1948名健康非吸烟成年人,54.2%为女性)训练多种ML模型,包括随机森林(RF)、支持向量机(SVM)、广义线性模型(GLM)、梯度提升机(GBM)、K近邻(KNN)以及集成模型,以年龄和身高为预测变量,分别预测FEV1、FVC和FEV1/FVC。模型性能通过五折交叉验证重复三次进行评估,选用均方根误差(RMSE)、平均绝对误差(MAE)和决定系数(R2)作为评价指标。正常值下限(LLN)的计算公式为:预测值减去1.645倍RMSE。
第二阶段则新招募487名健康非吸烟约旦成年人(46.6%为女性)作为外部验证样本,用于比较ML模型与约旦GAMLSS方程、GLI 2012方程及GLI 2022方程的性能。评估内容包括z分数分布、残差图以及临床诊断一致性分析,特别关注了z分数落在±0.5和±1.0阈值内的比例。
结果
模型性能比较显示,在男性中,GLM模型对原始数据的FEV1(R2 = 0.60)、FVC(R2 = 0.54)和FEV1/FVC(R2 = 0.24)预测效果最佳;在女性中,GLM对FEV1(R2 ≈ 0.53)、GBM对FVC的预测表现最优。对数变换并未显著改善模型拟合效果。z分数分布图表明,ML模型的预测值在不同年龄组中均围绕零值分布,无明显年龄相关偏差。
外部验证中,ML模型与约旦GAMLSS方程表现出高度一致性。例如,男性FEV1的预测与约旦方程的平均差异仅为0.03,100%的z分数落在±0.5范围内。相比之下,GLI 2012高加索人方程则显示出明显的系统性高估(平均差异达0.99),仅有7%的z分数落在±0.5范围内。在女性中,ML模型同样与约旦方程和GLI 2022方程高度相关,但与GLI 2012高加索人方程存在较大偏差。
临床分类方面,ML模型和约旦方程将所有健康参与者正确分类为肺功能正常,而GLI 2012方程则将相当一部分健康个体误判为限制性或非特异性模式(男性28.3%,女性30%),凸显了其在校准上的不足。
讨论
本研究证实了机器学习在开发肺功能参考方程方面的实用性与有效性。ML模型不仅能够提供与GAMLSS相媲美的预测精度,还具备模型构建相对简单、易于更新的优势。其强大的数据适应能力使其特别适合于开发特定人群的参考标准,避免直接应用国际标准可能带来的误诊风险。
研究结果与先前在伊朗人群中的发现一致,即ML模型(如KNN回归)比传统方法更能贴合观测数据。尽管本研究中某些指标的R2值低于部分文献报道,但这可能与研究人群、样本量及模型选择差异有关。选择保留未转换的模型输出,主要是为了增强其在多样化和资源有限场景中的实用性和可解释性。
从临床角度看,参考方程在正常值下限附近的校准尤为重要。GLI方程,尤其是2012版高加索人方程,表现出的系统性高估会扩大“正常”范围,可能导致早期病变被忽略。2022版的GLI方程虽有改进,但在特定人群(如约旦人)中仍与本地模型存在差距。这再次强调了发展及应用本地化参考方程的重要性。
优势与局限性
本研究的优势包括采用独立样本进行外部验证,使用重复交叉验证以增强模型稳健性,测试多种算法并针对不同结局选择最佳模型,以及提供临床可用的年龄-身高网格图辅助实践。
局限性主要体现在:ML模型的部署依赖软件环境,在缺乏数字基础设施的地区应用受限;第二阶段样本采用非概率抽样,可能影响其在分布极端处的泛化能力;研究对象年龄限于18-70岁,结论不适用于儿童、青少年及70岁以上老年人。
未来研究方向应包括在更广泛的人群(不同社会经济背景、地域)中验证这些ML模型,扩展年龄范围以覆盖全生命周期,并开发用户友好的临床工具,促进ML驱动的肺功能评估在常规诊疗,尤其是资源有限 settings 中的整合应用。
结论
机器学习为肺功能参考方程的构建提供了强大且实用的替代方案。本研究开发的ML方程与观测数据高度吻合,其性能媲美甚至优于本国GAMLSS方程及国际GLI标准。其相对简化的开发流程、捕捉非线性模式的能力以及良好的校准特性,使其特别适用于缺乏合适本地方程或国际标准与本地人群不符的场景。独立验证结果凸显了人群特异性参考方程的价值及直接套用全球标准的潜在风险。具备相应基础设施的前提下,基于机器学习的肺功能方程有望提升诊断准确性,减少误分类,推动跨不同人群的更公平的呼吸系统疾病诊疗。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号