基于机器学习预测韩国成年人全氟及多氟烷基物质(PFASs)高暴露风险的研究及其公共卫生意义

【字体: 时间:2025年09月29日 来源:International Journal of Hydrogen Energy 8.3

编辑推荐:

  本研究创新性地运用六种机器学习算法(包括RF、GBM、XGBoost、LR、SVM和KNN),构建了全变量(64个)和精简(10个基础健康指标)模型,成功预测韩国国家环境健康调查(KoNEHS)人群中PFAS高暴露个体,平衡准确率达82%。年龄(>45岁)、血汞、血铅及血常规参数(如血红蛋白、ALT、红细胞计数)被识别为关键预测因子,证明ML技术在PFAS暴露风险评估中的高效性与实用性,为公共卫生干预提供低成本筛查策略。

  
Highlight
本研究首次评估多种机器学习(ML)算法在不同因子组合下预测全氟及多氟烷基物质(PFAS)高暴露的性能。我们利用临床实验室常用信息,开发出能够高概率预测PFAS高暴露人群的模型。
Discussion
我们开发的ML模型展现出卓越的预测性能。即使排除简单的K近邻(KNN)算法,大多数ML算法仍实现了较高的整体性能。精简模型仅使用10个变量就达到了与全模型(包含64个变量)相近的预测能力,其平衡准确率超过80%,曲线下面积(AUC)超过0.87。这一结果凸显了ML算法在识别PFAS高暴露人群方面的有效性。
年龄被确定为PFAS暴露的最重要预测因子,45岁以上人群的暴露风险显著升高。这一发现与先前研究一致,表明年龄与PFAS累积之间存在强关联。在全模型中,血清汞和血清铅水平也是关键预测因子,这暗示了重金属与PFAS之间可能存在共同的暴露源或生物累积机制。
在精简模型中,血红蛋白(Hb)、丙氨酸氨基转移酶(ALT)、红细胞(RBC)计数和血小板计数成为重要预测指标。PFAS暴露与血液参数之间的关联可能源于其潜在的造血毒性和肝毒性效应。PFAS化合物可通过干扰细胞膜完整性、诱导氧化应激或影响肝脏代谢功能,进而改变血细胞生成和周转。
本研究结果与既往文献高度一致。例如,PFAS暴露与免疫抑制、疫苗反应降低及自身免疫疾病风险增加的相关性,进一步支持了血液参数作为暴露生物标志物的合理性。ML模型在此领域的应用优势在于其能够捕捉变量间复杂的非线性关系,而传统统计方法可能无法有效识别这些模式。
Conclusions
本研究强调了机器学习(ML)在增进我们对PFAS暴露的理解和管理中的关键作用。我们的结果表明,精简模型仅利用有限的健康数据即可有效预测PFAS高暴露,其表现与更复杂的模型相当。未来研究应扩展数据集并纳入纵向研究,以提升模型在不同人群中的适用性和准确性。解决这些空白将深化我们对PFAS暴露机制的理解,并推动针对性公共卫生策略的制定。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号