
-
生物通官微
陪你抓住生命科技
跳动的脉搏
人工智能与机器学习在环境健康研究中的应用
《Environment & Health》:Artificial Intelligence and Machine Learning for Environmental Health Study
【字体: 大 中 小 】 时间:2025年10月24日 来源:Environment & Health 6.3
编辑推荐:
人工智能与机器学习为环境健康领域提供创新解决方案,涵盖毒性预测(如QSAR/QSPR模型优化、多物种水生毒性预测)、风险评估(空间PM2.5预测、免疫毒性机制解析)、数据伦理(AI伦理指南制定)及绿色材料设计(离子液体筛选、环保塑料添加剂开发)等方面,强调模型集成与可解释性(XAI)的重要性。
环境暴露与人类健康之间的复杂关系构成了一个重大的全球性挑战,需要创新的解决方案。人工智能(AI)和机器学习(ML)在数据分析和模式识别方面表现出卓越的能力。将这些技术应用于环境健康领域,可以为改进和推进环境暴露评估、健康风险评估及相关政策制定提供新的见解。我们非常高兴地推出这期《环境与健康》(Environment & Health)关于机器学习和人工智能在环境健康应用的特刊。这一系列研究突显了ML和AI在应对紧迫和未来的环境健康问题方面的最新进展和巨大潜力。
AI/ML在环境领域的最常见应用是预测某些污染物的毒性。作为重要的毒性预测工具,定量结构-活性关系(QSAR)和定量结构-性质关系(QSPR)模型旨在根据化合物的结构信息预测其生物活性和毒性。AI/ML提升了QSPR模型的性能。Liu等人应用了经典的ML模型和深度学习模型来评估化学物质是否为肺表面活性剂抑制剂,其中多层感知(MLP)模型表现最佳(DOI: 10.1021/envhealth.4c00118)。在另一项研究中,开发了一种基于集成学习的AquaticTox工具,结合了六种不同的机器学习和深度学习方法(包括GACNN、随机森林、AdaBoost、梯度提升、支持向量机和FCNet),用于预测五种水生生物(Oncorhynchus mykiss、Pimephales promelas、Daphnia magna、Pseudokirchneriella subcapitata和
虽然提高QSPR模型的预测性能很重要,但可解释的人工智能(XAI)能够进一步解释机器学习模型的工作原理。XAI有助于理解这些“黑箱”模型,提高模型预测的透明度,这对于其在监管和公共卫生决策中的应用至关重要。Rosa等人利用局部可解释模型不可知解释(LIME)方法结合随机森林(RF)分类器模型,识别出影响五种关键核受体靶点(雄激素受体(AR)、雌激素受体(ER)、芳烃受体(AhR)、芳香化酶受体(ARO)和过氧化物酶体增殖激活受体(PPAR)的分子片段(DOI: 10.1021/envhealth.4c00218)。
实验数据的缺乏是QSPR模型的瓶颈之一。Xu等人的工作开发了一种线性QSAR模型,用于预测五种抗生素二元混合物的时变毒性,并发现氢键供体与带正电荷的药效团点对在拓扑距离为四个键时的数量会显著影响混合物的毒性(DOI: 10.1021/envhealth.4c00001)。由于数据有限且机制复杂,免疫毒性也难以预测。Daood等人利用大型公共毒性数据集,通过计算建模策略建立了QSAR模型,连接了与AhR相关的关键事件,揭示了潜在的免疫毒性机制(DOI: 10.1021/envhealth.4c00026)。
环境暴露评估需要高分辨率的空间和时间数据,而这通常难以通过常规的环境监测获得。机器学习可以解决这一问题。例如,可以训练不同的机器学习模型来进行全国范围内的每日PM2.5空间预测,或者使用集成模型。这种方法可用于评估短期健康风险(DOI: 10.1021/envhealth.4c00201)。
除了空气污染,AI和ML还应用于下一代风险评估。其中一个关键步骤是从体外实验到体内实验的外推(IVIVE),即将体外实验中的生物活性化学浓度转化为体内应用的数据。Han等人回顾了当前的IVIVE研究,强调了基于生理学的毒代动力学(PBTK)模型和机器学习算法在化学物质优先级排序、危害评估和监管决策中的应用(DOI: 10.1021/envhealth.4c00043)。
环境因素与健康结果之间的关系也受益于AI/ML。Midya等人研究了金属暴露对肠道炎症的影响,同时考虑了妊娠期暴露和儿童肠道微生物组的影响。一种名为“重复保留签名迭代随机森林”(rh-SiRF)的可解释算法有助于识别与健康结果相关的多组预测因子组合,即所谓的“金属-微生物群体特征”(DOI: 10.1021/envhealth.4c00125)。
AI/ML还可以改进与环境相关的组学研究。Wei等人利用深度学习,特别是简化的一维卷积神经网络(1DCNN),分析了同步辐射X射线荧光(SRXRF)得到的代谢组数据,构建了恶性肺结节的分类模型,而无需量化金属元素浓度(DOI: 10.1021/envhealth.4c00124)。这种方法提供了一种侵入性更小、更易于处理的肺癌诊断方法,可以作为识别恶性肺结节的“指纹代谢组谱型”。
绿色化学也可以从AI/ML中受益。Li等人提出了一个名为GPstack-RNN的框架,用于筛选具有高抗菌能力和低细胞毒性的离子液体。这种深度学习模型有助于加速发现有用、安全且可持续的材料(DOI: 10.1021/envhealth.4c00088)。同时,Hao等人讨论了机器学习(尤其是深度学习)在发现最佳绿色塑料添加剂方面的潜力(DOI: 10.1021/envhealth.5c00036)。
环境健康相关数据的激增带来了研究机会,同时也引发了关键的伦理问题。Yu等人提出了AI时代数据收集、数据分析和数据共享的伦理指南(DOI: 10.1021/envhealth.4c00273)。他们提出了一些检查点,如对模拟或增强数据的明确标注、模型架构和超参数优化的适当记录以跟踪偏差,以及实施XAI技术以提高模型的可解释性。始终重要的是要促进负责任的数据实践,以最大化AI和大数据的好处,同时保持科学诚信并保护个人隐私。
总之,这期特刊涵盖了与AI/ML相关的各种主题,包括毒性预测、风险评估、暴露评估、环境友好型材料设计以及数据伦理。与单一模型相比,集成模型表现出了令人印象深刻的性能,而深度学习往往能取得更好的效果。引入了XAI和其他可解释算法来研究某些暴露过程的机制。基于AI/ML的新策略、工具或框架已被提出,以解决环境健康问题。我们希望这期特刊能够激发研究灵感,并促进更多相关研究的发展。