基于用户留存行为的机器学习方法在预测环境出行模式中的应用

《Environmental Science & Technology》:Machine Learning for Predicting Environmental Mobility Based on Retention Behavior

【字体: 时间:2025年10月24日 来源:Environmental Science & Technology 11.3

编辑推荐:

  vPvM化合物威胁环境与健康,因Koc数据缺乏,本研究利用RPLC数据构建随机森林模型预测其环境移动性,在测试集F1达0.87-0.96,成功应用于64,492种REACH化学品分类,提供可扩展的优先级评估工具。

  
摘要图片

非常持久且具有高迁移性的物质(vPvM)对环境和人类健康构成威胁。这类化学物质能够在水生系统中长期存在,并由于其对水的亲和力而比在土壤或其他吸附剂上移动得更快。化学物质的迁移性通常通过有机碳-水分配系数(Koc)来表征,但大多数物质的实验数据缺失。随着每年有数千种新化学物质进入市场,人们越来越需要先进的化学信息学工具来优先识别这些有害物质。由于反相液相色谱(RPLC)数据更为常见,因此本文使用其作为环境迁移性的替代指标。通过对RPLC数据集中的146,902种化学物质进行洗脱分析,根据其有机修饰剂的含量来划分它们的迁移性等级。对于每种化学物质,计算了881个PubChem指纹图谱以捕获其结构信息。随后使用随机森林分类器根据保留时间和指纹图谱来预测其迁移性。该模型在测试集上的F1分数分别为:非常迁移性物质0.87、迁移性物质0.81、非迁移性物质0.96。将该模型应用于所有REACH注册的化学物质(n = 64,492种),结果有20%被归类为非常迁移性物质,26%为迁移性物质,53%为非迁移性物质,从而实现了一种可扩展的早期识别vPvM物质的工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号