基于不良结局途径的ERα和PPARγ介导的女性生殖毒性预测模型的开发、验证与应用

《Ecotoxicology and Environmental Safety》:Development, validation and application of ERα- and PPARγ-mediated female reproductive toxicity prediction models based on adverse outcome pathway

【字体: 时间:2025年12月02日 来源:Ecotoxicology and Environmental Safety 6.1

编辑推荐:

  女性生殖毒性预测模型FeRetoxML及BiLSTM的开发与应用,整合ERα和PPARγ双通路AOP框架,结合高维分子特征与机器学习算法,显著提升预测精度(ERα通路84.6%,PPARγ通路83.3%),并成功应用于中国现有化学品数据库(IECSC)的预测。

  
该研究聚焦于开发一种新型基于不良结局路径(Adverse Outcome Pathway, AOP)的预测模型,用于高效筛选具有女性生殖毒性的化学物质。研究团队通过整合雌激素受体α(ERα)和过氧化物酶体增殖物激活受体γ(PPARγ)两条关键生物通路的分子机制,构建了双通路预测模型FeRetoxML,并对比了其与深度学习模型FeRetoxBiLSTM的性能差异,为化学安全评估提供了创新工具。

### 研究背景与意义
随着全球化学工业产量近50年增长500倍,约17.5%的育龄女性面临不孕问题(WHO, 2023)。传统动物实验方法存在周期长(通常需6个月)、成本高(单次实验超百万美元)和伦理争议等问题。尽管基于ERα通路的QSAR模型(如CERAPP项目)已能预测约32,000种化学品的子宫毒性,但这些模型存在两大缺陷:其一,仅关注单一通路(ERα介导的子宫毒性),而忽略了卵巢毒性(PPARγ通路)这一重要机制;其二,缺乏对毒性分子机制的解释能力。因此,开发整合多通路机制的预测模型成为亟待解决的科研问题。

### 技术路线创新
研究采用分层建模策略(图1),分两级构建预测体系:
1. **第一级:关键事件(KEs)建模**
- ERα通路包含8个KEs:从ERα配体结合(MIE)到子宫重量变化(AO)的全通路建模
- PPARγ通路包含4个KEs:从PPARγ激活(MIE)到动情周期紊乱(AO)的机制解析
- 数据预处理创新:采用分子枚举技术(Molecular Enumeration)处理类别失衡问题(活性样本占比不足20%),结合SMOTE过采样策略提升模型鲁棒性

2. **第二级:整合分类器**
- 首创双通路联合预测框架,通过Naive Bayes分类器动态权重分配,实现两种通路协同判别
- 引入严格的应用域(Application Domain, AD)界定标准:
* 提取特征空间前95%累计方差的主成分
* 通过t-SNE可视化确定化学物质分布边界
* 采用95%分位数法建立动态AD阈值

### 核心发现与验证
#### 模型性能突破
- **ERα通路**:模型准确率84.6%,AUC值达1.0(完美分类),显著优于传统模型IRFMN(76.9%)和CERAPP(61.5%)
- **PPARγ通路**:准确率83.3%,AUC值0.78,首次建立从PPARγ激活到卵巢周期紊乱的完整预测链条
- **跨通路验证**:在13,741种化学品测试中,模型成功识别出34种同时激活ERα和PPARγ通路的潜在生殖毒性物质

#### 机制解析突破
1. **ERα通路特征**:
- 活性化学物质普遍具有高芳香环含量(fr_benzene特征权重前20)
- logP值(疏水性)与分子重(Chi3n)呈现显著负相关(r=-0.67)
- 预测最关键的KEs为MIE(权重0.775)和AO(0.667)

2. **PPARγ通路特征**:
- QED值(质量修正疏水性指数)与毒性预测呈正相关(p<0.01)
- 分子电子拓扑特征(BCUT2D-CHGHI)贡献率达32.6%
- 脂溶性(logP)与毒性关联度最高(特征重要性0.31)

#### 实际应用验证
- **中国化学品清单(IECSC)**:
- ERα通路:覆盖96.27%化学品,识别26.72%潜在毒性物质
- PPARγ通路:覆盖96.78%化学品,识别19.76%毒性物质
- 双通路重叠区域占比0.24%(34/13741),精准捕捉交叉毒性
- **预测效率对比**:
- FeRetoxML模型对ERα通路预测耗时(1.2秒/万种化学品)仅为传统QSAR模型的1/5
- PPARγ通路预测成本降低40%,支持每日百万级化学品筛选

### 理论贡献与产业价值
1. **多通路协同机制**:
- 发现ERα/PPARγ通路存在"毒性放大效应":当两种通路同时激活时,毒性风险指数提升3.2倍(95%CI:2.1-4.5)
- 建立"双通路验证"机制:单一通路阳性需结合至少两个KEs证据链才确认毒性

2. **监管应用场景**:
- 化学优先级排序:基于模型预测风险值(0-1),对5000种现有化学品进行毒性等级划分(低/中/高风险)
- 替代实验设计:通过模型预测可减少62%的非必要动物实验(以ERα通路为例)
- 环境暴露评估:结合化学物质logP值和AD域分布,预测水体中96%的化合物可通过皮肤接触进入人体

3. **模型优化方向**:
- 数据层面:需补充PPARγ通路特异性数据(当前仅43例AO数据)
- 算法层面:探索图神经网络(GNN)在分子结构表征中的应用
- 验证体系:建议建立包含2000+独立验证样本的公共数据库

### 方法论创新
1. **动态特征融合**:
- 采用"特征空间三重验证"(分子描述符+Morgan指纹+MACCS指纹)
- 基于特征贡献度动态加权(ERα通路中分子描述符权重达66.7%)

2. **双模型对比验证**:
- FeRetoxML(传统ML模型)与FeRetoxBiLSTM(深度学习模型)对比:
* 准确率:ERα(84.6% vs 83.0%),PPARγ(83.3% vs 82.1%)
* 模型可解释性:FeRetoxML的SHAP特征重要性排序明确(前5特征累计贡献度达78%)
* 计算效率:BiLSTM模型训练耗时是传统方法的7.2倍

3. **严格AD界定**:
- 采用PCA降维(保留95%特征方差)+t-SNE可视化+95%分位数阈值的三重验证
- 建立动态AD更新机制:每季度纳入新增化学品数据重新校准

### 行业应用前景
1. **化学品注册阶段**:
- 自动化筛选出需优先进行动物实验的化学品(高风险组)
- 建立基于AD域的优先级排序算法,使监管资源分配效率提升60%

2. **风险评估阶段**:
- 生成化学品生殖毒性暴露评估报告(包含途径、剂量、效应概率)
- 预测地下水环境中30种微塑料衍生物的潜在毒性

3. **药物研发阶段**:
- 在化合物发现阶段嵌入毒性预测模块
- 已成功预警某类PPARγ激动剂(候选药物)的卵巢毒性风险

### 局限性分析
1. **数据瓶颈**:
- PPARγ通路AO数据仅43例,制约模型泛化能力
- 缺乏跨物种毒性数据(当前均为啮齿类动物模型)

2. **算法局限性**:
- 深度学习模型(BiLSTM)在类别不平衡时F1值下降19%
- 分子指纹提取可能丢失立体化学信息

3. **监管适配性**:
- 需建立与现有GLP标准兼容的模型验证流程
- 现有AD域覆盖范围达98%,但部分高极性化合物(logP>5)预测存在偏差

### 未来发展方向
1. **多组学数据融合**:
- 整合基因组学(KEs分子机制)和毒理学(AO组织病理)数据
- 开发时空毒性预测模型(考虑卵泡周期不同阶段的敏感性差异)

2. **实时更新系统**:
- 构建化学品毒性动态数据库(CDTD)
- 设计基于区块链的模型更新验证机制

3. **替代终点拓展**:
- 增加卵泡刺激素(FSH)和黄体生成素(LH)分泌水平预测
- 开发卵巢泡膜细胞(theca cells)体外模型替代动物实验

该研究为《OECD SIDS指南》第7版修订提供了关键技术支撑,建议在化学品注册指令(REACH)中纳入模型预测结果作为补充证据。模型已部署于哈尔滨医科大学毒理学国家重点实验室的监管信息平台,日均处理化学品查询量超10万次,显著提升我国化学品安全管理的数字化水平。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号