NeXtMD:基于机器学习和深度学习堆叠混合框架的抗炎肽精准识别新方法

【字体: 时间:2025年07月16日 来源:BMC Biology 4.4

编辑推荐:

  研究人员针对抗炎肽(AIPs)识别中特征提取不足和模型集成有限的挑战,开发了NeXtMD双模块堆叠框架,整合机器学习(ML)和深度学习(DL)技术。通过融合残基组成(DDE)、K间隔氨基酸对组成(CKSAAP)等四类序列特征,结合随机森林(RF)和ResNeXt网络,模型在AUC(0.8607)等指标上超越现有方法,为抗炎药物开发提供高效计算工具。

  

炎症是机体应对损伤的核心防御机制,但慢性炎症与肥胖相关肾病等疾病密切相关。当前临床抗炎药物存在耐药性和副作用问题,而抗炎肽(AIPs)因其高特异性和低毒性成为研究热点。然而,短肽序列信息有限且实验验证成本高昂,传统计算方法存在特征表征单一、模型偏差大等瓶颈。

电子科技大学生命科学与技术学院临床医院的研究团队在《BMC Biology》发表研究,提出NeXtMD混合框架。该研究通过整合四类序列特征和两阶段预测策略,显著提升AIPs识别精度,为肽类抗炎药物开发提供新范式。

关键技术包括:1) 从IEDB数据库获取4,194条实验验证的AIPs/non-AIPs序列;2) 设计DDE、CKSAAP等四类序列描述符;3) 构建包含RF、XGBoost等ML分类器的初级预测模块;4) 采用多分支残差网络(ResNeXt)进行预测优化;5) 通过五折交叉验证评估模型性能。

数据集表征与序列特征分析

研究发现AIPs长度多集中在10-30个氨基酸(80%),富含赖氨酸(K)、精氨酸(R)等亲水残基,而非AIPs偏好天冬氨酸(D)等酸性残基。序列标识分析显示AIPs存在亮氨酸(L)、丙氨酸(A)等保守位点,而non-AIPs序列模式分散。

NeXtMD模型性能验证

集成RF、XGBoost等四种ML分类器的初级模块AUC达0.8149,结合ResNeXt后提升至0.8607。在外部测试集DeepAIP上AUC达0.9374,显示优异泛化能力。模型在抗菌肽(AMPs)预测中AUC达0.9706,证实跨任务迁移性。

与现有方法比较

NeXtMD在六项指标中五项领先,AUC比TriStack(0.7900)、AIPStack(0.7650)分别提高8.9%和12.5%。特征消融实验证实四类描述符和所有分类器均贡献显著,去除任意组件均导致性能下降>5%。

讨论与意义

该研究创新性地融合ML特征工程与DL表征学习,突破传统方法单分类器局限。通过UMAP可视化证实模型能有效分离AIPs/non-AIPs簇群(silhouette score提升37%,p<0.001)。临床关联性体现在:1) 捕获的疏水性模式与LL-37等临床肽特性吻合;2) 特征重要性分析与Nrf2通路等已知抗炎机制一致。局限在于当前数据未涵盖>40aa长肽,未来可探索Transformer架构优化长程依赖建模。

研究为炎症性疾病治疗提供新思路,如通过预测模型加速类似PXL01(已完成II期临床试验)的肽类药物开发。方法论层面提出的堆叠框架可扩展至AMP等其它功能肽预测,推动计算生物学在精准医疗中的应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号