基于AlphaFold2与集成学习的蛋白质丙二酰化位点精准预测新方法

【字体: 时间:2025年10月07日 来源:Molecular Diversity 3.8

编辑推荐:

  来自国内的研究人员针对蛋白质丙二酰化修饰位点实验鉴定成本高、周期长的问题,开发了融合三维结构特征与序列物理化学特征的Catsoft_Kmalsite预测模型。该模型通过AlphaFold2获取结构信息,结合CTDC/EAAC/EGAAC特征提取与贝叶斯优化集成策略,在五折交叉验证和独立测试集上均显著优于现有方法(AUC达95.18%),为疾病机制研究提供了高效计算工具。

  
蛋白质的丙二酰化修饰(Malonylation)与糖尿病、癌症等多种疾病密切相关,精准识别其修饰位点对揭示疾病分子机制具有重要意义。传统实验方法存在成本高、周期长等技术瓶颈,而人工智能的发展为计算预测蛋白质翻译后修饰位点提供了新思路。
本研究提出名为Catsoft_Kmalsite的丙二酰化位点预测模型,其核心创新在于整合了蛋白质三维结构特征与序列/物理化学特征(通过CTDC、EAAC和EGAAC方法提取),并采用基于贝叶斯优化的基分类器软投票集成策略。具体而言:利用AlphaFold2获取蛋白质三级结构信息,采用CatBoost算法分别构建基于结构特征和序列特征的两个基分类器,经贝叶斯优化调参后通过软投票策略进行集成。
消融实验表明,Catsoft_Kmalsite模型展现出优异的鲁棒性和泛化能力。在五折交叉验证中,AUC(曲线下面积)、ACC(准确率)、Sen(灵敏度)、Pre(精确度)、F1(F1分数)和MCC(马修斯相关系数)六项指标分别达到94.03%、87.91%、89.15%、86.91%、88.00%和0.7585;在独立测试集上进一步提升至95.18%、89.55%、90.87%、88.79%、89.82%和0.7912,全面优于当前最先进的研究成果。
团队同步开发了在线预测平台(http://1.94.102.146:8501/Catsoft_Kmalsite)并开源了代码与数据集(https://github.com/flyinsky6/Catsoft_Kmalsite),为领域内研究者提供了高效可靠的计算工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号