AlphaFold3全面性能评估:跨生物大分子结构预测的突破与局限

《Briefings in Bioinformatics》:A comprehensive benchmarking of the AlphaFold3 for predicting biomacromolecules and their interactions

【字体: 时间:2025年11月29日 来源:Briefings in Bioinformatics 7.7

编辑推荐:

  本研究针对AlphaFold3缺乏第三方基准测试的问题,系统评估了其在蛋白质单体、复合物、RNA结构及蛋白-核酸复合物等九大数据集上的预测性能。结果表明,AlphaFold3在局部结构精度、抗原-抗体复合物及蛋白-核酸相互作用预测方面显著优于现有工具,但在全局结构预测、多构象建模及RNA多聚体方面仍有提升空间,为结构生物学研究提供了重要参考。

  
在结构生物学领域,准确预测生物大分子的三维结构一直是科学家们追求的核心目标。近年来,深度学习技术的突破性进展彻底改变了这一领域的研究范式。特别是AlphaFold2的出现,将蛋白质结构预测的准确性推向了前所未有的高度,甚至达到了与实验方法相媲美的水平。然而,生物系统的复杂性远不止于单个蛋白质分子,蛋白质之间的相互作用、蛋白质与核酸的复合物以及RNA分子的空间结构等问题,仍然是摆在研究人员面前的巨大挑战。
2024年5月,DeepMind团队发布了新一代算法AlphaFold3,这一工具宣称能够预测包括蛋白质、核酸、小分子、离子和修饰残基在内的多种生物分子复合物的结构。与AlphaFold2相比,AlphaFold3用扩散模块取代了原有的结构模块,并扩展了标记化方案以容纳更广泛的分子类型,同时简化了多序列比对(MSA)处理以提高效率。尽管AlphaFold3在其原始论文中展示了令人印象深刻的性能,但科学界迫切需要独立的第三方评估来客观验证其实际能力。
正是在这样的背景下,彭春祥、倪文涛等研究人员在《Briefings in Bioinformatics》上发表了这项全面的基准测试研究。他们构建了九个精心设计的测试数据集,涵盖了蛋白质单体、孤儿蛋白质、替代构象、蛋白质多聚体、肽-蛋白质复合物、抗原-抗体复合物、RNA单体、RNA多聚体以及蛋白-核酸复合物,系统比较了AlphaFold3与AlphaFold2、AlphaFold-Multimer、RoseTTAFoldNA、RhoFold+、NuFold和trRosettaRNA等方法的性能差异。
研究人员主要采用了九大基准数据集构建与筛选、多维度结构评估指标(包括TM-score、局部距离差异测试(LDDT)、DockQ、相互作用网络保真度(INF)等)、大规模并行计算测试以及统计显著性分析等关键技术方法。这些方法确保了评估的全面性和可靠性。
蛋白单体预测性能
在150个蛋白单体的测试中,AlphaFold3与AlphaFold2在全局结构预测(TM-score)上表现相当,平均TM-score分别为0.817(AlphaFold3服务器版)和0.812(AlphaFold2),差异无统计学显著性。然而,在局部结构精度(LDDT)方面,AlphaFold3展现出显著优势,平均LDDT达到0.792,优于AlphaFold2的0.787(P=2.67×10-3)。特别值得注意的是,对于多域蛋白质,AlphaFold3在局部结构预测上的改进更为明显。
在单序列输入模式下(不使用MSA或模板),AlphaFold3表现出明显优势,平均TM-score为0.413,显著高于AlphaFold2的0.353(P=2.92×10-7)。这一发现表明AlphaFold3降低了对进化信息的依赖,使其在缺乏同源序列的情况下仍能保持较好的预测能力。
孤儿蛋白与多构象建模
对113个孤儿蛋白的测试显示,AlphaFold3在局部结构预测上略有优势,但全局结构预测与AlphaFold2无显著差异。在多构象蛋白质建模方面,AlphaFold3在某些情况下能够捕捉不同的构象状态,但整体上仍难以生成广泛且评分良好的替代结构集合。例如,对于蛋白4tu7,AlphaFold3服务器版成功预测了两种不同的构象状态,而AlphaFold2仅能准确预测其中一种。
蛋白复合物预测表现
在206个蛋白多聚体的测试中,AlphaFold3与AlphaFold-Multimer在全局结构预测上表现相当,平均TM-score分别为0.821(AlphaFold3服务器版)和0.812(AlphaFold-Multimer)。但在局部结构精度上,AlphaFold3显著优于AlphaFold-Multimer,平均LDDT分别为0.860和0.851(P=2.42×10-4)。
特别值得注意的是,在35个异源多聚体的界面预测质量上,AlphaFold3表现出明显优势,平均DockQ分数为0.640,比AlphaFold-Multimer提高9.4%(P=0.04)。然而,在肽-蛋白质复合物上,两种方法的性能几乎无法区分。
抗原-抗体复合物预测突破
在102个抗原-抗体复合物的测试中,AlphaFold3展现出显著优势。其平均TM-score为0.739,比AlphaFold-Multimer提高8.1%(P=6.82×10-4)。在界面预测质量上,AlphaFold3的平均DockQ分数为0.422,比AlphaFold-Multimer提高29.8%(P=2.36×10-5)。
特别引入的CDR-TMscore(互补决定区TM-score)评估显示,AlphaFold3在抗体结合位点预测上也有显著改进,平均CDR-TMscore为0.183,远高于AlphaFold-Multimer的0.074(P=2.27×10-4)。尽管如此,绝对精度仍然有限,仅有约30%的抗原-抗体复合物被正确建模。
RNA结构预测能力
在52个RNA单体的测试中,trRosettaRNA在全局结构预测上表现最佳(平均TM-score=0.548),而AlphaFold3位居中游(平均TM-score=0.510)。然而,在局部结构精度(LDDT)和二级结构预测(INF)方面,AlphaFold3显著优于所有对比方法,平均LDDT为0.713,比次优方法提高13.0%以上。
RNA多聚体与蛋白-核酸复合物
对于23个RNA多聚体,AlphaFold3在局部结构预测上显著优于RoseTTAFoldNA,平均LDDT分别为0.564和0.462(P=2.14×10-3)。但在全局结构预测上,两种方法都表现不佳,仅有不到10%的RNA多聚体被正确预测。
在59个蛋白-核酸复合物的测试中,AlphaFold3全面优于RoseTTAFoldNA,在TM-score(0.745 vs 0.653)、LDDT(0.774 vs 0.677)和界面接触保留分数(FNAT)(0.410 vs 0.186)上均取得显著优势。
计算效率优势
除了预测精度,AlphaFold3在计算效率上也展现显著优势。在所有测试数据集上,AlphaFold3的运行时间均大幅短于对比方法。例如,在蛋白单体预测上,AlphaFold3本地版平均仅需20分钟,而AlphaFold2需要160分钟;在蛋白多聚体预测上,AlphaFold3平均需31分钟,而AlphaFold-Multimer需要297分钟。
这项研究通过全面系统的评估,揭示了AlphaFold3在生物大分子结构预测领域的真实性能。研究表明,AlphaFold3代表了一个有意义的进步,提供了一个统一的框架,能够以改进的精度建模多种生物大分子及其复合物。然而,不同任务上的改进程度各不相同,从微小(蛋白单体和RNA多聚体)到显著(抗原-抗体复合物和蛋白-核酸复合物)不等。特别是在蛋白多聚体方面,除了抗原-抗体复合物外,新旧流程之间的性能没有显著差异。
这些发现强调了AlphaFold3作为建模各种复杂生物大分子系统的更准确、更可靠工具的潜力。然而,未来的努力应侧重于解决剩余的挑战,如改进替代构象的预测、增强模型排名性能,以及进一步提高RNA和蛋白-核酸复合物建模的精度,以充分实现AlphaFold3在结构生物学中的能力。
值得注意的是,AlphaFold3服务器版和本地版在某些目标上出现的差异似乎源于随机变异和内置模型排名能力的限制,重复运行显示两个版本在所有考虑的情况下都产生高度相似的预测模型分布。这一发现提示,开发有效的模型质量评估方法针对这些预测流程进行优化,将是未来重要的研究方向。
总体而言,这项研究为科学界提供了关于AlphaFold3能力的客观、全面的认识,为研究人员在选择和使用这一工具时提供了重要参考,同时也为未来方法的改进指明了方向。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号