-
生物通官微
陪你抓住生命科技
跳动的脉搏
DiffPALM:一种创新的人工智能方法
【字体: 大 中 小 】 时间:2024年06月26日 来源:AAAS
编辑推荐:
EPFL的科学家们推出了DiffPALM,这是一种创新的人工智能方法,可以增强对蛋白质相互作用的预测,以及我们对可能与医学应用相关的生物过程的理解。
蛋白质是生命的基石,几乎参与了每一个生物过程。了解蛋白质如何相互作用对于破译细胞功能的复杂性至关重要,并且对药物开发和疾病治疗具有重要意义。
然而,预测哪些蛋白质结合在一起一直是计算生物学的一个具有挑战性的方面,主要是由于蛋白质结构的巨大多样性和复杂性。但是EPFL的Anne-Florence Bitbol小组的一项新研究可能会改变这一切。
包括Umberto Lupo, Damiano Sgarbossa和Bitbol在内的科学家团队开发了DiffPALM(使用基于对齐的语言模型的可微分配对),这是一种基于人工智能的方法,可以显着推进相互作用蛋白质序列的预测。这项研究发表在《美国科学院院刊》上。
DiffPALM利用了蛋白质语言模型的力量,这是一种借鉴自然语言处理的先进机器学习概念,以前所未有的精度分析和预测两个蛋白质家族成员之间的蛋白质相互作用。它使用这些机器学习技术来预测相互作用的蛋白质对。这导致了对其他方法的显著改进,这些方法通常需要大量不同的数据集,并且与真核蛋白复合物的复杂性作斗争。
DiffPALM的另一个优点是它的通用性,因为它甚至可以使用较小的序列数据集,因此可以处理同源性很少的罕见蛋白质-具有共同进化祖先的不同物种的蛋白质。它依赖于经过多序列比对(MSA)训练的蛋白质语言模型,例如MSA Transformer和AlphaFold的EvoFormer模块,这使得它能够以高度的准确性理解和预测蛋白质之间的复杂相互作用。更重要的是,在预测蛋白质复合物的结构方面,使用DiffPALM显示出很高的前景。蛋白质复合物是由多种蛋白质结合形成的复杂结构,对许多细胞过程至关重要。
在这项研究中,研究小组将DiffPALM与传统的基于共同进化的配对方法进行了比较,后者研究了当蛋白质序列密切相互作用时,它们如何随着时间的推移一起进化——一种蛋白质的变化会导致其相互作用伙伴的变化。这是分子和细胞生物学的一个极其重要的方面,在msa上训练的蛋白质语言模型很好地捕捉到了这一点。在具有挑战性的基准测试中,DiffPALM的性能优于传统的Top of forma方法,证明了它的鲁棒性和效率。
DiffPALM在基础蛋白质生物学领域的应用是显而易见的,但它还不止于此,因为它有可能成为医学研究和药物开发的有力工具。例如,准确预测蛋白质相互作用可以帮助了解疾病机制并开发靶向治疗。
研究人员已经免费提供了DiffPALM,希望科学界广泛采用它来进一步推进计算生物学,并使研究人员能够探索蛋白质相互作用的复杂性。
通过结合先进的机器学习技术和复杂生物数据的有效处理,DiffPALM标志着计算生物学的重大飞跃。它不仅增强了我们对蛋白质相互作用的理解,而且开辟了医学研究的新途径,可能导致疾病治疗和药物开发的突破。