-
生物通官微
陪你抓住生命科技
跳动的脉搏
一种利用机器学习快速预测多种蛋白质结构的方法
【字体: 大 中 小 】 时间:2024年04月01日 来源:AAAS
编辑推荐:
了解蛋白质的结构对于揭开其功能的神秘面纱和开发针对它们的药物至关重要。为此,布朗大学的一组研究人员开发了一种利用机器学习快速预测多种蛋白质结构的方法,以促进对蛋白质动力学和功能的理解。一项描述这种方法的研究发表在3月27日星期三的《自然通讯》上。这组作者说,这项技术准确、快速、具有成本效益,并且有可能通过发现更多的新治疗靶点来彻底改变药物发现。
了解蛋白质的结构对于揭开其功能的神秘面纱和开发针对它们的药物至关重要。为此,布朗大学的一组研究人员开发了一种利用机器学习快速预测多种蛋白质结构的方法,以促进对蛋白质动力学和功能的理解。
一项描述这种方法的研究发表在3月27日星期三的《自然通讯》上。
这组作者说,这项技术准确、快速、具有成本效益,并且有可能通过发现更多的新治疗靶点来彻底改变药物发现。
例如,在靶向癌症治疗中,治疗的目标是控制癌细胞生长、分裂和扩散的蛋白质。该研究的作者Gabriel Monteiro da Silva是布朗大学分子生物学、细胞生物学和生物化学博士候选人,他说,结构生物学家面临的挑战之一是彻底了解细胞蛋白质以确定目标。
Monteiro da Silva使用计算方法来模拟蛋白质动力学,并寻找改进方法或找到最适合不同情况的新方法的方法。在这项研究中,他与化学和物理学副教授布伦达·鲁宾斯坦(Brenda Rubenstein)以及其他布朗大学的研究人员合作,用一种现有的人工智能计算方法AlphaFold 2进行实验。
虽然Monteiro da Silva说AlphaFold 2的准确性已经彻底改变了蛋白质结构预测,但该方法也有局限性:它允许科学家在特定的时间点上以静态状态建模蛋白质。
“在大多数细胞过程中,蛋白质会动态改变形状,”蒙泰罗·达席尔瓦说。“为了将蛋白质靶点与治疗癌症和其他疾病的药物相匹配,我们需要更准确地了解这些生理变化。我们需要超越3D形状来理解4D形状,第四个维度是时间。这就是我们用这种方法所做的。”
蒙泰罗·达席尔瓦用马的类比来解释蛋白质模型。马的肌肉和四肢的排列会根据马是站立还是奔跑而产生不同的形状;蛋白质分子由于其组成原子的键排列而形成不同的形状。把这种蛋白质想象成一匹马,蒙泰罗·达席尔瓦说。以前的方法是用来预测一个站立的马的模型。这是准确的,但它并不能说明马在不站立时的行为或样子。
在这项研究中,研究人员能够操纵来自蛋白质的进化信号,使用AlphaFold 2快速预测多种蛋白质构象,以及这些结构被填充的频率。利用马的类比,这种新方法允许研究人员快速预测一匹马奔跑的多个快照,这意味着他们可以看到马的肌肉结构在运动时是如何变化的,然后比较这些结构差异。
鲁宾斯坦的研究重点是电子结构和生物物理学,他说:“如果你了解构成蛋白质动态的多个快照,那么你就可以找到多种不同的方法来针对蛋白质进行药物治疗和治疗疾病。”
鲁宾斯坦解释说,研究小组在这项研究中关注的蛋白质是一种已经开发出不同药物的蛋白质。然而,多年来,没有人能理解为什么有些药物成功了,有些却失败了,她说。
“这一切都归结为这些特定蛋白质具有多种构象的事实,以及了解药物如何与不同的构象结合,而不是这些技术先前预测的一种静态结构;了解这些构象对于理解这些药物在体内的实际作用是非常重要的,”鲁宾斯坦说。
研究人员指出,现有的计算方法是成本和时间密集型的。
“它们在材料和基础设施方面都很昂贵;它们需要很多时间,而且你不能以高吞吐量的方式进行这些计算——我确信我是布朗大学计算机集群中gpu的顶级用户之一,”蒙泰罗·达席尔瓦说。“在更大的范围内,这是一个问题,因为在蛋白质世界中有很多东西需要探索:蛋白质动力学和结构如何参与人们知之甚少的疾病、耐药性和新出现的病原体。”
研究人员描述了蒙泰罗·达席尔瓦如何花了三年时间利用物理学来理解蛋白质动力学和构象。使用他们新的人工智能方法,发现时间缩短到仅仅几个小时。
鲁宾斯坦说:“所以你可以想象,3年和3小时相比,这将对一个人的生活产生多大的影响。”“这就是为什么我们开发的方法应该是高通量和高效率的,这一点非常重要。”
至于下一步,研究团队正在改进他们的机器学习方法,使其更准确、更通用,并在一系列应用中更有用。