新的高通量基于人工智能的蛋白质预测方法可能会促进药物发现

2024-04-01 08:57:52深情的哈密瓜

一种创新的机器学习方法已被证明可以快速预测多种蛋白质配置。一篇新论文提出了使用AlphaFold2(一种能够准确预测蛋白质结构的人工智能方法)预测蛋白质构象相对群体的方法。

新的高通量基于人工智能的蛋白质预测方法可能会促进药物发现

这项工作将增进对蛋白质动力学和功能的理解。作者指出,该技术准确、快速、具有成本效益,并且有可能通过发现更多新疗法的靶点来彻底改变药物发现。

布朗大学分子生物学、细胞生物学和生物化学博士研究生加布里埃尔·蒙泰罗·达席尔瓦(GabrielMonteirodaSilva)的工作试图改进蛋白质动力学建模的计算方法。在这项研究中,他使用AlphaFold2进行了实验。

“在大多数细胞过程中,蛋白质会动态改变形状,”蒙泰罗·达席尔瓦说。“为了将蛋白质靶标与治疗癌症和其他疾病的药物相匹配,我们需要更准确地了解这些生理变化。我们需要超越3D形状来理解4D形状,第四维是时间。这就是我们采用这种方法所做的事情。”

虽然MonteirodaSilva表示AlphaFold2的准确性彻底改变了蛋白质结构预测,但该方法也有局限性:它允许科学家仅在特定时间点对静态蛋白质进行建模。作者进一步表达了这一观点,他们写道,尽管AlphaFold2显示出卓越的准确性和速度,但“它旨在预测蛋白质的基态构象,但其预测构象景观的能力有限。”在这项研究中,他们展示了AlphaFold2如何“通过对多个序列比对进行二次采样,直接预测不同蛋白质构象的相对群体”。

研究人员能够操纵蛋白质的进化信号,使用AlphaFold2快速预测多种蛋白质构象,以及这些结构的填充频率。

化学和物理学副教授布伦达·鲁宾斯坦博士说:“如果你了解构成蛋白质动态的多个快照,那么你就可以找到多种不同的方法来用药物靶向蛋白质并治疗疾病。”在布朗大学。

研究人员针对两种蛋白质——Abl1激酶和粒细胞-巨噬细胞集落刺激因子——“可用序列数据量截然不同”,对他们的方法进行了核磁共振实验测试。他们预测本州相对人口变化的准确率超过80%。

研究人员指出,现有的计算方法成本和时间密集。“它们在材料、基础设施方面都很昂贵;“它们需要花费大量时间,而且你无法真正以高吞吐量的方式进行这些计算——我确信我是Brown计算机集群中GPU的顶级用户之一,”MonteirodaSilva说道。“从更大的范围来看,这是一个问题,因为蛋白质世界有很多东西需要探索:蛋白质动力学和结构如何与人们知之甚少的疾病、耐药性和新出现的病原体有关。”

至于下一步,研究团队正在完善他们的机器学习方法,使其更加准确和通用,并且对一系列应用更有用。

推荐阅读

阅读排行