湿分析AlphaFold在药物发现中的潜力

导读 研究发现,预测分子相互作用的计算机模型需要改进才能帮助识别药物作用机制。在过去的几十年里,很少有新的抗生素被开发出来,这主要是因为

研究发现,预测分子相互作用的计算机模型需要改进才能帮助识别药物作用机制。

在过去的几十年里,很少有新的抗生素被开发出来,这主要是因为目前用于筛选潜在药物的方法非常昂贵且耗时。一个有前途的新策略是使用计算模型,它提供了一种可能更快、更便宜的方法来识别新药。

麻省理工学院的一项新研究揭示了这种计算方法的潜力和局限性。研究人员使用名为AlphaFold的人工智能程序生成的蛋白质结构,探索现有模型是否可以准确预测细菌蛋白质与抗菌化合物之间的相互作用。如果是这样,研究人员可以使用这种类型的建模来大规模筛选靶向先前未靶向蛋白质的新化合物。这将使抗生素的开发具有前所未有的作用机制,这是解决抗生素耐药性危机必不可少的任务。

然而,由麻省理工学院医学工程与科学研究所(IMES)和生物工程系医学工程与科学研究所Termeer教授JamesCollins领导的研究人员发现,这些现有模型在这方面表现不佳。事实上,他们的预测并不比偶然好多少。

“AlphaFold等突破正在扩大计算机药物发现工作的可能性,但这些发展需要与作为药物发现工作一部分的建模其他方面的额外进展相结合,”柯林斯说。“我们的研究说明了药物发现计算平台的当前能力和当前局限性。”

在他们的新研究中,研究人员能够通过应用机器学习技术来改进结果,从而提高这些类型模型(称为分子对接模拟)的性能。然而,研究人员表示,要充分利用AlphaFold提供的蛋白质结构,还需要进行更多改进。

柯林斯是该研究的资深作者,该研究今天发表在《分子系统生物学》杂志上。麻省理工学院博士后FelixWong和AartiKrishnan是该论文的主要作者。

分子相互作用

这项新研究是柯林斯实验室最近发起的名为Antibiotics-AI项目的一部分,该项目旨在利用人工智能发现和设计新的抗生素。

AlphaFold是DeepMind和谷歌开发的人工智能软件,可以根据氨基酸序列准确预测蛋白质结构。这项技术在寻找新抗生素的研究人员中引起了兴奋,他们希望他们可以使用AlphaFold结构来寻找与特定细菌蛋白质结合的药物。

为了测试这一策略的可行性,柯林斯和他的学生决定研究大肠杆菌的296种必需蛋白质与218种抗菌化合物(包括四环素等抗生素)之间的相互作用。

研究人员使用分子对接模拟分析了这些化合物如何与大肠杆菌蛋白质相互作用,分子对接模拟根据它们的形状和物理特性预测两个分子结合在一起的强度。

这种模拟已成功用于针对单个蛋白质靶标筛选大量化合物的研究,以确定结合最好的化合物。但在这种情况下,研究人员试图针对许多潜在目标筛选许多化合物,结果预测结果要差得多。

通过将模型产生的预测与从实验室实验获得的12种必需蛋白质的实际相互作用进行比较,研究人员发现该模型的假阳性率与真阳性率相似。这表明该模型无法始终如一地识别现有药物与其目标之间的真实相互作用。

使用通常用于评估计算模型的测量方法,称为auROC,研究人员还发现性能不佳。“利用这些标准的分子对接模拟,我们获得了大约0.5的auROC值,这基本上表明你做的并不比随机猜测更好,”柯林斯说。

当研究人员将这种建模方法用于实验确定的蛋白质结构而不是AlphaFold预测的结构时,他们发现了类似的结果。

“AlphaFold似乎与实验确定的结构大致相同,但如果我们要在药物发现中有效和广泛地利用AlphaFold,我们需要在分子对接模型方面做得更好,”柯林斯说。

更好的预测

模型性能不佳的一个可能原因是输入模型的蛋白质结构是静态的,而在生物系统中,蛋白质是灵活的并且经常改变它们的配置。

为了提高建模方法的成功率,研究人员通过另外四个机器学习模型运行预测。这些模型根据描述蛋白质和其他分子如何相互作用的数据进行训练,使它们能够将更多信息纳入预测。

“机器学习模型不仅学习形状,还学习已知相互作用的化学和物理特性,然后使用这些信息重新评估对接预测,”Wong说。“我们发现,如果你要使用这些额外的模型来过滤交互,你可以获得更高的真阳性与假阳性比率。”

然而,研究人员表示,在使用这种类型的模型成功识别新药之前,还需要进一步改进。一种方法是根据更多数据训练模型,包括蛋白质的生物物理和生化特性及其不同构象,以及这些特征如何影响它们与潜在药物化合物的结合。

这项研究既让我们了解了我们距离实现完整的基于机器学习的药物开发范式还有多远,并提供了极好的实验和计算基准来刺激、指导和指导朝着这一未来愿景取得进展,”教授罗伊·基肖尼(RoyKishony)说Technion(以色列理工学院)的生物学和计算机科学博士,他没有参与这项研究。

柯林斯说,随着进一步的进步,科学家们可能能够利用人工智能生成的蛋白质结构的力量来发现新的抗生素和药物来治疗包括癌症在内的各种疾病。“我们乐观地认为,随着建模方法的改进和计算能力的扩展,这些技术将在药物发现中变得越来越重要,”他说。“然而,我们还有很长的路要走,才能充分发挥计算机药物发现的潜力。”