人工智能解决了生物学最大的挑战之一-“这正在彻底改变医学,研究和生物技术”

2020-12-02 21:15:58 来源:赫尔辛基日报

人工智能解决了生物学最大的挑战之一-“这正在彻底改变医学,研究和生物技术”
预测蛋白质的结构会加快各种疾病药物的开发。



蛋白质折叠成三维形状。

人工智能已经成功解决了世界上最大的生物学挑战之一。Deepmind开发的人工智能能够预测蛋白质如何折叠成三维形状。


蛋白质是细胞的基础,并决定病毒,细菌,人体以及生活中其他一切的功能。它们由氨基酸组成,这些氨基酸结合成链,然后排列成每种蛋白质特有的三维形状。此顺序称为折叠。


蛋白质的形状决定了它们的功能。定义形式在药物开发和了解疾病等方面非常重要。


50年来,科学家一直在寻找一种确定蛋白质结构的解决方案。1972年,美国化学家克里斯蒂安·安芬森(Christian Anfinsen)证明蛋白质的三维结构可以由氨基酸链决定,因此获得了诺贝尔化学奖。


问题在于单个蛋白质由数百或数千个氨基酸组成,这些氨基酸可以通过多种方式相互连接。折叠方法太多,无法在计算机上计算所有折叠方法。


因此,已经在实验室中使用X射线晶体学,NMR光谱和冷冻电子显微镜等对蛋白质结构进行了测量。但是,这种方法很昂贵,并且需要数月,数年甚至数十年的时间才能确定单个蛋白质的结构。


单是人类就有成千上万种不同的蛋白质,而所有生物都有数十亿种。科学家设法确定了仅170,000种蛋白质的结构,总共鉴定出超过2亿种蛋白质。


 预测蛋白质结构有助于理解各种疾病,例如癌症和痴呆症。

1994年,一组研究人员开始寻找通过国际竞争解决问题的办法。Casp是一个两年一次的竞赛,参与其中的研究团队尝试使用计算机科学方法来预测蛋白质的结构。


让竞争者研究几种不同蛋白质的氨基酸链,从中尝试预测其三维形状。将计算机预测结果与实验室测量结果进行比较。


近年来,比赛的结果并不奇怪。该领域的许多研究人员认为,突破要等几十年。


然后是Deepmind及其开发的Alphafold。Deepmind是Google旗下的研究公司,以多项突破性的人工智能程序而闻名。


四年前,该公司的Alphago程序击败了世界上最复杂的棋盘游戏Gossa大师Lee Sedol ,从而创造了历史


三年前,由Deepmind开发的Alphazero程序赢得了世界上最好的国际象棋程序,去年,Alphastar在流行的《星际争霸》策略游戏中击败了几位专业玩家。


该公司开发的人工智能基于称为神经网络的数学计算模型,该模型模仿人脑的机制。训练神经网络执行大量数据的各种任务。例如,他们学会从图像中识别某些对象,例如面孔或动物,翻译语言并识别语音。


用于蛋白质结构预测的Alphafold基于相同的原理。它能够分析实验室中测得的数千种蛋白质及其结构,从而使其能够从提供给它的数据之外学习预测蛋白质的折叠。


“我从来没有想到会看到这种事情发生在我的有生之年,”约翰·莫尔特,在马里兰大学的教授告诉科学。


穆尔特是Casp大赛的创始人之一,他还参与了今年参赛者的评选。在比赛中,Alphafold在速度和可靠性方面均优于人类测量。研究人员在实验室中花费了数年的时间,从人工智能花费了数小时甚至数分钟之久。


通过为程序提供氨基酸链,可以在三种情况中的两种情况下准确预测蛋白质的三维形状。它所犯的错误大部分非常小,小于原子的大小。


最终,Alphafold成功完成了科学家数十年来一直试图解决的任务。它预测了位于单细胞微生物古细菌中的蛋白质的三维结构。这种结构特别难以定义,因为它位于单元内部的一半而单元外部的一半。


人工智能在半小时内完成了任务。


 “仍有工作要做。”

阿尔托大学教授Juho Rousu说:“是的,这是至少在过去十年中解决长期问题的最重要步骤。”


但是,他想指出,人工智能仍然犯了很多错误。


“仍有许多工作要做。我认为人工智能无法完全取代实验实验室的工作。”


鲁苏认为,实验室测试的作用将从将来的主要测量仪器转变为确认仪器。因此,人工智能将预测蛋白质结构,有趣的发现将在实验室得到证实。


“过去,计算机的预测可能是非常错误的,以至于没有必要基于它们进行进一步的研究。现在不一样了。”

Rousu认为,从人工智能开发的角度来看,这不是革命性的技术。相反,Deepmind以新颖,新颖的方式使用了现有技术。Alphafold最初预测了两个相邻氨基酸之间的距离。然后的目的是预测所有成对氨基酸的距离。


“这是一个好主意,因为成对氨基酸的距离完全决定了三维结构。也就是说,例如,如果我们想到一个三角形,则其边长也将决定形状。蛋白质也是如此。


 “这将彻底改变医学,研究和生物技术。”


在医学上,Deepmind的技术可实现广泛的剧变。预测蛋白质结构有助于理解各种疾病,例如癌症和痴呆症。此外,它正在加速新药和疫苗的开发。


如果研究人员知道蛋白质的三维形式,他们将能够确定其他分子如何与蛋白质结合。这是开发药物的一种方法:它们与所需的蛋白质结合并影响其功能。


“例如,遗传疾病是由蛋白质突变引起的。Rousu说,在三维结构中,我们可以更好地看到蛋白质的哪个部分发生了变化以及如何对其进行校正。


马克斯·普朗克研究所发育生物学家安德烈·卢帕斯Andrei Lupas)认为,像Alphafold这样的人工智能可以帮助对抗冠状病毒等大流行病。


“人工智能可以用来确定可以用来治疗新病毒的药物,”开发Alphafold的卢帕斯告诉《纽约时报》。


此外,预测蛋白质结构有助于合成蛋白质的开发。例如,它们可用于生产处理塑料废物的生物燃料和酶。

“这正在彻底改变医学,研究和生物技术。这将彻底改变一切“的Lupas在总结性质。


文本据Miina Viljanen HS