谷歌的DeepMind aces蛋白质折叠

谷歌的DeepMind aces蛋白质折叠

在CASP 13中建模的感染细菌的病毒蛋白复合物。该复合物包含四个单独模拟的单独亚基。

蛋白质数据库
谷歌的DeepMind aces蛋白质折叠

结果是掌握国际象棋,Go只是为了初学者。 12月2日,谷歌旗下的人工智能公司DeepMind在第13届结构预测评估(CASP)中获得了最高荣誉,这是一项旨在预测蛋白质三维结构的两年一度的竞赛。

比赛的工作方式如下:竞争团队获得了90种蛋白质的线性氨基酸序列,其中3D形状已知但尚未公布。 然后,团队计算出这些序列将如何折叠。 尽管总部位于伦敦的DeepMind之前没有参加过这次比赛,但AlphaFold软件的预测平均比97竞争对手更准确。

比赛有多接近? 一个指标,不是很好。 对于没有其他信息已知的蛋白质序列--90-AlphaFold中的43个最准确的预测25次。 这远远超过了第二名,在43次测试中赢了三次。

所以AlphaFold在竞争中取胜? 好吧,不完全是。 当您在每种情况下跟踪AlphaFold赢或输多少时,结果看起来更接近。 如下图所示。 它显示了AlphaFold在垂直轴上的性能以及横轴上最佳的其他组的性能。 红线上方的点显示AlphaFold赢得的预测。 下面的点,它丢失了。 红线上的那些基本上是平局。 结果? CASP的主要组织者,罗克维尔马里兰大学的计算生物学家John Moult说,AlphaFold赢得了很多轮次,在最艰难的43次测试中,其他人群的准确率平均提高了15%。

准备,设置,折叠!

红线上方的点显示AlphaFold赢得的蛋白质折叠预测。 它失去了线下的那些。 在线的人基本上是一个平局。

0 25 50 75 100 其他顶级竞争对手 0 25 50 75 100 DeepMind的AlphaFold 0 25 50 75 数据:abcdefg hijkl mnop qrstu vwxyz 1234 56789 /科学 数据:加州大学戴维斯分校的Andriy Kryshtafovych 数据:abcdefg hijkl mnop qrstu vwxyz 1234 56789
Andriy Kryshtafovych /加州大学戴维斯分校

那么,发生了什么? 华盛顿大学西雅图分校的CASP组织者,参与者和计算建模专家David Baker指出,DeepMind的科学家们建立在其他人开创的两种算法策略之上。 首先,通过比较其他蛋白质的大量基因组数据,AlphaFold能够更好地解读哪些氨基酸最有可能在折叠蛋白质中彼此接近。 其次,相关比较还有助于他们测量相邻氨基酸对之间最可能的距离以及它们与邻近氨基酸结合的角度。 这两种方法在评估的数据越多时表现越好,这使得它们更容易受益于机器学习计算机算法,例如AlphaFold,它通过处理大型数据集来解决问题。 贝克说,DeepMind的科学家“非常擅长机器学习,拥有一支优秀的团队”,他们的口袋比大多数学术团体都要大。

对新手来说还不错。 “给予他们信任,”洛杉矶马里兰大学的另一位CASP组织者和计算生物学家John Moult补充道。 “他们来自哪儿。”