蛋白质结构预测工具AlphaFold2与RoseTTAFold同日开源-深度-知识分子

蛋白质结构预测工具AlphaFold2与RoseTTAFold同日开源

2021/07/22
导读
结构决定功能是自然界的普遍法则。蛋白质作为生物大分子,是生物生命活动重要的行使者。因此,蛋白质结构一直是一个令人着迷的话题,引来无数科学家一次又一次地攻坚。

2/lx/zsfz1626940888.3531777.png

图源:sciencemag.org


撰文  冯水寒

责编  计永胜


结构决定功能是自然界的普遍法则。蛋白质作为生物大分子,是生物生命活动重要的行使者。因此,蛋白质结构一直是一个令人着迷的话题,引来无数科学家一次又一次地攻坚。


目前,了解全新蛋白质结构主要有两种途径:基于X射线、核磁共振、冷冻电镜等技术解析晶体;基于氨基酸序列的计算精准预测。相较于前者高昂的仪器、人力成本和复杂的操作要求,后者具有更广的发展空间。得益于近些年来计算机性能、人工智能算法的迅猛发展,计算预测蛋白结构领域好消息连连。


t/6l/zsfz1626941008.337432.png

David Baker教授



早前1998年,华盛顿大学David Baker教授团队开发了用于蛋白质结构预测的Rosetta平台,考虑蛋白质稳定状态能量最低原理和基团间的相互作用,通过计算氨基酸间的互作得分,获得较为可靠的折叠方式,即蛋白质的三维结构。在此基础上,该团队引入分布式计算的思想,于2005年发布了Rosetta@home,方便用户将闲置的计算资源用于计算,进而研究目标蛋白质潜在的折叠方式。2008年,他们再结合众包的思想,开发了Foldit游戏软件,对不同玩家折叠出的蛋白质结构进行评分,使得非专业领域的人员也能够参与蛋白质结构解析中,一个个蛋白质在全世界玩家的合作下被攻克。慢慢地,该团队了解了蛋白质折叠的部分规律,突破了蛋白设计的难点,开始挑战全新的蛋白设计合成,近年来成果不断。


0/kd/zsfz1626941068.2754935.png

1. AlphaFold2原理图示。图片来自DeepMind

David Baker团队在蛋白质结构预测领域高歌猛进,位于大西洋彼岸的英国团队也没闲着。英国的人工智能公司DeepMind(于2014年被谷歌收购)曾因AlphaGO围棋软件名声大噪,现也加入蛋白质结构预测的大潮之中,并在全球蛋白质结构预测比赛(Critical Assessment of protein Structure PredictionCASP)中大放异彩。得益于在人工智能领域的多年积累,DeepMind团队开发了AlphaFold系列软件。AlphaFold2更是2020年第十四届CASP大赛中拔得头筹,其预测结果已经能够达到与实验手段获得的结构相媲美的程度。由此也引发了计算预测是否能替代传统实验的讨论。(参见《精准预测蛋白结构的AlphaFold,会砸了结构生物学家的饭碗吗?http://zhishifenzi.com/news/other/10495.html)


a/g5/zsfz1626941203.3055976.png


716日,DeepMind团队加速预览的形式在Nature期刊发文,描述了AlphaFold2的设计框架和方法,并公开了相应的软件代码[1]


b/ep/zsfz1626941270.3693726.png


同日,David Baker教授团队也在Science期刊发文,介绍了最新设计的RoseTTAFold人工智能软件系统,并公开了软件代码[2]。受到AlphaFold2的设计思路启发,RoseTTAFold利用神经网络技术综合一维、二维、三维以及交互信息,进而推断出更为合理准确的折叠方式,同时还能预测蛋白质复合体的结构。


w/8f/zsfz1626941319.5781750.png

2. RoseTTAFold原理图示。图片来自Science


值得注意的是,David Baker教授团队表示RoseTTAFold对蛋白质结构的预测精度已与AlphaFold2不相上下,而它所需要的硬件设备要求较低,只需一块RTX2080显卡,便可以在10分钟计算得到400个氨基酸残基以内的蛋白质结构,同时他们也搭建了网页版(https://robetta.bakerlab.org/)供广大用户使用。


j/zk/zsfz1626941375.2068107.png


图片来自bakerlab.org


    

“仅上个月就有超4500个蛋白提交到我们的网络服务器,并且研究人员还能通过GitHub网站获得RoseTTAFold的源代码。我们希望这个新的工具能够持续的造福整个科研领域。” David Baker团队成员Minkyung Baek表示[3]


1/17/zsfz1626941436.6252077.png


我们相信这两个软件只是蛋白质结构预测领域的一个开始,源代码开放获取更能够拓宽软件的适用范围,加速软件更新,由此,蛋白质结构解析将在人工智能的助跑下迎来新的春天。

 

参考资料:

[1] Jumper J, Evans R, Pritzel A, Green T, Figurnov M, Ronneberger O, et al. Highly accurate protein structure prediction with AlphaFold. Nature. 2021.

[2] Baek M, DiMaio F, Anishchenko I, Dauparas J, Ovchinnikov S, Lee GR, et al. Accurate prediction of protein structures and interactions using a three-track neural network. Science. 2021.

[3] https://www.bakerlab.org/index.php/2021/07/15/accurate-protein-structure-prediction-accessible/





参与讨论
0 条评论
评论
暂无评论内容
知识分子是由饶毅、鲁白、谢宇三位学者创办的移动新媒体平台,致力于关注科学、人文、思想。
订阅Newsletter

我们会定期将电子期刊发送到您的邮箱

GO