2022《理解未来》首期科学讲座01期——“AI + 蛋白质结构和功能预测”,我们特别邀请到美国芝加哥丰田计算技术研究所教授、北京大学客座教授许锦波做专题分享《蛋白质结构和功能预测》。许锦波教授2016年开发的RaptorX-Contact方法,首次证明了深度学习方法预测蛋白质结构的可行性,拉开了AI蛋白质结构预测时代的序幕。本期讲座中,"AI蛋白质折叠技术奠基人"许锦波教授向大家分享了AI预测蛋白质结构和功能这一领域的发展沿革与最新进展。
许锦波教授指出,由于蛋白质是由二十种天然氨基酸组成,通过原子间相互作用形成稳定的三维构象,因此,准确测定蛋白质三维结构对我们理解蛋白功能非常重要。在技术上,过去,科学家通过使用晶体衍射、核磁共振、冷冻电镜等实验技术,来测定原子的三维坐标,但这些技术通常存在耗时长、花费高、无法保证100%成功的问题。在方法上,传统的结构预测方法基于能量最小化,需要大量的计算资源,成功率很低。而深度学习技术可以从同家族蛋白的演化关系中学习并预测残基间的相互作用关系,对于蛋白质结构预测领域起到非常关键的作用。
许锦波教授介绍,2016年,团队开发的深度卷积残差网络,大幅度提高残基或原子相互作用预测的准确度。2020年,DeepMind开发的基于注意力机制的神经网络,都是需要同一个家族蛋白质的序列比对,如果一个家族里没有足够的蛋白,这些方法基本上效果都不是很好。
“通过使用人工智能,我们颠覆了蛋白质结构预测,甚至改变了很多分子生物学家的研究范式,很多人开始使用预测的结构去分析蛋白质功能。”许锦波教授也指出,目前该领域还面临一些未解决的问题,比如当一个家族里只有一个孤儿蛋白的时候,还有蛋白质的复合物,现有方法准确度还不太理想。“我们希望准确预测蛋白质在某种特定条件下的结构,和多肽、核酸的相互作用,以及预测突变对蛋白质结构功能的影响。”许锦波教授表示。
许锦波
美国芝加哥丰田计算技术研究所教授
北京大学客座教授
许锦波教授1996年本科毕业于中国科学技术大学,1999年在中国科学院计算机研究所获得硕士学位,2003年获得加拿大滑铁卢大学博士学位。2004年-2005年在美国麻省理工学院数学系从事博士后研究,2005年到芝加哥丰田计算技术研究所工作至今。
许锦波教授致力于人工智能预测蛋白质结构研究,研发出久负盛名的蛋白质结构预测软件RaptorX 和蛋白质相互作用网络分析软件IsoRank等生物信息学软件,获得了美国斯隆研究奖、美国自然科学基金早期职业奖、《PLoS Computational Biology》创新突破奖、国际计算生物学顶级会议RECOMB最佳论文奖和时间检验奖(Test-of-Time Award)等众多奖项。他发明的机器学习算法将蛋白质结构预测的问题提升了一个新台阶。2016年他首次证明深度学习能大幅度提高蛋白质结构预测的性能(PLoS Computational Biology2017),实现了人工智能在蛋白质结构预测领域的突破。2020 年,人工智能预测蛋白质结构被《科学》杂志评为十大科学突破之一。