AlphaFold2:一个困扰生物学 50 年的问题,基本被解决了
// TL;DR
- AlphaFold2 的中位精度(GDT ~92)接近实验级别,断层领先所有对手。
- 端到端架构 Evoformer:把进化信息和几何约束揉进注意力机制。
- CASP 组织者罕见地用了‘problem solved’这种措辞。
两年前的伏笔,兑现了
2018 年我写 AlphaFold1 时说,这只是序幕,两年后的 CASP14 会更炸——现在炸了。AlphaFold2 在 CASP14 上的预测精度,中位 GDT 分数达到约 92(满分 100,90 以上通常被认为与实验测定结构难以区分)。这不是‘比第二名好一点’,是把一个半世纪的难题直接拉到了‘基本可用’的水平。CASP 主办方 John Moult 的原话大意是:在某种意义上,这个问题解决了。
技术上的飞跃
相比初代,AlphaFold2 是端到端重构。核心是 Evoformer 模块:把同源序列的进化信息(哪些位置一起突变,往往在空间上相邻)和残基对的几何关系,通过注意力机制反复交换、迭代精修,最后直接输出三维原子坐标。它不再是‘预测距离再求解结构’的两段式,而是让网络一气呵成地‘想象’出折叠后的样子。
为什么这是 AI 的高光时刻
蛋白质结构决定功能,功能关系到一切——理解疾病机理、设计药物、改造酶。过去测一个结构靠 X 射线晶体学或冷冻电镜,耗时数月到数年、花费高昂。AlphaFold2 让它变成几分钟的计算。这不是‘AI 又赢了一个游戏’,这是 AI 第一次在一个诺奖级的基础科学难题上,做出了实质性的、改变学科的贡献。
AlphaGo 改变了围棋,AlphaFold 改变了生物学——后者的份量,要用几十年才能完全称出来。
Hassabis 创立 DeepMind 时说‘先解决智能,再用智能解决一切’,听着像狂言。AlphaFold2 让这句话第一次有了沉甸甸的实证。我会把它放在这十年最重要的 AI 成果候选名单的最前面。(预告:这条线后面还有诺贝尔奖在等着。)