session://14:29:33
~/ / posts / 2020-11-alphafold2.md

AlphaFold2:一个困扰生物学 50 年的问题,基本被解决了

2020-11-30· 1 min read · [深度思考]
// TL;DR
  • AlphaFold2 的中位精度(GDT ~92)接近实验级别,断层领先所有对手。
  • 端到端架构 Evoformer:把进化信息和几何约束揉进注意力机制。
  • CASP 组织者罕见地用了‘problem solved’这种措辞。

两年前的伏笔,兑现了

2018 年我写 AlphaFold1 时说,这只是序幕,两年后的 CASP14 会更炸——现在炸了。AlphaFold2 在 CASP14 上的预测精度,中位 GDT 分数达到约 92(满分 100,90 以上通常被认为与实验测定结构难以区分)。这不是‘比第二名好一点’,是把一个半世纪的难题直接拉到了‘基本可用’的水平。CASP 主办方 John Moult 的原话大意是:在某种意义上,这个问题解决了。

技术上的飞跃

相比初代,AlphaFold2 是端到端重构。核心是 Evoformer 模块:把同源序列的进化信息(哪些位置一起突变,往往在空间上相邻)和残基对的几何关系,通过注意力机制反复交换、迭代精修,最后直接输出三维原子坐标。它不再是‘预测距离再求解结构’的两段式,而是让网络一气呵成地‘想象’出折叠后的样子。

为什么这是 AI 的高光时刻

蛋白质结构决定功能,功能关系到一切——理解疾病机理、设计药物、改造酶。过去测一个结构靠 X 射线晶体学或冷冻电镜,耗时数月到数年、花费高昂。AlphaFold2 让它变成几分钟的计算。这不是‘AI 又赢了一个游戏’,这是 AI 第一次在一个诺奖级的基础科学难题上,做出了实质性的、改变学科的贡献。

AlphaGo 改变了围棋,AlphaFold 改变了生物学——后者的份量,要用几十年才能完全称出来。

Hassabis 创立 DeepMind 时说‘先解决智能,再用智能解决一切’,听着像狂言。AlphaFold2 让这句话第一次有了沉甸甸的实证。我会把它放在这十年最重要的 AI 成果候选名单的最前面。(预告:这条线后面还有诺贝尔奖在等着。)

人工智能行业动态深度学习论文解读
cat newsletter.txt

每周一封,<5 分钟读完

把这一周我读过、想过、动手做过的东西,压缩成一封信。订阅者目前 5210+ 人,0 干扰。