session://14:29:33
~/ / posts / 2018-12-alphafold1.md

AlphaFold 初露锋芒:AI 开始啃生物学的硬骨头

2018-12-02· 1 min read · [深度思考]
// TL;DR
  • AlphaFold 在 CASP13 的自由建模组拿下第一,精度明显领先传统方法。
  • 用深度学习从氨基酸序列预测残基间距离分布,再据此推三维结构。
  • 这是 AI 解决重大科学问题的早期信号,序幕而非高潮。

蛋白质折叠问题

蛋白质由氨基酸链构成,但决定它功能的是折叠成的三维结构。从一维序列预测三维结构——“蛋白质折叠问题”——困扰了生物学界半个世纪,是诺奖级别的难题。CASP 是这个领域两年一度的“世界杯”,匿名盲测各家方法。今年 CASP13,DeepMind 的 AlphaFold 在最难的自由建模组夺冠,而且不是险胜,是断层领先。

它怎么做的

这一代 AlphaFold 的核心,是用深度网络从序列(及其进化同源信息)预测氨基酸残基两两之间的距离分布和扭转角,把这些约束转化成一个能量函数,再用梯度下降找到满足约束的三维结构。还不是后来那个端到端的版本,但思路已经成型。

为什么这件事比赢围棋大

围棋赢了,改变的是围棋。蛋白质结构预测如果被攻克,改变的是药物研发、酶设计、疾病机理研究——一整条生命科学的上游。Hassabis 当年说 DeepMind 的终极目标是“用 AI 解决智能,再用智能解决一切”,CASP13 是这句话第一次落到实处。

我得克制一点:这只是初代,精度离“实验级可用”还有距离,离“干翻整个结构生物学”更远。但方向被点亮了——AI 不只是赢游戏、推荐广告,它可以成为基础科学的引擎。这条线,我会持续重点跟。(剧透一下:两年后的 CASP14 会更炸。)

人工智能行业动态深度学习
cat newsletter.txt

每周一封,<5 分钟读完

把这一周我读过、想过、动手做过的东西,压缩成一封信。订阅者目前 5210+ 人,0 干扰。