4:1，第 37 手：AlphaGo 战胜李世石的一周

比赛本身

三月 9 日到 15 日，首尔四季酒店，AlphaGo 对李世石五番棋。赛前李世石放话 5:0 或 4:1 获胜——方向对了，主语错了。最终 AlphaGo 4:1，第一局获胜时整个围棋界还在懵，第三局结束锁定胜局时，解说席上职业九段们的表情我这辈子都忘不了。

两手棋，两个瞬间

第二局第 37 手，AlphaGo 在五路肩冲——职业棋手的第一反应是“程序出 bug 了”，因为人类棋理里这手棋“不成立”。但复盘显示这手棋极深远。DeepMind 后来透露，AlphaGo 估计人类棋手下这手的概率不到万分之一，但它自己算出来这是最优。换句话说：它没有在模仿人类，它在棋盘上发现了人类三千年没走过的路。

第四局第 78 手，轮到人类还击。李世石长考后在中腹挖出妙手，AlphaGo 的胜率评估瞬间崩塌，连出昏招——这手被称为“神之一手”。它暴露了一个重要事实：AlphaGo 的价值网络存在盲区，在极低概率的分支上估值会失真。

这一周意味着什么

对围棋，AI 从对手变成了老师——已经有职业棋手开始研究第 37 手背后的思路。对行业，这是深度强化学习最好的广告：据说韩国政府赛后宣布追加上万亿韩元的 AI 投资。对我们这些从业者，最值得记住的是第 37 手和第 78 手的并存：前者证明机器可以超越人类先验，后者提醒我们它的失效模式藏在分布的尾部。一个系统强大和它可靠，是两件事。

比赛本身

两手棋，两个瞬间

这一周意味着什么

每周一封，<5 分钟读完