session://14:29:33
~/ / posts / 2025-01-deepseek-stargate.md

同一周的两张面孔:5000 亿美元的豪赌,和一个把英伟达干跌 6000 亿的开源小模型

2025-01-27· 4 min read · [深度思考]
// TL;DR
  • 1/21 Stargate:OpenAI 主导、软银出资,四年 5000 亿美元建 AI 基础设施——把‘规模即权力’推到国家级。
  • 1/20 DeepSeek-R1 开源:用纯强化学习(R1-Zero 几乎不靠人工标注)逼出强推理,效果对标 o1,成本与开放度却天差地别。
  • 市场用脚投票:1/27 DeepSeek 登顶美区 App Store,英伟达当日市值蒸发近 6000 亿美元——‘只有巨头烧得起钱’的叙事被击穿。

我写这篇时,还能感到那种‘剧情撞车’的眩晕感。同一周,AI 行业的两种信仰被摆上了同一张桌子,而且都赌得很大。

面孔一:Stargate——把‘规模’信仰推到国家级

1 月 21 日,OpenAI 联合软银、甲骨文、MGX 宣布 Stargate 项目:四年内投入高达 5000 亿美元,在美国建设 AI 数据中心和算力基础设施,软银负责钱、OpenAI 负责跑,连美国总统都站台。这是‘scale works’这个信仰的终极形态——它不再是一句技术口号,而是一笔国家战略级别的资本承诺。它背后的逻辑一脉相承:从 2020 年缩放定律,到 2024 年 o3 那张几千美元一题的账单,这一派坚信,通往更强 AI 的路,就是更多算力、更多电、更多钱,没有捷径。

面孔二:DeepSeek-R1——把‘效率’卷成了一记耳光

几乎同一时间,杭州的 DeepSeek 开源了 R1。它是个推理模型,对标的正是 OpenAI 闭源、昂贵的 o1。但它做了三件让整个行业坐不住的事:第一,效果真能打,在数学、代码等推理基准上逼近 o1;第二,训练成本据其论文低得惊人(V3 基座的训练成本被报道在几百万美元量级,相比西方旗舰的天文数字低了一个数量级);第三——也是最狠的——它完全开源,权重、方法、论文全公开。

技术上最让研究者兴奋的是 R1-Zero 这个变体:它几乎跳过了昂贵的人工标注(SFT)那一步,直接用强化学习,让模型为了‘把答案做对’这个奖励信号,自己长出了一套推理行为——它会自发地写出长篇思考、自我检查、甚至出现‘等一下,让我重新想想’这种回退。这等于把 2024 年 o1 那套‘私下没说’的配方,用一种更纯粹、更省的方式公开复现了。

西方旗舰推理模型(o1/o3):
  闭源 + 昂贵的人工标注 + 海量算力 → 强推理(但只能付费调 API,方法保密)

DeepSeek-R1-Zero 的暴力美学:
  预训练基座 + 纯强化学习(奖励 = 答案对不对) → 推理行为自发涌现
  └─ 跳过/弱化人工标注这一最贵的环节,且全部开源

结论:强推理不必是少数巨头的专利,配方可以被便宜地、公开地复现。

市场的反应,比任何评论都响

1 月 27 日,DeepSeek 的 App 登顶美区 App Store 免费榜——一个中国团队的开源模型,在美国本土把 ChatGPT 挤了下去。同一天,美股 AI 板块崩了:英伟达单日市值蒸发近 6000 亿美元,创了美股史上单日市值蒸发纪录。市场在恐慌什么?恐慌的正是 Stargate 那套叙事的根基——如果一个小团队用一个数量级更低的成本就能造出对标旗舰的模型,那么‘必须烧几千亿、买几十万张卡才能玩 AI’的故事,还成立吗?英伟达卖的‘铲子’,还能卖这么贵吗?

我的判断:这不是谁对谁错,是 AI 的两条腿

事后看,市场那一跌有点过度反应——Stargate 和 DeepSeek 并不是‘一个对一个错’的零和关系,它们是 AI 进步的两条腿,缺一不可。规模派拓展能力的上限(没有大算力,就没有最初的强基座可供蒸馏和强化);效率派则决定这些能力能多快、多便宜地扩散到所有人手里(没有效率,再强的能力也锁在少数人的服务器里)。真实的历史里,这两条腿是交替前进的——还记得 AlphaGo 从分布式集群瘦身到单机 TPU 吗?能力先被昂贵地造出来,再被便宜地普及,周而复始。

但 DeepSeek 这一击的深远意义不该被低估,它至少敲定了三件事。其一,我在 2024 年底押的‘效率战争’,2025 年开年就以最戏剧化的方式打响了,而且第一枪是中国团队开的。其二,它再次验证了我追问多年的判断:模型本身正在以惊人的速度商品化,闭源旗舰的领先窗口被压缩到了以月计——你前脚发布,后脚就有人开源一个便宜十倍的‘够好版’。其三,它把‘开源 vs 闭源’‘效率 vs 规模’‘中 vs 美’这几条线,在一周内拧成了 2025 年最紧张的那根弦。这一年剩下的故事,基本都是这根弦的回响。

大模型开源项目强化学习行业动态
cat newsletter.txt

每周一封,<5 分钟读完

把这一周我读过、想过、动手做过的东西,压缩成一封信。订阅者目前 5210+ 人,0 干扰。