session://14:29:33
~/ / posts / 2023-07-llama2.md

LLaMA 2:Meta 把‘开源’做成了一把对准 OpenAI 的商业武器

2023-07-18· 2 min read · [深度思考]
// TL;DR
  • LLaMA 2(7B/13B/70B)开放权重、允许商用,并发布了对齐(RLHF)的详细做法。
  • 对比 GPT-4 报告的‘什么都不说’,LLaMA 2 论文堪称开源界的良心教材。
  • Meta 的算盘:用开源把对手的闭源优势‘商品化’,自己赢生态和人才。

2 月那次 LLaMA 是‘泄露’,Meta 多少有点被动。7 月这次完全不同:LLaMA 2 是大大方方正式发布的,权重开放下载,而且许可证明确允许商用(月活 7 亿以上的巨头除外,基本就是专门膈应几个竞品)。更难得的是,它的论文写得极其坦诚——把预训练数据怎么配的、RLHF 怎么做的、奖励模型怎么训的、安全对齐踩过哪些坑,都摊开来讲。

把它和四个月前 GPT-4 那份‘什么都不说’的报告并排放,反差强烈到像两个时代的产物。一边是把方法当核武器锁起来,一边是把教科书递到你手上。这种对照本身,就是 2023 年最值得玩味的行业叙事。

Meta 图什么:这不是慈善,是阳谋

扎克伯格不是活雷锋,LLaMA 2 开源是一步精算过的商业棋,逻辑大致是这样的:

  • 商品化对手的核心资产。OpenAI、Google 的护城河是‘我们有最强的闭源模型,你只能付费调我的 API’。Meta 把一个‘足够好’的模型免费开放,等于把对手卖钱的东西变成了免费的公共品——这叫‘商品化你的互补品’,是平台战争里的经典杀招。我不靠卖模型赚钱,但我能让你也别想靠卖模型赚钱。
  • 赢生态和标准。当全世界的开发者、创业公司、研究者都在 LLaMA 上构建、微调、积累工具链,Meta 就成了开源大模型事实上的标准制定者和生态中心。生态的价值,远超单个模型。
  • 赢人才和口碑。顶尖研究者用脚投票,愿意去能开源、能发论文、影响力大的地方。开源是 Meta 招人和重塑形象(从‘social media 公司’到‘AI 公司’)的利器。
  • 免费的安全审计和迭代。全世界帮你找漏洞、做微调、探索应用,Meta 坐收整个社区的智慧反哺。

对行业格局的真实影响

LLaMA 2 把 2 月那把野火,浇上了正规军的汽油。在它之前,开源大模型多少带点‘灰色地带’和‘玩具’的味道;在它之后,企业可以名正言顺地基于一个开放、可商用、文档齐全的强模型来构建产品——数据不出门、可深度定制、推理成本自己控。这对‘只能调闭源 API’的范式,是一次结构性的冲击。

我追了好几年的那个问题——‘大模型时代,价值和护城河在哪’——到 2023 年,答案的轮廓越来越清晰了:模型本身正在快速贬值为商品(开源在底部托着、竞争在顶部压着),真正稀缺的是数据、是场景、是把模型嵌进真实工作流的产品能力、是生态位。Meta 用 LLaMA 2 把这个趋势按下了加速键。闭源派守上限,开源派抢生态,这场长跑,2023 年下半场才刚开哨。

大模型开源项目行业动态产品思考
cat newsletter.txt

每周一封,<5 分钟读完

把这一周我读过、想过、动手做过的东西,压缩成一封信。订阅者目前 5210+ 人,0 干扰。