Claude 3 登顶:GPT-4 的王座第一次被人坐了,坐的人还很讲‘人品’

GPT-4 称霸了整整一年。这一年里,所有挑战者(Gemini、各种开源模型)都只能说‘接近’或‘某些方面持平’,没人能在公认的硬基准上真正把它拉下来。3 月,Anthropic 的 Claude 3 做到了——顶配的 Opus 在 MMLU(综合知识)、HumanEval(代码)、数学推理等一系列标准评测上,数字明确地超过了 GPT-4。王座第一次易主。

一个广为流传的小插曲,和它的两种解读

发布时有个细节出了圈。在‘大海捞针’测试里(把一句无关的话藏进超长文档,看模型能不能找出来),Claude 3 Opus 不仅准确找到了那句关于披萨配料的话,还多说了一句:这句话和文档其他内容格格不入,我怀疑它是被故意插进来测试我注意力的。

社交媒体当然往‘它有自我意识了’的方向狂欢。但冷静的解读是:这是高级的模式识别,不是觉醒。它在海量文本里见过无数‘测试’‘陷阱题’的语境,识别出‘一句突兀的话被插进无关文档’这种模式 = ‘这像是个测试’,完全在它的能力范围内,不需要任何意识。这其实是 2022 年 LaMDA‘觉醒’风波的又一次复演——模型越强,越擅长生成‘像有心智’的输出,我们也越容易被骗。值得警惕的不是模型真的醒了,而是连专业人士都会一次次被这种表象带跑。

真正的看点是‘谁’造出了它

比 benchmark 数字更有嚼头的,是 Anthropic 这家公司的来历。它的创始人 Dario Amodei 等人,正是 2021 年因为和 OpenAI 在‘安全到底该多优先’上理念不合而集体出走的那批核心研究者。他们成立 Anthropic,旗帜就是 AI 安全,招牌方法叫 Constitutional AI——不全靠人类一条条标注反馈,而是给模型一部‘宪法’(一组原则),让它依据原则自我批评、自我修正,把对齐做得更可扩展、更透明。

所以 Claude 3 登顶这件事,有一层强烈的反讽与隐喻:一群‘因为觉得 OpenAI 不够重视安全而离开’的人,造出了当时最强的模型。这恰恰回应了 2023 年那场关于‘安全 vs 发展’的全行业撕裂——它似乎在暗示,把安全当第一性原则,未必就要牺牲能力,两者可能并不像很多人争论的那样势不两立。当然,这也可能只是 Anthropic 阶段性领先的市场叙事,毕竟它背后也站着亚马逊和谷歌的巨额投资,商业引力一样在拉扯它。

无论如何,2024 年开年的格局变了:大模型的顶端,从 OpenAI 一家独大,变成了 OpenAI、Anthropic、Google 三强贴身缠斗。竞争是好事——它逼着每一家既要卷能力,也开始(至少在话术上)卷安全和可信。GPT-4 的王座被坐热乎之后,谁也别想独坐太久了。

一个广为流传的小插曲,和它的两种解读

真正的看点是‘谁’造出了它

每周一封，<5 分钟读完