GPT-2 终于全量开源:那个‘太危险’的模型,后来怎样了?
// TL;DR
- OpenAI 最终公开完整 15 亿参数模型,并发布了滥用监测报告。
- 结论:预想中的大规模假新闻滥用并未真正出现。
- ‘分阶段披露’作为一种治理实验,留下了正反两面的经验。
靴子落地
年初 GPT-2 以‘太危险’为由只放小号,引发轩然大波。大半年里,OpenAI 按 124M → 355M → 774M → 1.5B 的节奏分阶段释放,边放边观察。十一月,完整的 15 亿参数模型连同一份滥用研究报告一起公开。报告的核心结论挺朴素:他们没有发现 GPT-2 被用于大规模恶意活动的实质证据,合成文本的检测也比预想中可行。
这场实验留下了什么
复盘下来,正反都有。批评者会说:看吧,危险被夸大了,分阶段发布更像炒作,白白拖慢了研究复现。支持者会说:在不确定后果时保持审慎、边放边观察、主动研究滥用,这套‘负责任披露’的流程本身就是宝贵的先例,不能用‘结果没出事’倒推‘当初不该谨慎’。
我的提炼
我倾向认为这是一次有价值的‘消防演习’——这次的火不大,但把流程跑通了:能力评估、分阶段、滥用监测、社区沟通。真正的考验在后面,当模型强到生成内容与真人无差、且能规模化时,这套流程扛不扛得住。GPT-2 是预演,不是终曲。OpenAI 大概率已经在憋更大的东西了——按它的迭代节奏,GPT-3 应该不远。