session://14:29:33
~/ / posts / 2020-12-stochastic-parrots.md

‘随机鹦鹉’与一场解雇风波:大模型的另一面被摆上桌

2020-12-03· 1 min read · [深度思考]
// TL;DR
  • 论文质疑大模型的环境成本、数据偏见、以及‘看似理解实则统计拼接’。
  • ‘随机鹦鹉’:模型在缝合训练数据的统计规律,不等于真正理解。
  • Gebru 的离职引爆了关于企业研究独立性与 AI 伦理的大讨论。

一篇论文,一场风波

就在大家为 GPT-3、AlphaFold2 欢呼的年底,Google AI 伦理团队的 Timnit Gebru 等人写了篇论文 On the Dangers of Stochastic Parrots,泼了盆冷水。然后事情失控了:Google 要求撤稿或撤名,Gebru 拒绝并随后离职(她说被解雇,Google 说是接受辞呈),整个 AI 社区炸锅,数千人联名声援。

‘随机鹦鹉’到底在说什么

论文的核心批评有几条,每条都值得认真对待:

  • 环境成本:训练超大模型耗能惊人(呼应了 2019 年的 Green AI)。
  • 数据偏见:模型从互联网文本里学到的,包括其中的种族、性别、地域偏见,且会被放大和固化。
  • ‘随机鹦鹉’:模型擅长根据统计规律拼接出流畅语言,但这不等于理解意义——我们容易被流畅性骗,误以为它‘懂’。
  • 机会成本:全行业的注意力和资源都涌向‘更大的模型’,挤压了其他可能更有价值的研究方向。

我怎么看

技术上,我不完全同意‘只是鹦鹉’——后来的发展会显示,规模带来的能力涌现比‘统计拼接’这个比喻复杂得多。但论文提出的问题没有一条是错的:成本、偏见、对‘流畅 ≠ 理解’的警惕,全都成立,而且会越来越重要。

更刺痛的是那个体制问题:当研究者受雇于正在卖这项技术的公司,他们批评这项技术的自由有多大?Gebru 事件把这个矛盾血淋淋地摆了出来。一个健康的领域,需要欢呼的人,也需要被允许大声质疑的人。2020 年是大模型的封神之年,但这场风波提醒我们:神坛之下,有些代价正在被悄悄记账。这本账,以后每年都得翻出来看。

AI安全大模型行业动态人工智能
cat newsletter.txt

每周一封,<5 分钟读完

把这一周我读过、想过、动手做过的东西,压缩成一封信。订阅者目前 5210+ 人,0 干扰。