‘随机鹦鹉’与一场解雇风波:大模型的另一面被摆上桌

一篇论文,一场风波

就在大家为 GPT-3、AlphaFold2 欢呼的年底,Google AI 伦理团队的 Timnit Gebru 等人写了篇论文 On the Dangers of Stochastic Parrots,泼了盆冷水。然后事情失控了:Google 要求撤稿或撤名,Gebru 拒绝并随后离职(她说被解雇,Google 说是接受辞呈),整个 AI 社区炸锅,数千人联名声援。

‘随机鹦鹉’到底在说什么

论文的核心批评有几条,每条都值得认真对待:

环境成本:训练超大模型耗能惊人(呼应了 2019 年的 Green AI)。
数据偏见:模型从互联网文本里学到的,包括其中的种族、性别、地域偏见,且会被放大和固化。
‘随机鹦鹉’:模型擅长根据统计规律拼接出流畅语言,但这不等于理解意义——我们容易被流畅性骗,误以为它‘懂’。
机会成本:全行业的注意力和资源都涌向‘更大的模型’,挤压了其他可能更有价值的研究方向。

我怎么看

技术上,我不完全同意‘只是鹦鹉’——后来的发展会显示,规模带来的能力涌现比‘统计拼接’这个比喻复杂得多。但论文提出的问题没有一条是错的:成本、偏见、对‘流畅 ≠ 理解’的警惕,全都成立,而且会越来越重要。

更刺痛的是那个体制问题:当研究者受雇于正在卖这项技术的公司,他们批评这项技术的自由有多大?Gebru 事件把这个矛盾血淋淋地摆了出来。一个健康的领域,需要欢呼的人,也需要被允许大声质疑的人。2020 年是大模型的封神之年,但这场风波提醒我们:神坛之下,有些代价正在被悄悄记账。这本账,以后每年都得翻出来看。

一篇论文,一场风波

‘随机鹦鹉’到底在说什么

我怎么看

每周一封，<5 分钟读完