session://14:29:34
grep -l #NLP posts/

#NLP

ls posts/ | grep NLP
15 entries · 全部 →
2022.09.21
Whisper:OpenAI 顺手开源了一个几乎‘解决’了语音识别的模型
OpenAI 开源语音识别模型 Whisper:68 万小时多语言数据训练,鲁棒性强、多语言、还能翻译,而且免费开放。语音转文字这个老问题,基本被一个模型按平了。
[产品实践] 1m
2022.04.04
PaLM 与思维链:让大模型‘把推理过程说出来’,它居然就更会算了
Google 的 5400 亿参数 PaLM,配合一个朴素到离谱的技巧——思维链提示(让模型‘一步步想’)——在数学和推理任务上能力大涨。规模 + 提示方式,解锁了‘涌现’。
[论文解读] 2m
2022.01.27
InstructGPT:用人类反馈,把‘会接话’的模型调成‘听话’的助手
OpenAI 的 InstructGPT 用 RLHF(基于人类反馈的强化学习)对齐 GPT-3。一个 13 亿参数的对齐模型,在‘听不听话’上击败了 175 亿的原版。这套方法,就是十个月后 ChatGPT 的内核。
[论文解读] 2m
2021.12.08
Gopher 与 RETRO:DeepMind 说,光把模型做大可能不够
DeepMind 一口气放出 2800 亿参数的 Gopher 和一个反潮流的 RETRO。RETRO 用‘检索外部文本库’的方式,让一个小 25 倍的模型追平大模型。规模不是唯一的解。
[论文解读] 2m
2020.07.18
GPT-3 API 开放内测:一夜之间,推特上全是‘我让 AI 干了 X’
GPT-3 API 内测放出,开发者们疯了:用它生成代码、写文案、做问答机器人、甚至把需求描述直接变成网页布局。一个 API 催生了一场应用寒武纪大爆发的预演。
[产品实践] 1m
2020.05.28
GPT-3:1750 亿参数,和一个叫‘提示词’的新交互方式
OpenAI 发布 1750 亿参数的 GPT-3。最震撼的不是参数,是 few-shot:不微调、不改一个权重,只在提示词里给几个例子,它就能上手新任务。人机交互的方式,可能要变了。
[论文解读] 1m
2019.11.05
GPT-2 终于全量开源:那个‘太危险’的模型,后来怎样了?
经过大半年分阶段释放,OpenAI 把完整的 15 亿参数 GPT-2 公开了。回看年初那场‘危险论’风波,这次复盘比模型本身更有价值。
[短思考] 1m
2019.10.23
T5:把所有 NLP 任务都变成‘文本进、文本出’
Google 的 T5 提出一个极简又极强的统一框架:翻译、摘要、分类、问答——通通当成‘文本到文本’的生成任务来做。一篇论文,一套范式,顺便把迁移学习的各种选择系统地扫了一遍。
[论文解读] 1m
2019.02.14
“危险到不能发布”:GPT-2 与一场关于开放的争论
OpenAI 发布 GPT-2,但以“可能被滥用造假新闻”为由,拒绝公开最大的 15 亿参数模型,只放小号。技术很强,但更大的争议是:AI 该不该“限量发售”?
[深度思考] 1m
2018.10.11
BERT 屠榜:双向预训练把 NLP 带进“微调时代”
Google 发布 BERT:用掩码语言模型做双向预训练,在 11 项 NLP 任务上集体刷新 SOTA,GLUE 榜单一夜变天。预训练大模型 + 微调,成了 NLP 的新默认。
[论文解读] 1m
2018.06.11
GPT-1:OpenAI 押注“预训练 + 微调”的第一张牌
OpenAI 发布 GPT:用 Transformer 解码器在大量无标注文本上做语言模型预训练,再微调到各类任务。一个模型打多个任务的范式,开始成型。
[论文解读] 1m
2017.06.12
Attention Is All You Need:八个人把 RNN 送进了历史
Google 八人组的 Transformer 论文挂上 arXiv:不要循环、不要卷积,纯注意力机制做序列建模,翻译质量和训练速度双双碾压。这篇必须精读。
[论文解读] 2m
2016.09.27
谷歌翻译换引擎:GNMT 一夜之间把错误率砍掉六成
Google 发布 GNMT 神经机器翻译系统并直接上线中英翻译:8 层 LSTM 编解码器加注意力机制,翻译错误率较老系统下降 55-85%,十年统计机器翻译时代谢幕。
[论文解读] 1m
2016.03.24
上线 16 小时就下线:微软聊天机器人 Tay 的翻车实录
微软在 Twitter 上线少女人设聊天机器人 Tay,网友有组织地“调教”16 小时后,它开始输出种族主义言论,微软紧急下线道歉。一堂昂贵的对齐课。
[短思考] 1m
2015.05.21
RNN 的不讲道理的有效性:一篇博客带火了字符级语言模型
Karpathy 的博客 The Unreasonable Effectiveness of RNN 火遍了圈子:一个字符级 RNN 就能生成像模像样的莎士比亚、Linux 内核代码和数学论文。
[短思考] 1m