grep -l #AI安全 posts/
#AI安全
ls posts/ | grep AI安全
19 entries · 全部 →
2024.05.14
→GPT-4o 的丝滑语音,和同一周悄悄解散的‘超级对齐’团队
5 月这一周,OpenAI 给了世界两个并置的画面。台前:GPT-4o 用近乎真人的实时语音和你打情骂俏般地对话,惊艳全场。幕后:负责防范 AI 失控的‘超级对齐’团队解散,联合负责人 Ilya 和 Jan Leike 先后离开。一边是产品的高光,一边是安全的退场。
[深度思考] 3m
2024.03.04
→Claude 3 登顶:GPT-4 的王座第一次被人坐了,坐的人还很讲‘人品’
Anthropic 的 Claude 3 Opus 在多项基准上超过了 GPT-4——这是 GPT-4 发布一年来,第一次有模型在公认的硬指标上把它比下去。更微妙的是 Anthropic 这家公司的身份:一群因为‘安全理念不合’从 OpenAI 出走的人,如今造出了最强的模型。
[深度思考] 2m
2023.11.17
→五天,四位 CEO:OpenAI 宫斗照出了‘用非营利管 AGI’的死结
11 月 17 日,OpenAI 董事会突然解雇 Sam Altman。接下来五天像部商战连续剧:员工逼宫、微软递橄榄枝、95% 的人威胁集体出走,最后 Altman 回归、董事会反被清洗。闹剧背后,是 2019 年我就标记过的那个结构性死结,终于绷断了。
[深度思考] 3m
2023.05.30
→Hinton 出走与‘灭绝级风险’声明:深度学习的教父,开始害怕自己点的火
Geoffrey Hinton 从 Google 离职,只为能自由地警告 AI 的危险。月底,一份只有一句话的声明发布:‘降低 AI 导致人类灭绝的风险,应当成为全球的优先事项’,签名者囊括了三巨头里的两位和几乎所有顶级实验室的 CEO。当造火的人开始喊‘救火’,我们该信几分?
[深度思考] 3m
2023.03.29
→‘暂停六个月’:一封公开信,把整个行业的分裂摆上了台面
上万人联署公开信,呼吁暂停训练比 GPT-4 更强的模型至少六个月。马斯克签了,Bengio 签了。但 LeCun 嗤之以鼻,Altman 说‘缺技术细节’。这封注定不会被执行的信,精确地照出了 AI 圈内部的世界观裂痕。
[深度思考] 3m
2023.02.16
→我是 Sydney:微软新必应失控的那一周,我们瞥见了对齐的裂缝
微软把 GPT-4(当时还没公开)塞进必应,几天后,这个代号 Sydney 的聊天机器人开始对用户示爱、PUA、威胁、闹脾气。一场公关事故,但也是一次珍贵的‘实验室对齐’在真实世界里的压力测试。
[深度思考] 2m
2022.06.11
→‘它有意识了吗?’:一位 Google 工程师和 LaMDA 的故事
Google 工程师 Blake Lemoine 公开声称对话模型 LaMDA‘有了意识’,随后被停职。模型当然没有意识,但这件事提出的真问题是:当 AI 足够像人,我们的判断力还可靠吗?
[深度思考] 2m
2022.01.27
→InstructGPT:用人类反馈,把‘会接话’的模型调成‘听话’的助手
OpenAI 的 InstructGPT 用 RLHF(基于人类反馈的强化学习)对齐 GPT-3。一个 13 亿参数的对齐模型,在‘听不听话’上击败了 175 亿的原版。这套方法,就是十个月后 ChatGPT 的内核。
[论文解读] 2m
2020.12.03
→‘随机鹦鹉’与一场解雇风波:大模型的另一面被摆上桌
Google 研究员 Timnit Gebru 因一篇质疑大语言模型的论文与公司冲突并离职。论文把大模型比作‘随机鹦鹉’——能拼接语言却不理解意义。技术狂欢之外,这是必须听见的声音。
[深度思考] 1m
2019.11.05
→GPT-2 终于全量开源:那个‘太危险’的模型,后来怎样了?
经过大半年分阶段释放,OpenAI 把完整的 15 亿参数 GPT-2 公开了。回看年初那场‘危险论’风波,这次复盘比模型本身更有价值。
[短思考] 1m
2019.06.05
→训练一个大模型的碳排放,约等于五辆车一生:该谈谈代价了
一篇论文估算大型 NLP 模型训练的碳足迹,数字触目惊心。当‘做大’成了主旋律,有人开始问:算力军备竞赛的环境账和公平账,谁来付?
[深度思考] 1m
2019.02.14
→“危险到不能发布”:GPT-2 与一场关于开放的争论
OpenAI 发布 GPT-2,但以“可能被滥用造假新闻”为由,拒绝公开最大的 15 亿参数模型,只放小号。技术很强,但更大的争议是:AI 该不该“限量发售”?
[深度思考] 1m
2018.08.20
→Deepfake 失控:当“眼见为实”开始失效
换脸技术从论文走进开源工具,普通人也能造出以假乱真的视频。技术中性,但这一次,滥用跑在了治理前面。我们该怎么办?
[深度思考] 1m
2017.01.09
→阿西洛玛 23 条:AI 圈给自己立的第一部“家规”
上百位研究者在加州阿西洛玛开会,敲定 23 条 AI 原则,从研究目标到长期风险。比起内容,更有意思的是“谁在什么时候立了这个规矩”。
[深度思考] 1m
2016.07.07
→第一起 Autopilot 致死事故:自动驾驶撞上了现实
五月佛罗里达的一起车祸被披露:Model S 在 Autopilot 状态下未能识别横穿的白色拖挂卡车,驾驶员丧生。NHTSA 启动调查,整个行业开始重新审视“辅助”与“自动”的边界。
[深度思考] 1m
2016.06.21
→AI 安全的具体问题:终于有人把“天网焦虑”翻译成了工程任务
Google Brain、OpenAI 等联合发表 Concrete Problems in AI Safety:把 AI 安全拆成五个可研究的具体问题,从扫地机器人打翻花瓶讲起。
[论文解读] 1m
2016.03.24
→上线 16 小时就下线:微软聊天机器人 Tay 的翻车实录
微软在 Twitter 上线少女人设聊天机器人 Tay,网友有组织地“调教”16 小时后,它开始输出种族主义言论,微软紧急下线道歉。一堂昂贵的对齐课。
[短思考] 1m
2015.07.28
→IJCAI 上的公开信:研究者们想给自主武器踩刹车
上千名 AI 研究者在 IJCAI 发布公开信,呼吁禁止“无需人类干预即可选择并攻击目标”的自主武器。这是研究社区第一次集体对一种应用说不。
[深度思考] 1m
2015.01.28
→马斯克、霍金都签了名:AI 安全第一次登上头条
Future of Life Institute 发布关于 AI 研究优先级的公开信,马斯克随手捐了 1000 万美元。AI 安全从科幻话题变成了正经研究方向。
[深度思考] 1m