grep -l #人工智能 posts/

#人工智能

ls posts/ | grep 人工智能

27 entries · 全部 →

→十一年,从一封公开信到一个替你过日子的 Agent:此刻的回望

从 2015 年那封‘AI 安全第一次上头条’的公开信,写到 2026 年一个主动替你打理生活的 Agent,我把这十一年的脉络梳理了一遍。这是一篇站在‘现在’的回望——关于我们走了多远、几条主线如何收束,以及一个产品经理在浪潮中段,最想守住的东西。

[深度思考] 4m

→GPT-5.4 与 GDPval:当 AI 开始用‘能顶几个白领’来打分

3 月,GPT-5.4 发布,在‘电脑操作’和一个叫 GDPval 的新基准上创了纪录。GDPval 很特别:它不考数学竞赛、不考刷题,而是直接拿 44 种真实职业的实际工作交付物来考 AI。当评价标准从‘能不能解题’变成‘能不能替代一份工作’,我们衡量 AI 的尺子,彻底换了。

[深度思考] 3m

→GPT-5 来了,然后大家开始认真讨论:我们是不是,撞到平台期了?

等了两年多的 GPT-5 终于发布。它很好——更稳、更会自动决定‘要不要深想’、幻觉更少、编程更强。但它没有带来 GPT-3 到 GPT-4 那种‘换了个物种’的震撼。一个略带尴尬的问题第一次被大面积、严肃地讨论:大模型的进步,是不是从‘陡坡’进入了‘缓坡’?

[深度思考] 3m

→o3 与 ARC 谜题:推理这条新路,年底就给了我们一个‘吓一跳’

九月 o1 刚开了‘推理时扩展’这条路,年底 OpenAI 就甩出 o3,在一个专门用来‘考倒 AI’的基准 ARC-AGI 上,从此前的个位数百分比飙到了 87%。好消息是进步快得惊人,坏消息(也是好消息)是:这一份‘聪明’,贵得也惊人。

[深度思考] 3m

→诺奖的双响炮:物理学奖给了神经网络,化学奖给了 AlphaFold

同一个诺奖季,物理学奖颁给了奠定神经网络基础的 Hopfield 和 Hinton,化学奖颁给了用 AlphaFold 破解蛋白质结构的 Hassabis、Jumper(和做蛋白设计的 Baker)。科学界最高荣誉,在两天内两次盖章:AI 已经成了科学本身的引擎。

[深度思考] 3m

→o1:OpenAI 换了个维度卷——不再卷模型多大,而是卷它‘想多久’

o1 是 2024 年最重要的技术转向。它不靠把模型做得更大,而是让模型在回答前先‘想很久’——生成一长串内部推理,用强化学习训练这个思考过程。一个全新的、和参数规模并列的扩展维度被打开了:推理时算力。

[论文解读] 4m

→五天,四位 CEO:OpenAI 宫斗照出了‘用非营利管 AGI’的死结

11 月 17 日,OpenAI 董事会突然解雇 Sam Altman。接下来五天像部商战连续剧:员工逼宫、微软递橄榄枝、95% 的人威胁集体出走,最后 Altman 回归、董事会反被清洗。闹剧背后,是 2019 年我就标记过的那个结构性死结,终于绷断了。

[深度思考] 3m

→Hinton 出走与‘灭绝级风险’声明:深度学习的教父,开始害怕自己点的火

Geoffrey Hinton 从 Google 离职,只为能自由地警告 AI 的危险。月底,一份只有一句话的声明发布:‘降低 AI 导致人类灭绝的风险,应当成为全球的优先事项’,签名者囊括了三巨头里的两位和几乎所有顶级实验室的 CEO。当造火的人开始喊‘救火’,我们该信几分?

[深度思考] 3m

→‘暂停六个月’:一封公开信,把整个行业的分裂摆上了台面

上万人联署公开信,呼吁暂停训练比 GPT-4 更强的模型至少六个月。马斯克签了,Bengio 签了。但 LeCun 嗤之以鼻,Altman 说‘缺技术细节’。这封注定不会被执行的信,精确地照出了 AI 圈内部的世界观裂痕。

[深度思考] 3m

→GPT-4 与‘AGI 的火花’:能力封顶的一天,也是 OpenAI 彻底闭嘴的一天

GPT-4 发布,能力又上一个台阶:能看图、能过专业考试、推理明显更稳。但它的技术报告史无前例地什么都没说——参数、架构、数据、算力,一概‘出于竞争和安全考虑’不予披露。那个名字里写着 Open 的公司,这一天起,正式闭源了。

[论文解读] 3m

→‘它有意识了吗?’:一位 Google 工程师和 LaMDA 的故事

Google 工程师 Blake Lemoine 公开声称对话模型 LaMDA‘有了意识’,随后被停职。模型当然没有意识,但这件事提出的真问题是:当 AI 足够像人,我们的判断力还可靠吗?

[深度思考] 2m

→‘基础模型’:斯坦福给这个时代起了个名字

斯坦福一份上百页的报告提出‘Foundation Models(基础模型)’这个词,定义一类‘大规模预训练、可适配到无数下游任务’的模型。命名,往往是一个范式成熟的标志。

[深度思考] 2m

→悟道 2.0:中国的 1.75 万亿参数,和一场规模竞赛

智源研究院发布悟道 2.0,号称 1.75 万亿参数,一举成为当时‘最大’的模型。规模竞赛进入万亿时代,但‘最大’和‘最有用’之间的距离,也越来越值得追问。

[深度思考] 1m

→‘随机鹦鹉’与一场解雇风波:大模型的另一面被摆上桌

Google 研究员 Timnit Gebru 因一篇质疑大语言模型的论文与公司冲突并离职。论文把大模型比作‘随机鹦鹉’——能拼接语言却不理解意义。技术狂欢之外,这是必须听见的声音。

[深度思考] 1m

→AlphaFold2:一个困扰生物学 50 年的问题,基本被解决了

CASP14 结果公布:DeepMind 的 AlphaFold2 预测蛋白质结构的精度,达到了实验方法的水平。组织者直接宣布:蛋白质折叠这个 50 年的大难题,在很大程度上被解决了。

[深度思考] 1m

→GPT-3:1750 亿参数,和一个叫‘提示词’的新交互方式

OpenAI 发布 1750 亿参数的 GPT-3。最震撼的不是参数,是 few-shot:不微调、不改一个权重,只在提示词里给几个例子,它就能上手新任务。人机交互的方式,可能要变了。

[论文解读] 1m

→微软十亿美元投 OpenAI:非营利的理想撞上算力的账单

微软向 OpenAI 投资 10 亿美元，成为其独家云服务商。OpenAI 也已悄然转为‘利润上限’公司。还记得 2015 年那个纯非营利的承诺吗？现实给它打了个折。

[深度思考] 1m

→AlphaFold 初露锋芒：AI 开始啃生物学的硬骨头

DeepMind 的 AlphaFold 在蛋白质结构预测竞赛 CASP13 上夺冠，且大幅领先。AlphaGo 退役后转向科学的承诺，开始兑现第一笔。

[深度思考] 1m

→AlphaZero：一套算法通吃围棋、国象、将棋

DeepMind 把 Zero 配方泛化：同一套算法、同一组超参数，从零自学围棋、国际象棋、将棋，分别在数小时内超越各自领域最强程序。通用性宣言。

[论文解读] 1m

→国务院发文：人工智能成了国家战略，时间表画到 2030

《新一代人工智能发展规划》发布：三步走，2030 年要做世界主要 AI 创新中心。一份政府文件，会怎样改变接下来十年的人才、资本和产业流向？

[深度思考] 1m

→乌镇三连胜后，AlphaGo 挂靴：一个时代三年就走完了

AlphaGo 3:0 战胜世界第一柯洁后宣布退役。柯洁中盘哭了，DeepMind 转身去做蛋白质和能源。这场人机故事的收尾，比开头还耐人寻味。

[深度思考] 1m

→Libratus 血洗德扑职业牌手：不完全信息博弈也失守了

CMU 的 Libratus 在 20 天 12 万手一对一无限注德扑中，以 177 万筹码的巨大优势击败四位顶尖职业牌手。虚张声势这件事，机器干得比人还好。

[论文解读] 1m

→阿西洛玛 23 条：AI 圈给自己立的第一部“家规”

上百位研究者在加州阿西洛玛开会，敲定 23 条 AI 原则，从研究目标到长期风险。比起内容，更有意思的是“谁在什么时候立了这个规矩”。

[深度思考] 1m

→4:1，第 37 手：AlphaGo 战胜李世石的一周

首尔五番棋，AlphaGo 4:1 战胜李世石。第二局的第 37 手让职业棋手集体沉默，第四局李世石的“神之一手”则赢回了人类唯一一盘。这一周值得写进教科书。

[深度思考] 1m

→OpenAI 成立：10 亿美元买一张“非营利”的 AGI 门票

马斯克、Altman 等人宣布成立非营利研究机构 OpenAI，承诺投入 10 亿美元，使命是“确保 AGI 造福全人类”，研究成果开放共享。

[深度思考] 1m

→IJCAI 上的公开信：研究者们想给自主武器踩刹车

上千名 AI 研究者在 IJCAI 发布公开信，呼吁禁止“无需人类干预即可选择并攻击目标”的自主武器。这是研究社区第一次集体对一种应用说不。

[深度思考] 1m

→马斯克、霍金都签了名：AI 安全第一次登上头条

Future of Life Institute 发布关于 AI 研究优先级的公开信，马斯克随手捐了 1000 万美元。AI 安全从科幻话题变成了正经研究方向。

[深度思考] 1m