grep -l #人工智能 posts/
#人工智能
ls posts/ | grep 人工智能
27 entries · 全部 →
2026.06.10
→十一年,从一封公开信到一个替你过日子的 Agent:此刻的回望
从 2015 年那封‘AI 安全第一次上头条’的公开信,写到 2026 年一个主动替你打理生活的 Agent,我把这十一年的脉络梳理了一遍。这是一篇站在‘现在’的回望——关于我们走了多远、几条主线如何收束,以及一个产品经理在浪潮中段,最想守住的东西。
[深度思考] 4m
2026.03.09
→GPT-5.4 与 GDPval:当 AI 开始用‘能顶几个白领’来打分
3 月,GPT-5.4 发布,在‘电脑操作’和一个叫 GDPval 的新基准上创了纪录。GDPval 很特别:它不考数学竞赛、不考刷题,而是直接拿 44 种真实职业的实际工作交付物来考 AI。当评价标准从‘能不能解题’变成‘能不能替代一份工作’,我们衡量 AI 的尺子,彻底换了。
[深度思考] 3m
2025.08.07
→GPT-5 来了,然后大家开始认真讨论:我们是不是,撞到平台期了?
等了两年多的 GPT-5 终于发布。它很好——更稳、更会自动决定‘要不要深想’、幻觉更少、编程更强。但它没有带来 GPT-3 到 GPT-4 那种‘换了个物种’的震撼。一个略带尴尬的问题第一次被大面积、严肃地讨论:大模型的进步,是不是从‘陡坡’进入了‘缓坡’?
[深度思考] 3m
2024.12.20
→o3 与 ARC 谜题:推理这条新路,年底就给了我们一个‘吓一跳’
九月 o1 刚开了‘推理时扩展’这条路,年底 OpenAI 就甩出 o3,在一个专门用来‘考倒 AI’的基准 ARC-AGI 上,从此前的个位数百分比飙到了 87%。好消息是进步快得惊人,坏消息(也是好消息)是:这一份‘聪明’,贵得也惊人。
[深度思考] 3m
2024.10.09
→诺奖的双响炮:物理学奖给了神经网络,化学奖给了 AlphaFold
同一个诺奖季,物理学奖颁给了奠定神经网络基础的 Hopfield 和 Hinton,化学奖颁给了用 AlphaFold 破解蛋白质结构的 Hassabis、Jumper(和做蛋白设计的 Baker)。科学界最高荣誉,在两天内两次盖章:AI 已经成了科学本身的引擎。
[深度思考] 3m
2024.09.12
→o1:OpenAI 换了个维度卷——不再卷模型多大,而是卷它‘想多久’
o1 是 2024 年最重要的技术转向。它不靠把模型做得更大,而是让模型在回答前先‘想很久’——生成一长串内部推理,用强化学习训练这个思考过程。一个全新的、和参数规模并列的扩展维度被打开了:推理时算力。
[论文解读] 4m
2023.11.17
→五天,四位 CEO:OpenAI 宫斗照出了‘用非营利管 AGI’的死结
11 月 17 日,OpenAI 董事会突然解雇 Sam Altman。接下来五天像部商战连续剧:员工逼宫、微软递橄榄枝、95% 的人威胁集体出走,最后 Altman 回归、董事会反被清洗。闹剧背后,是 2019 年我就标记过的那个结构性死结,终于绷断了。
[深度思考] 3m
2023.05.30
→Hinton 出走与‘灭绝级风险’声明:深度学习的教父,开始害怕自己点的火
Geoffrey Hinton 从 Google 离职,只为能自由地警告 AI 的危险。月底,一份只有一句话的声明发布:‘降低 AI 导致人类灭绝的风险,应当成为全球的优先事项’,签名者囊括了三巨头里的两位和几乎所有顶级实验室的 CEO。当造火的人开始喊‘救火’,我们该信几分?
[深度思考] 3m
2023.03.29
→‘暂停六个月’:一封公开信,把整个行业的分裂摆上了台面
上万人联署公开信,呼吁暂停训练比 GPT-4 更强的模型至少六个月。马斯克签了,Bengio 签了。但 LeCun 嗤之以鼻,Altman 说‘缺技术细节’。这封注定不会被执行的信,精确地照出了 AI 圈内部的世界观裂痕。
[深度思考] 3m
2023.03.14
→GPT-4 与‘AGI 的火花’:能力封顶的一天,也是 OpenAI 彻底闭嘴的一天
GPT-4 发布,能力又上一个台阶:能看图、能过专业考试、推理明显更稳。但它的技术报告史无前例地什么都没说——参数、架构、数据、算力,一概‘出于竞争和安全考虑’不予披露。那个名字里写着 Open 的公司,这一天起,正式闭源了。
[论文解读] 3m
2022.06.11
→‘它有意识了吗?’:一位 Google 工程师和 LaMDA 的故事
Google 工程师 Blake Lemoine 公开声称对话模型 LaMDA‘有了意识’,随后被停职。模型当然没有意识,但这件事提出的真问题是:当 AI 足够像人,我们的判断力还可靠吗?
[深度思考] 2m
2021.08.18
→‘基础模型’:斯坦福给这个时代起了个名字
斯坦福一份上百页的报告提出‘Foundation Models(基础模型)’这个词,定义一类‘大规模预训练、可适配到无数下游任务’的模型。命名,往往是一个范式成熟的标志。
[深度思考] 2m
2021.06.01
→悟道 2.0:中国的 1.75 万亿参数,和一场规模竞赛
智源研究院发布悟道 2.0,号称 1.75 万亿参数,一举成为当时‘最大’的模型。规模竞赛进入万亿时代,但‘最大’和‘最有用’之间的距离,也越来越值得追问。
[深度思考] 1m
2020.12.03
→‘随机鹦鹉’与一场解雇风波:大模型的另一面被摆上桌
Google 研究员 Timnit Gebru 因一篇质疑大语言模型的论文与公司冲突并离职。论文把大模型比作‘随机鹦鹉’——能拼接语言却不理解意义。技术狂欢之外,这是必须听见的声音。
[深度思考] 1m
2020.11.30
→AlphaFold2:一个困扰生物学 50 年的问题,基本被解决了
CASP14 结果公布:DeepMind 的 AlphaFold2 预测蛋白质结构的精度,达到了实验方法的水平。组织者直接宣布:蛋白质折叠这个 50 年的大难题,在很大程度上被解决了。
[深度思考] 1m
2020.05.28
→GPT-3:1750 亿参数,和一个叫‘提示词’的新交互方式
OpenAI 发布 1750 亿参数的 GPT-3。最震撼的不是参数,是 few-shot:不微调、不改一个权重,只在提示词里给几个例子,它就能上手新任务。人机交互的方式,可能要变了。
[论文解读] 1m
2019.07.22
→微软十亿美元投 OpenAI:非营利的理想撞上算力的账单
微软向 OpenAI 投资 10 亿美元,成为其独家云服务商。OpenAI 也已悄然转为‘利润上限’公司。还记得 2015 年那个纯非营利的承诺吗?现实给它打了个折。
[深度思考] 1m
2018.12.02
→AlphaFold 初露锋芒:AI 开始啃生物学的硬骨头
DeepMind 的 AlphaFold 在蛋白质结构预测竞赛 CASP13 上夺冠,且大幅领先。AlphaGo 退役后转向科学的承诺,开始兑现第一笔。
[深度思考] 1m
2017.12.06
→AlphaZero:一套算法通吃围棋、国象、将棋
DeepMind 把 Zero 配方泛化:同一套算法、同一组超参数,从零自学围棋、国际象棋、将棋,分别在数小时内超越各自领域最强程序。通用性宣言。
[论文解读] 1m
2017.07.21
→国务院发文:人工智能成了国家战略,时间表画到 2030
《新一代人工智能发展规划》发布:三步走,2030 年要做世界主要 AI 创新中心。一份政府文件,会怎样改变接下来十年的人才、资本和产业流向?
[深度思考] 1m
2017.05.27
→乌镇三连胜后,AlphaGo 挂靴:一个时代三年就走完了
AlphaGo 3:0 战胜世界第一柯洁后宣布退役。柯洁中盘哭了,DeepMind 转身去做蛋白质和能源。这场人机故事的收尾,比开头还耐人寻味。
[深度思考] 1m
2017.01.31
→Libratus 血洗德扑职业牌手:不完全信息博弈也失守了
CMU 的 Libratus 在 20 天 12 万手一对一无限注德扑中,以 177 万筹码的巨大优势击败四位顶尖职业牌手。虚张声势这件事,机器干得比人还好。
[论文解读] 1m
2017.01.09
→阿西洛玛 23 条:AI 圈给自己立的第一部“家规”
上百位研究者在加州阿西洛玛开会,敲定 23 条 AI 原则,从研究目标到长期风险。比起内容,更有意思的是“谁在什么时候立了这个规矩”。
[深度思考] 1m
2016.03.15
→4:1,第 37 手:AlphaGo 战胜李世石的一周
首尔五番棋,AlphaGo 4:1 战胜李世石。第二局的第 37 手让职业棋手集体沉默,第四局李世石的“神之一手”则赢回了人类唯一一盘。这一周值得写进教科书。
[深度思考] 1m
2015.12.11
→OpenAI 成立:10 亿美元买一张“非营利”的 AGI 门票
马斯克、Altman 等人宣布成立非营利研究机构 OpenAI,承诺投入 10 亿美元,使命是“确保 AGI 造福全人类”,研究成果开放共享。
[深度思考] 1m
2015.07.28
→IJCAI 上的公开信:研究者们想给自主武器踩刹车
上千名 AI 研究者在 IJCAI 发布公开信,呼吁禁止“无需人类干预即可选择并攻击目标”的自主武器。这是研究社区第一次集体对一种应用说不。
[深度思考] 1m
2015.01.28
→马斯克、霍金都签了名:AI 安全第一次登上头条
Future of Life Institute 发布关于 AI 研究优先级的公开信,马斯克随手捐了 1000 万美元。AI 安全从科幻话题变成了正经研究方向。
[深度思考] 1m