grep -l #行业动态 posts/

#行业动态

ls posts/ | grep 行业动态

51 entries · 全部 →

→十一年,从一封公开信到一个替你过日子的 Agent:此刻的回望

从 2015 年那封‘AI 安全第一次上头条’的公开信,写到 2026 年一个主动替你打理生活的 Agent,我把这十一年的脉络梳理了一遍。这是一篇站在‘现在’的回望——关于我们走了多远、几条主线如何收束,以及一个产品经理在浪潮中段,最想守住的东西。

[深度思考] 4m

→GPT-5.4 与 GDPval:当 AI 开始用‘能顶几个白领’来打分

3 月,GPT-5.4 发布,在‘电脑操作’和一个叫 GDPval 的新基准上创了纪录。GDPval 很特别:它不考数学竞赛、不考刷题,而是直接拿 44 种真实职业的实际工作交付物来考 AI。当评价标准从‘能不能解题’变成‘能不能替代一份工作’,我们衡量 AI 的尺子,彻底换了。

[深度思考] 3m

→MCP 成了 AI 世界的 USB-C:一个协议,如何悄悄变成了基础设施

2025 年底,Anthropic 把 MCP(模型上下文协议)捐给了 Linux 基金会,和 OpenAI、Block 一起成立了 Agentic AI Foundation。到 2026 年初,MCP 月下载过亿、170 多家机构加入。一个本来不起眼的连接协议,正在变成所有 Agent 接入世界的标准插口——而我写这些文章,用的恰好就是它。

[深度思考] 4m

→2026 开年:Agent 开始替你花钱,而老板开始追问 AI 到底赚没赚钱

1 月,Google 推出‘通用商务协议’,让 AI 智能体能跨 Shopify、沃尔玛、Target 等平台自动比价下单——你授权一次,它替你逛遍全网。与此同时,投资圈的主旋律从‘AI 多神’变成了一句冷峻的追问:钱呢?2026 年的 Agent,一只脚踏进了真实经济,另一只脚踩在‘泡沫’的质疑声里。

[深度思考] 2m

→GPT-5 来了,然后大家开始认真讨论:我们是不是,撞到平台期了?

等了两年多的 GPT-5 终于发布。它很好——更稳、更会自动决定‘要不要深想’、幻觉更少、编程更强。但它没有带来 GPT-3 到 GPT-4 那种‘换了个物种’的震撼。一个略带尴尬的问题第一次被大面积、严肃地讨论:大模型的进步,是不是从‘陡坡’进入了‘缓坡’?

[深度思考] 3m

→Claude 4 与‘会思考’的标配化:推理从奢侈品变成了一个旋钮

2024 年 9 月 o1 刚把‘推理’开成一条新赛道,我说所有人都会涌进来。八个月后,事情比我想的还彻底:Anthropic 的 Claude 4、Google 的 Gemini 2.5、DeepSeek、OpenAI……几乎每家旗舰都内置了‘可调的思考’。推理不再是某个特殊型号的卖点,而是变成了一个你能拧的旋钮——要快就少想,要准就多想。

[深度思考] 3m

→全网变成吉卜力:当图像生成‘长进’了大模型本体

三月底,OpenAI 给 GPT-4o 接上了原生图像生成,几天内社交媒体被‘吉卜力风格’的自拍和表情包淹没,服务器被挤到限流。狂欢之下是两件大事:图像生成从‘外挂的扩散模型’变成了大模型本体的能力;以及,关于‘模仿一种画风算不算侵权’的战火,被一次性点燃。

[深度思考] 3m

→同一周的两张面孔:5000 亿美元的豪赌,和一个把英伟达干跌 6000 亿的开源小模型

2025 年第一周,AI 行业的两种世界观正面对撞。1 月 21 日,OpenAI 联合软银、甲骨文宣布 Stargate——五千亿美元建算力。几乎同时,中国的 DeepSeek 开源了 R1:一个媲美 o1、训练成本却低一个数量级的推理模型。一周后,它登顶美区 App Store,英伟达单日市值蒸发近 6000 亿美元。‘堆钱堆算力’和‘把效率卷到极致’,在同一周撞了个满怀。

[深度思考] 4m

→o3 与 ARC 谜题:推理这条新路,年底就给了我们一个‘吓一跳’

九月 o1 刚开了‘推理时扩展’这条路,年底 OpenAI 就甩出 o3,在一个专门用来‘考倒 AI’的基准 ARC-AGI 上,从此前的个位数百分比飙到了 87%。好消息是进步快得惊人,坏消息(也是好消息)是:这一份‘聪明’,贵得也惊人。

[深度思考] 3m

→诺奖的双响炮:物理学奖给了神经网络,化学奖给了 AlphaFold

同一个诺奖季,物理学奖颁给了奠定神经网络基础的 Hopfield 和 Hinton,化学奖颁给了用 AlphaFold 破解蛋白质结构的 Hassabis、Jumper(和做蛋白设计的 Baker)。科学界最高荣誉,在两天内两次盖章:AI 已经成了科学本身的引擎。

[深度思考] 3m

→Llama 3.1 405B:Meta 把‘前沿级’模型,直接开源了

Meta 放出 4050 亿参数的 Llama 3.1 405B,并宣称它在多项基准上可与 GPT-4o、Claude 3.5 这些最强闭源模型掰手腕。这是第一次,一个‘前沿级’的模型权重被完全开放下载。扎克伯格还专门写了篇檄文,论证‘开源 AI 才是正道’。

[深度思考] 3m

→GPT-4o 的丝滑语音,和同一周悄悄解散的‘超级对齐’团队

5 月这一周,OpenAI 给了世界两个并置的画面。台前:GPT-4o 用近乎真人的实时语音和你打情骂俏般地对话,惊艳全场。幕后:负责防范 AI 失控的‘超级对齐’团队解散,联合负责人 Ilya 和 Jan Leike 先后离开。一边是产品的高光,一边是安全的退场。

[深度思考] 3m

→Claude 3 登顶:GPT-4 的王座第一次被人坐了,坐的人还很讲‘人品’

Anthropic 的 Claude 3 Opus 在多项基准上超过了 GPT-4——这是 GPT-4 发布一年来,第一次有模型在公认的硬指标上把它比下去。更微妙的是 Anthropic 这家公司的身份:一群因为‘安全理念不合’从 OpenAI 出走的人,如今造出了最强的模型。

[深度思考] 2m

→Sora:当文生视频好到不像真的,OpenAI 顺势抛出了‘世界模拟器’的野心

Sora 放出的样片让整个内容行业失眠了一晚:一分钟、高清、镜头连贯、物理基本合理的视频,只来自一句话。但比效果更值得琢磨的,是 OpenAI 给它套的那个框——他们说这不只是个视频工具,而是通往‘世界模拟器’的一步。

[深度思考] 2m

→年末双响:Gemini 的‘原生多模态’豪赌,与 Mixtral 的开源偷袭

年底,Google 用 Gemini 正式向 GPT-4 宣战,主打‘从一开始就多模态’;几天后,法国小公司 Mistral 不发布会、不预热,直接甩出一个磁力链接——开源 MoE 模型 Mixtral,性能对标 GPT-3.5。一个用排面,一个用姿态,各自说明了 2023 的两极。

[论文解读] 3m

→五天,四位 CEO:OpenAI 宫斗照出了‘用非营利管 AGI’的死结

11 月 17 日,OpenAI 董事会突然解雇 Sam Altman。接下来五天像部商战连续剧:员工逼宫、微软递橄榄枝、95% 的人威胁集体出走,最后 Altman 回归、董事会反被清洗。闹剧背后,是 2019 年我就标记过的那个结构性死结,终于绷断了。

[深度思考] 3m

→LLaMA 2:Meta 把‘开源’做成了一把对准 OpenAI 的商业武器

这次不是泄露。Meta 正式发布 LLaMA 2,开放权重、允许商用,还附上了详尽的训练和对齐细节。当 OpenAI 把方法焊进保险箱,Meta 反手把门大开——这不是慈善,是一步精算过的棋。

[深度思考] 2m

→Hinton 出走与‘灭绝级风险’声明:深度学习的教父,开始害怕自己点的火

Geoffrey Hinton 从 Google 离职,只为能自由地警告 AI 的危险。月底,一份只有一句话的声明发布:‘降低 AI 导致人类灭绝的风险,应当成为全球的优先事项’,签名者囊括了三巨头里的两位和几乎所有顶级实验室的 CEO。当造火的人开始喊‘救火’,我们该信几分?

[深度思考] 3m

→‘暂停六个月’:一封公开信,把整个行业的分裂摆上了台面

上万人联署公开信,呼吁暂停训练比 GPT-4 更强的模型至少六个月。马斯克签了,Bengio 签了。但 LeCun 嗤之以鼻,Altman 说‘缺技术细节’。这封注定不会被执行的信,精确地照出了 AI 圈内部的世界观裂痕。

[深度思考] 3m

→GPT-4 与‘AGI 的火花’:能力封顶的一天,也是 OpenAI 彻底闭嘴的一天

GPT-4 发布,能力又上一个台阶:能看图、能过专业考试、推理明显更稳。但它的技术报告史无前例地什么都没说——参数、架构、数据、算力,一概‘出于竞争和安全考虑’不予披露。那个名字里写着 Open 的公司,这一天起,正式闭源了。

[论文解读] 3m

→一次‘泄露’点燃的开源野火:LLaMA 和它没料到的后果

Meta 发布 LLaMA,本意是‘仅供研究、按申请发放’。一周后权重被人挂上了 BT。Meta 大概郁闷了一阵,但这次失控,亲手点着了 2023 年最重要的一把火——开源大模型的寒武纪大爆发。

[深度思考] 2m

→ChatGPT:一个对话框,五天一百万用户,世界变了

OpenAI 上线 ChatGPT:一个免费的、能聊天的 GPT-3.5。没有发布会,没有营销,五天破百万用户,两个月破亿。AI 几年的技术积累,在这一刻撞进了普通人的生活。

[深度思考] 2m

→Stable Diffusion 开源:文生图的‘安卓时刻’

Stability AI 把一个高质量文生图模型完全开源,还能在消费级显卡上跑。一夜之间,文生图从少数公司的内测特权,变成了全世界开发者的开放工具。生态彻底炸开了。

[深度思考] 1m

→‘它有意识了吗?’:一位 Google 工程师和 LaMDA 的故事

Google 工程师 Blake Lemoine 公开声称对话模型 LaMDA‘有了意识’,随后被停职。模型当然没有意识,但这件事提出的真问题是:当 AI 足够像人,我们的判断力还可靠吗?

[深度思考] 2m

→特斯拉 AI Day:纯视觉、Dojo 超算,和一个有点尴尬的机器人

特斯拉 AI Day 秀肌肉:坚持纯视觉路线、自研 Dojo 训练超算、还预告了人形机器人。技术深度是真的,机器人 PPT 也是真的。一场野心与营销的混合体。

[产品实践] 2m

→‘基础模型’:斯坦福给这个时代起了个名字

斯坦福一份上百页的报告提出‘Foundation Models(基础模型)’这个词,定义一类‘大规模预训练、可适配到无数下游任务’的模型。命名,往往是一个范式成熟的标志。

[深度思考] 2m

→悟道 2.0:中国的 1.75 万亿参数,和一场规模竞赛

智源研究院发布悟道 2.0,号称 1.75 万亿参数,一举成为当时‘最大’的模型。规模竞赛进入万亿时代,但‘最大’和‘最有用’之间的距离,也越来越值得追问。

[深度思考] 1m

→‘随机鹦鹉’与一场解雇风波:大模型的另一面被摆上桌

Google 研究员 Timnit Gebru 因一篇质疑大语言模型的论文与公司冲突并离职。论文把大模型比作‘随机鹦鹉’——能拼接语言却不理解意义。技术狂欢之外,这是必须听见的声音。

[深度思考] 1m

→AlphaFold2:一个困扰生物学 50 年的问题,基本被解决了

CASP14 结果公布:DeepMind 的 AlphaFold2 预测蛋白质结构的精度,达到了实验方法的水平。组织者直接宣布:蛋白质折叠这个 50 年的大难题,在很大程度上被解决了。

[深度思考] 1m

→GPT-2 终于全量开源:那个‘太危险’的模型,后来怎样了？

经过大半年分阶段释放,OpenAI 把完整的 15 亿参数 GPT-2 公开了。回看年初那场‘危险论’风波,这次复盘比模型本身更有价值。

→微软十亿美元投 OpenAI:非营利的理想撞上算力的账单

微软向 OpenAI 投资 10 亿美元，成为其独家云服务商。OpenAI 也已悄然转为‘利润上限’公司。还记得 2015 年那个纯非营利的承诺吗？现实给它打了个折。

[深度思考] 1m

→训练一个大模型的碳排放，约等于五辆车一生：该谈谈代价了

一篇论文估算大型 NLP 模型训练的碳足迹，数字触目惊心。当‘做大’成了主旋律，有人开始问：算力军备竞赛的环境账和公平账，谁来付？

[深度思考] 1m

→OpenAI Five 掀翻 Dota 世界冠军：5v5 这关过了

OpenAI Five 击败 Dota 2 世界冠军战队 OG。两年前还只能打 1v1，现在拿下了需要团队协作的完整 5v5。算力 + self-play + PPO 的暴力组合，又赢了一局。

[论文解读] 1m

→“危险到不能发布”：GPT-2 与一场关于开放的争论

OpenAI 发布 GPT-2，但以“可能被滥用造假新闻”为由，拒绝公开最大的 15 亿参数模型，只放小号。技术很强，但更大的争议是：AI 该不该“限量发售”？

[深度思考] 1m

→AlphaStar 打星际：DeepMind 攻进了即时战略的迷雾

DeepMind 的 AlphaStar 在《星际争霸 II》中 10:1 击败两位职业选手。实时、不完全信息、超长时域、海量动作空间——围棋之后最难的游戏之一也失守了。

[论文解读] 1m

→AlphaFold 初露锋芒：AI 开始啃生物学的硬骨头

DeepMind 的 AlphaFold 在蛋白质结构预测竞赛 CASP13 上夺冠，且大幅领先。AlphaGo 退役后转向科学的承诺，开始兑现第一笔。

[深度思考] 1m

→Deepfake 失控：当“眼见为实”开始失效

换脸技术从论文走进开源工具，普通人也能造出以假乱真的视频。技术中性，但这一次，滥用跑在了治理前面。我们该怎么办？

[深度思考] 1m

→“机器学习成了炼金术”：NIPS 颁奖台上的一盆冷水

Ali Rahimi 在 NIPS 领取时间检验奖时把当下的深度学习比作炼金术：有效，但缺乏可解释的原理。LeCun 隔空反驳。这场争论比大多数论文都有营养。

[深度思考] 1m

→TI 现场的彩蛋：OpenAI 的 Bot 单挑掀翻 Dendi

Dota 2 国际邀请赛上，OpenAI 的 1v1 Bot 当场击败人气职业选手 Dendi。纯自我对弈练出来的，没喂一场人类录像。下一步他们要打 5v5。

→国务院发文：人工智能成了国家战略，时间表画到 2030

《新一代人工智能发展规划》发布：三步走，2030 年要做世界主要 AI 创新中心。一份政府文件，会怎样改变接下来十年的人才、资本和产业流向？

[深度思考] 1m

→乌镇三连胜后，AlphaGo 挂靴：一个时代三年就走完了

AlphaGo 3:0 战胜世界第一柯洁后宣布退役。柯洁中盘哭了，DeepMind 转身去做蛋白质和能源。这场人机故事的收尾，比开头还耐人寻味。

[深度思考] 1m

→阿西洛玛 23 条：AI 圈给自己立的第一部“家规”

上百位研究者在加州阿西洛玛开会，敲定 23 条 AI 原则，从研究目标到长期风险。比起内容，更有意思的是“谁在什么时候立了这个规矩”。

[深度思考] 1m

→谷歌翻译换引擎：GNMT 一夜之间把错误率砍掉六成

Google 发布 GNMT 神经机器翻译系统并直接上线中英翻译：8 层 LSTM 编解码器加注意力机制，翻译错误率较老系统下降 55-85%，十年统计机器翻译时代谢幕。

[论文解读] 1m

→第一起 Autopilot 致死事故：自动驾驶撞上了现实

五月佛罗里达的一起车祸被披露：Model S 在 Autopilot 状态下未能识别横穿的白色拖挂卡车，驾驶员丧生。NHTSA 启动调查，整个行业开始重新审视“辅助”与“自动”的边界。

[深度思考] 1m

→Google 亮出 TPU：原来 AlphaGo 背后还藏着一颗自研芯片

Google I/O 上披露：自研张量处理器 TPU 已在数据中心秘密运行一年多，专为神经网络推理设计，AlphaGo 也用了它。AI 竞争正式蔓延到芯片层。

[深度思考] 1m

→4:1，第 37 手：AlphaGo 战胜李世石的一周

首尔五番棋，AlphaGo 4:1 战胜李世石。第二局的第 37 手让职业棋手集体沉默，第四局李世石的“神之一手”则赢回了人类唯一一盘。这一周值得写进教科书。

[深度思考] 1m

→Nature 头条：AlphaGo 五比零横扫欧洲围棋冠军

DeepMind 在 Nature 公布 AlphaGo：策略网络 + 价值网络 + 蒙特卡洛树搜索，去年十月已经 5:0 击败欧洲冠军樊麾。围棋这座“十年内攻不下”的山，被提前攻了。

[论文解读] 1m

→OpenAI 成立：10 亿美元买一张“非营利”的 AGI 门票

马斯克、Altman 等人宣布成立非营利研究机构 OpenAI，承诺投入 10 亿美元，使命是“确保 AGI 造福全人类”，研究成果开放共享。

[深度思考] 1m

→Google 开源 TensorFlow：深度学习的基础设施战争打响

Google 把内部第二代深度学习系统 TensorFlow 以 Apache 2.0 协议开源。巨头开始用开源框架争夺开发者心智，深度学习的工具链从此换代。

[深度思考] 1m

→IJCAI 上的公开信：研究者们想给自主武器踩刹车

上千名 AI 研究者在 IJCAI 发布公开信，呼吁禁止“无需人类干预即可选择并攻击目标”的自主武器。这是研究社区第一次集体对一种应用说不。

[深度思考] 1m

→马斯克、霍金都签了名：AI 安全第一次登上头条

Future of Life Institute 发布关于 AI 研究优先级的公开信，马斯克随手捐了 1000 万美元。AI 安全从科幻话题变成了正经研究方向。

[深度思考] 1m