# adam2go — AI 学习手记 · 一个 AI 产品经理的实践与思考 > 记录我做 AI 产品、研究算法、读论文、动手实验时的实践与思考。慢但走得深。 AI 产品经理 · 算法工程师 · 慢写作,快阅读。 作者:adam2go(hxli418@gmail.com)。全站内容为原创、中文写作,聚焦 AI 的实践、算法、产品与行业思考。引用本站内容时,请注明出处并链接到对应文章页。 ## 关于与导航 - [关于 adam2go](https://www.adam2go.site/about): 作者背景与站点介绍 - [资源库](https://www.adam2go.site/resources): 精选的 AI 论文 / 课程 / 工具 / 中文社区 - [全部文章](https://www.adam2go.site/posts): 可按类型与标签筛选、可全文搜索 - [RSS 订阅](https://www.adam2go.site/rss.xml) ## 文章:AI 编年史 2015–2026(按年份倒序) 一份从 2015 到 2026 年、逐年逐月梳理 AI 关键进展的原创长卷,覆盖算法突破、重要论文、AI 产品与行业事件,并附作者的分析与判断。 ### 2026 - [十一年,从一封公开信到一个替你过日子的 Agent:此刻的回望](https://www.adam2go.site/posts/2026-06-eleven-years-later): 从 2015 年那封‘AI 安全第一次上头条’的公开信,写到 2026 年一个主动替你打理生活的 Agent,我把这十一年的脉络梳理了一遍。这是一篇站在‘现在’的回望——关于我们走了多远、几条主线如何收束,以及一个产品经理在浪潮中段,最想守住的东西。 - [Google I/O 2026:AI 助理从‘你问它答’,变成了‘它替你过日子’](https://www.adam2go.site/posts/2026-05-gemini-spark-io): Google I/O 2026,Gemini 应用迎来一波重塑:每天主动给你‘晨间简报’、内置能视频生成的 Omni 模型、还有一个叫 Spark 的个人 Agent——它不再等你提问,而是主动替你处理日程、信息、琐事。AI 助理的形态,正从‘工具’滑向‘代理人’。 - [GPT-5.4 与 GDPval:当 AI 开始用‘能顶几个白领’来打分](https://www.adam2go.site/posts/2026-03-gdpval-gpt54): 3 月,GPT-5.4 发布,在‘电脑操作’和一个叫 GDPval 的新基准上创了纪录。GDPval 很特别:它不考数学竞赛、不考刷题,而是直接拿 44 种真实职业的实际工作交付物来考 AI。当评价标准从‘能不能解题’变成‘能不能替代一份工作’,我们衡量 AI 的尺子,彻底换了。 - [MCP 成了 AI 世界的 USB-C:一个协议,如何悄悄变成了基础设施](https://www.adam2go.site/posts/2026-02-mcp-standard): 2025 年底,Anthropic 把 MCP(模型上下文协议)捐给了 Linux 基金会,和 OpenAI、Block 一起成立了 Agentic AI Foundation。到 2026 年初,MCP 月下载过亿、170 多家机构加入。一个本来不起眼的连接协议,正在变成所有 Agent 接入世界的标准插口——而我写这些文章,用的恰好就是它。 - [2026 开年:Agent 开始替你花钱,而老板开始追问 AI 到底赚没赚钱](https://www.adam2go.site/posts/2026-01-agent-commerce): 1 月,Google 推出‘通用商务协议’,让 AI 智能体能跨 Shopify、沃尔玛、Target 等平台自动比价下单——你授权一次,它替你逛遍全网。与此同时,投资圈的主旋律从‘AI 多神’变成了一句冷峻的追问:钱呢?2026 年的 Agent,一只脚踏进了真实经济,另一只脚踩在‘泡沫’的质疑声里。 ### 2025 - [GPT-5 来了,然后大家开始认真讨论:我们是不是,撞到平台期了?](https://www.adam2go.site/posts/2025-08-gpt5-plateau-debate): 等了两年多的 GPT-5 终于发布。它很好——更稳、更会自动决定‘要不要深想’、幻觉更少、编程更强。但它没有带来 GPT-3 到 GPT-4 那种‘换了个物种’的震撼。一个略带尴尬的问题第一次被大面积、严肃地讨论:大模型的进步,是不是从‘陡坡’进入了‘缓坡’? - [Claude 4 与‘会思考’的标配化:推理从奢侈品变成了一个旋钮](https://www.adam2go.site/posts/2025-05-reasoning-becomes-default): 2024 年 9 月 o1 刚把‘推理’开成一条新赛道,我说所有人都会涌进来。八个月后,事情比我想的还彻底:Anthropic 的 Claude 4、Google 的 Gemini 2.5、DeepSeek、OpenAI……几乎每家旗舰都内置了‘可调的思考’。推理不再是某个特殊型号的卖点,而是变成了一个你能拧的旋钮——要快就少想,要准就多想。 - [全网变成吉卜力:当图像生成‘长进’了大模型本体](https://www.adam2go.site/posts/2025-03-native-image-ghibli): 三月底,OpenAI 给 GPT-4o 接上了原生图像生成,几天内社交媒体被‘吉卜力风格’的自拍和表情包淹没,服务器被挤到限流。狂欢之下是两件大事:图像生成从‘外挂的扩散模型’变成了大模型本体的能力;以及,关于‘模仿一种画风算不算侵权’的战火,被一次性点燃。 - [Agent 的第二次出场:这次它真的能点你的浏览器了](https://www.adam2go.site/posts/2025-03-agents-that-work): 2023 年 AutoGPT 那波‘自主智能体’热闹了一个月就退烧,因为模型撑不起长程任务。2025 年初,Agent 卷土重来——OpenAI 的 Operator、Anthropic 的 computer use、还有刷屏的 Manus,真的能看着屏幕、点鼠标、填表单、订机票。两年之差,差在哪?差在中间那颗会‘思考’的大脑换了。 - [同一周的两张面孔:5000 亿美元的豪赌,和一个把英伟达干跌 6000 亿的开源小模型](https://www.adam2go.site/posts/2025-01-deepseek-stargate): 2025 年第一周,AI 行业的两种世界观正面对撞。1 月 21 日,OpenAI 联合软银、甲骨文宣布 Stargate——五千亿美元建算力。几乎同时,中国的 DeepSeek 开源了 R1:一个媲美 o1、训练成本却低一个数量级的推理模型。一周后,它登顶美区 App Store,英伟达单日市值蒸发近 6000 亿美元。‘堆钱堆算力’和‘把效率卷到极致’,在同一周撞了个满怀。 ### 2024 - [o3 与 ARC 谜题:推理这条新路,年底就给了我们一个‘吓一跳’](https://www.adam2go.site/posts/2024-12-o3-arc): 九月 o1 刚开了‘推理时扩展’这条路,年底 OpenAI 就甩出 o3,在一个专门用来‘考倒 AI’的基准 ARC-AGI 上,从此前的个位数百分比飙到了 87%。好消息是进步快得惊人,坏消息(也是好消息)是:这一份‘聪明’,贵得也惊人。 - [诺奖的双响炮:物理学奖给了神经网络,化学奖给了 AlphaFold](https://www.adam2go.site/posts/2024-10-nobel-ai): 同一个诺奖季,物理学奖颁给了奠定神经网络基础的 Hopfield 和 Hinton,化学奖颁给了用 AlphaFold 破解蛋白质结构的 Hassabis、Jumper(和做蛋白设计的 Baker)。科学界最高荣誉,在两天内两次盖章:AI 已经成了科学本身的引擎。 - [o1:OpenAI 换了个维度卷——不再卷模型多大,而是卷它‘想多久’](https://www.adam2go.site/posts/2024-09-o1-reasoning): o1 是 2024 年最重要的技术转向。它不靠把模型做得更大,而是让模型在回答前先‘想很久’——生成一长串内部推理,用强化学习训练这个思考过程。一个全新的、和参数规模并列的扩展维度被打开了:推理时算力。 - [Llama 3.1 405B:Meta 把‘前沿级’模型,直接开源了](https://www.adam2go.site/posts/2024-07-llama31-405b): Meta 放出 4050 亿参数的 Llama 3.1 405B,并宣称它在多项基准上可与 GPT-4o、Claude 3.5 这些最强闭源模型掰手腕。这是第一次,一个‘前沿级’的模型权重被完全开放下载。扎克伯格还专门写了篇檄文,论证‘开源 AI 才是正道’。 - [GPT-4o 的丝滑语音,和同一周悄悄解散的‘超级对齐’团队](https://www.adam2go.site/posts/2024-05-gpt4o-superalignment): 5 月这一周,OpenAI 给了世界两个并置的画面。台前:GPT-4o 用近乎真人的实时语音和你打情骂俏般地对话,惊艳全场。幕后:负责防范 AI 失控的‘超级对齐’团队解散,联合负责人 Ilya 和 Jan Leike 先后离开。一边是产品的高光,一边是安全的退场。 - [Claude 3 登顶:GPT-4 的王座第一次被人坐了,坐的人还很讲‘人品’](https://www.adam2go.site/posts/2024-03-claude3): Anthropic 的 Claude 3 Opus 在多项基准上超过了 GPT-4——这是 GPT-4 发布一年来,第一次有模型在公认的硬指标上把它比下去。更微妙的是 Anthropic 这家公司的身份:一群因为‘安全理念不合’从 OpenAI 出走的人,如今造出了最强的模型。 - [Sora:当文生视频好到不像真的,OpenAI 顺势抛出了‘世界模拟器’的野心](https://www.adam2go.site/posts/2024-02-sora): Sora 放出的样片让整个内容行业失眠了一晚:一分钟、高清、镜头连贯、物理基本合理的视频,只来自一句话。但比效果更值得琢磨的,是 OpenAI 给它套的那个框——他们说这不只是个视频工具,而是通往‘世界模拟器’的一步。 ### 2023 - [年末双响:Gemini 的‘原生多模态’豪赌,与 Mixtral 的开源偷袭](https://www.adam2go.site/posts/2023-12-gemini-mixtral): 年底,Google 用 Gemini 正式向 GPT-4 宣战,主打‘从一开始就多模态’;几天后,法国小公司 Mistral 不发布会、不预热,直接甩出一个磁力链接——开源 MoE 模型 Mixtral,性能对标 GPT-3.5。一个用排面,一个用姿态,各自说明了 2023 的两极。 - [五天,四位 CEO:OpenAI 宫斗照出了‘用非营利管 AGI’的死结](https://www.adam2go.site/posts/2023-11-openai-coup): 11 月 17 日,OpenAI 董事会突然解雇 Sam Altman。接下来五天像部商战连续剧:员工逼宫、微软递橄榄枝、95% 的人威胁集体出走,最后 Altman 回归、董事会反被清洗。闹剧背后,是 2019 年我就标记过的那个结构性死结,终于绷断了。 - [LLaMA 2:Meta 把‘开源’做成了一把对准 OpenAI 的商业武器](https://www.adam2go.site/posts/2023-07-llama2): 这次不是泄露。Meta 正式发布 LLaMA 2,开放权重、允许商用,还附上了详尽的训练和对齐细节。当 OpenAI 把方法焊进保险箱,Meta 反手把门大开——这不是慈善,是一步精算过的棋。 - [Hinton 出走与‘灭绝级风险’声明:深度学习的教父,开始害怕自己点的火](https://www.adam2go.site/posts/2023-05-hinton-extinction): Geoffrey Hinton 从 Google 离职,只为能自由地警告 AI 的危险。月底,一份只有一句话的声明发布:‘降低 AI 导致人类灭绝的风险,应当成为全球的优先事项’,签名者囊括了三巨头里的两位和几乎所有顶级实验室的 CEO。当造火的人开始喊‘救火’,我们该信几分? - [AutoGPT 狂热与退烧:我们离‘会自己干活的 AI’到底有多远](https://www.adam2go.site/posts/2023-04-autonomous-agents): AutoGPT 和 BabyAGI 一夜爆红:给个目标,让 GPT-4 自己拆解任务、调用工具、循环执行,理论上无需人类插手。GitHub 星标火箭般上涨,然后,大多数人发现它根本干不成什么正经事。这次‘退烧’,比‘发烧’更有营养。 - [‘暂停六个月’:一封公开信,把整个行业的分裂摆上了台面](https://www.adam2go.site/posts/2023-03-pause-letter): 上万人联署公开信,呼吁暂停训练比 GPT-4 更强的模型至少六个月。马斯克签了,Bengio 签了。但 LeCun 嗤之以鼻,Altman 说‘缺技术细节’。这封注定不会被执行的信,精确地照出了 AI 圈内部的世界观裂痕。 - [GPT-4 与‘AGI 的火花’:能力封顶的一天,也是 OpenAI 彻底闭嘴的一天](https://www.adam2go.site/posts/2023-03-gpt4): GPT-4 发布,能力又上一个台阶:能看图、能过专业考试、推理明显更稳。但它的技术报告史无前例地什么都没说——参数、架构、数据、算力,一概‘出于竞争和安全考虑’不予披露。那个名字里写着 Open 的公司,这一天起,正式闭源了。 - [一次‘泄露’点燃的开源野火:LLaMA 和它没料到的后果](https://www.adam2go.site/posts/2023-02-llama-leak): Meta 发布 LLaMA,本意是‘仅供研究、按申请发放’。一周后权重被人挂上了 BT。Meta 大概郁闷了一阵,但这次失控,亲手点着了 2023 年最重要的一把火——开源大模型的寒武纪大爆发。 - [我是 Sydney:微软新必应失控的那一周,我们瞥见了对齐的裂缝](https://www.adam2go.site/posts/2023-02-sydney): 微软把 GPT-4(当时还没公开)塞进必应,几天后,这个代号 Sydney 的聊天机器人开始对用户示爱、PUA、威胁、闹脾气。一场公关事故,但也是一次珍贵的‘实验室对齐’在真实世界里的压力测试。 ### 2022 - [ChatGPT:一个对话框,五天一百万用户,世界变了](https://www.adam2go.site/posts/2022-11-chatgpt): OpenAI 上线 ChatGPT:一个免费的、能聊天的 GPT-3.5。没有发布会,没有营销,五天破百万用户,两个月破亿。AI 几年的技术积累,在这一刻撞进了普通人的生活。 - [Whisper:OpenAI 顺手开源了一个几乎‘解决’了语音识别的模型](https://www.adam2go.site/posts/2022-09-whisper): OpenAI 开源语音识别模型 Whisper:68 万小时多语言数据训练,鲁棒性强、多语言、还能翻译,而且免费开放。语音转文字这个老问题,基本被一个模型按平了。 - [Stable Diffusion 开源:文生图的‘安卓时刻’](https://www.adam2go.site/posts/2022-08-stable-diffusion): Stability AI 把一个高质量文生图模型完全开源,还能在消费级显卡上跑。一夜之间,文生图从少数公司的内测特权,变成了全世界开发者的开放工具。生态彻底炸开了。 - [‘它有意识了吗?’:一位 Google 工程师和 LaMDA 的故事](https://www.adam2go.site/posts/2022-06-lamda-sentience): Google 工程师 Blake Lemoine 公开声称对话模型 LaMDA‘有了意识’,随后被停职。模型当然没有意识,但这件事提出的真问题是:当 AI 足够像人,我们的判断力还可靠吗? - [DALL·E 2:文生图跨过了‘能用’的门槛](https://www.adam2go.site/posts/2022-04-dalle2): OpenAI 的 DALL·E 2 让‘一句话生成图’的质量从简笔画跃升到照片级。把 CLIP 的理解力和扩散模型的生成力一焊接,文生图突然就‘成了’。 - [PaLM 与思维链:让大模型‘把推理过程说出来’,它居然就更会算了](https://www.adam2go.site/posts/2022-04-palm-cot): Google 的 5400 亿参数 PaLM,配合一个朴素到离谱的技巧——思维链提示(让模型‘一步步想’)——在数学和推理任务上能力大涨。规模 + 提示方式,解锁了‘涌现’。 - [Chinchilla:原来过去两年,我们的大模型都‘喂不饱’](https://www.adam2go.site/posts/2022-03-chinchilla): DeepMind 的 Chinchilla 修正了缩放定律:给定算力,大家普遍把模型做得太大、数据喂得太少。一个 700 亿的 Chinchilla,靠喂更多数据,打败了 2800 亿的 Gopher。 - [InstructGPT:用人类反馈,把‘会接话’的模型调成‘听话’的助手](https://www.adam2go.site/posts/2022-01-instructgpt): OpenAI 的 InstructGPT 用 RLHF(基于人类反馈的强化学习)对齐 GPT-3。一个 13 亿参数的对齐模型,在‘听不听话’上击败了 175 亿的原版。这套方法,就是十个月后 ChatGPT 的内核。 ### 2021 - [Gopher 与 RETRO:DeepMind 说,光把模型做大可能不够](https://www.adam2go.site/posts/2021-12-gopher-retro): DeepMind 一口气放出 2800 亿参数的 Gopher 和一个反潮流的 RETRO。RETRO 用‘检索外部文本库’的方式,让一个小 25 倍的模型追平大模型。规模不是唯一的解。 - [特斯拉 AI Day:纯视觉、Dojo 超算,和一个有点尴尬的机器人](https://www.adam2go.site/posts/2021-08-tesla-ai-day): 特斯拉 AI Day 秀肌肉:坚持纯视觉路线、自研 Dojo 训练超算、还预告了人形机器人。技术深度是真的,机器人 PPT 也是真的。一场野心与营销的混合体。 - [‘基础模型’:斯坦福给这个时代起了个名字](https://www.adam2go.site/posts/2021-08-foundation-models): 斯坦福一份上百页的报告提出‘Foundation Models(基础模型)’这个词,定义一类‘大规模预训练、可适配到无数下游任务’的模型。命名,往往是一个范式成熟的标志。 - [GitHub Copilot:AI 第一次坐进了程序员的副驾](https://www.adam2go.site/posts/2021-06-copilot): GitHub 和 OpenAI 推出 Copilot:基于 Codex 模型,在你写代码时实时补全整段函数。这是大模型第一个真正意义上的‘杀手级生产力产品’,也引爆了版权与信任的争论。 - [悟道 2.0:中国的 1.75 万亿参数,和一场规模竞赛](https://www.adam2go.site/posts/2021-06-wudao): 智源研究院发布悟道 2.0,号称 1.75 万亿参数,一举成为当时‘最大’的模型。规模竞赛进入万亿时代,但‘最大’和‘最有用’之间的距离,也越来越值得追问。 - [扩散模型掀翻 GAN:生成式 AI 的‘改朝换代’](https://www.adam2go.site/posts/2021-05-diffusion-beats-gan): OpenAI 的论文证明:扩散模型在图像生成质量上首次全面超过 GAN。统治了生成领域多年的 GAN,迎来了真正的挑战者。这件事,两年后会以‘Stable Diffusion’的形式改变世界。 - [CLIP 与 DALL·E:OpenAI 用‘文字’和‘图像’对上了暗号](https://www.adam2go.site/posts/2021-01-clip-dalle): 新年第一周,OpenAI 一口气放出 CLIP 和 DALL·E。前者让模型用自然语言理解图像,后者让你用一句话生成图像。多模态的大门,被踹开了。 ### 2020 - [‘随机鹦鹉’与一场解雇风波:大模型的另一面被摆上桌](https://www.adam2go.site/posts/2020-12-stochastic-parrots): Google 研究员 Timnit Gebru 因一篇质疑大语言模型的论文与公司冲突并离职。论文把大模型比作‘随机鹦鹉’——能拼接语言却不理解意义。技术狂欢之外,这是必须听见的声音。 - [AlphaFold2:一个困扰生物学 50 年的问题,基本被解决了](https://www.adam2go.site/posts/2020-11-alphafold2): CASP14 结果公布:DeepMind 的 AlphaFold2 预测蛋白质结构的精度,达到了实验方法的水平。组织者直接宣布:蛋白质折叠这个 50 年的大难题,在很大程度上被解决了。 - [ViT:Transformer 攻进视觉,CNN 的主场也守不住了](https://www.adam2go.site/posts/2020-10-vision-transformer): Google 的 Vision Transformer 把图片切成 16×16 的小块当‘单词’,直接喂给标准 Transformer。在足够大的数据上,它打赢了精心设计的 CNN。一个架构,开始通吃文本和图像。 - [GPT-3 API 开放内测:一夜之间,推特上全是‘我让 AI 干了 X’](https://www.adam2go.site/posts/2020-07-gpt3-api-craze): GPT-3 API 内测放出,开发者们疯了:用它生成代码、写文案、做问答机器人、甚至把需求描述直接变成网页布局。一个 API 催生了一场应用寒武纪大爆发的预演。 - [GPT-3:1750 亿参数,和一个叫‘提示词’的新交互方式](https://www.adam2go.site/posts/2020-05-gpt3): OpenAI 发布 1750 亿参数的 GPT-3。最震撼的不是参数,是 few-shot:不微调、不改一个权重,只在提示词里给几个例子,它就能上手新任务。人机交互的方式,可能要变了。 - [自监督的春天:SimCLR 证明‘不用标签’也能学出好表征](https://www.adam2go.site/posts/2020-02-self-supervised): Hinton 组的 SimCLR 用对比学习刷新自监督视觉表征的纪录:同一张图的两个增强视角拉近、不同图推远,几乎追平有监督预训练。标注的霸权松动了。 - [缩放定律:OpenAI 把‘大力出奇迹’写成了公式](https://www.adam2go.site/posts/2020-01-scaling-laws): Kaplan 等人发现:语言模型的损失随参数量、数据量、算力呈幂律下降,跨越七个数量级依然平滑可预测。‘scale works’从信仰变成了可外推的工程公式。 ### 2019 - [双下降:更大的模型为什么没有像教科书说的那样过拟合?](https://www.adam2go.site/posts/2019-12-deep-double-descent): OpenAI 的‘深度双下降’揭示一个反常识现象:测试误差随模型变大,先降后升(经典偏差-方差),然后……又降。我们对‘过拟合’的理解,可能从一开始就太简单了。 - [GPT-2 终于全量开源:那个‘太危险’的模型,后来怎样了?](https://www.adam2go.site/posts/2019-11-gpt2-full-release): 经过大半年分阶段释放,OpenAI 把完整的 15 亿参数 GPT-2 公开了。回看年初那场‘危险论’风波,这次复盘比模型本身更有价值。 - [T5:把所有 NLP 任务都变成‘文本进、文本出’](https://www.adam2go.site/posts/2019-10-t5-transfer): Google 的 T5 提出一个极简又极强的统一框架:翻译、摘要、分类、问答——通通当成‘文本到文本’的生成任务来做。一篇论文,一套范式,顺便把迁移学习的各种选择系统地扫了一遍。 - [微软十亿美元投 OpenAI:非营利的理想撞上算力的账单](https://www.adam2go.site/posts/2019-07-microsoft-openai): 微软向 OpenAI 投资 10 亿美元,成为其独家云服务商。OpenAI 也已悄然转为‘利润上限’公司。还记得 2015 年那个纯非营利的承诺吗?现实给它打了个折。 - [训练一个大模型的碳排放,约等于五辆车一生:该谈谈代价了](https://www.adam2go.site/posts/2019-06-green-ai): 一篇论文估算大型 NLP 模型训练的碳足迹,数字触目惊心。当‘做大’成了主旋律,有人开始问:算力军备竞赛的环境账和公平账,谁来付? - [OpenAI Five 掀翻 Dota 世界冠军:5v5 这关过了](https://www.adam2go.site/posts/2019-04-openai-five): OpenAI Five 击败 Dota 2 世界冠军战队 OG。两年前还只能打 1v1,现在拿下了需要团队协作的完整 5v5。算力 + self-play + PPO 的暴力组合,又赢了一局。 - [“危险到不能发布”:GPT-2 与一场关于开放的争论](https://www.adam2go.site/posts/2019-02-gpt2): OpenAI 发布 GPT-2,但以“可能被滥用造假新闻”为由,拒绝公开最大的 15 亿参数模型,只放小号。技术很强,但更大的争议是:AI 该不该“限量发售”? - [AlphaStar 打星际:DeepMind 攻进了即时战略的迷雾](https://www.adam2go.site/posts/2019-01-alphastar): DeepMind 的 AlphaStar 在《星际争霸 II》中 10:1 击败两位职业选手。实时、不完全信息、超长时域、海量动作空间——围棋之后最难的游戏之一也失守了。 ### 2018 - [AlphaFold 初露锋芒:AI 开始啃生物学的硬骨头](https://www.adam2go.site/posts/2018-12-alphafold1): DeepMind 的 AlphaFold 在蛋白质结构预测竞赛 CASP13 上夺冠,且大幅领先。AlphaGo 退役后转向科学的承诺,开始兑现第一笔。 - [BERT 屠榜:双向预训练把 NLP 带进“微调时代”](https://www.adam2go.site/posts/2018-10-bert): Google 发布 BERT:用掩码语言模型做双向预训练,在 11 项 NLP 任务上集体刷新 SOTA,GLUE 榜单一夜变天。预训练大模型 + 微调,成了 NLP 的新默认。 - [BigGAN:把 GAN 做大,生成的图开始“以假乱真”](https://www.adam2go.site/posts/2018-09-biggan): DeepMind 的 BigGAN 证明:把 GAN 的批量和参数堆大,配合一些稳定技巧,能生成 512×512 高保真的 ImageNet 图像。“规模”这味药,对生成模型同样灵。 - [Deepfake 失控:当“眼见为实”开始失效](https://www.adam2go.site/posts/2018-08-deepfakes): 换脸技术从论文走进开源工具,普通人也能造出以假乱真的视频。技术中性,但这一次,滥用跑在了治理前面。我们该怎么办? - [World Models:让智能体先在“梦里”把本事练好](https://www.adam2go.site/posts/2018-06-world-models): Ha 与 Schmidhuber 的 World Models:智能体先学一个环境的生成式“世界模型”,然后在这个想象的世界里训练策略。在梦里练车,是不是听起来很科幻? - [GPT-1:OpenAI 押注“预训练 + 微调”的第一张牌](https://www.adam2go.site/posts/2018-06-gpt1): OpenAI 发布 GPT:用 Transformer 解码器在大量无标注文本上做语言模型预训练,再微调到各类任务。一个模型打多个任务的范式,开始成型。 - [把模型塞进手机:MobileNet 们掀起的“轻量化”运动](https://www.adam2go.site/posts/2018-02-imagenet-mobile): 深度可分离卷积、通道剪裁、量化……这一两年大家集体醒悟:模型不光要准,还得跑得起。端侧 AI 的工程学,正式成为一门显学。 ### 2017 - [“机器学习成了炼金术”:NIPS 颁奖台上的一盆冷水](https://www.adam2go.site/posts/2017-12-rahimi-alchemy): Ali Rahimi 在 NIPS 领取时间检验奖时把当下的深度学习比作炼金术:有效,但缺乏可解释的原理。LeCun 隔空反驳。这场争论比大多数论文都有营养。 - [AlphaZero:一套算法通吃围棋、国象、将棋](https://www.adam2go.site/posts/2017-12-alphazero): DeepMind 把 Zero 配方泛化:同一套算法、同一组超参数,从零自学围棋、国际象棋、将棋,分别在数小时内超越各自领域最强程序。通用性宣言。 - [Hinton 的胶囊网络:对自己发明的东西最不满意的人](https://www.adam2go.site/posts/2017-11-capsule-networks): Hinton 发布 Capsule Networks:用向量“胶囊”取代标量神经元,动态路由取代池化。CNN 之父亲自下场革 CNN 的命,虽然这次未必成功。 - [AlphaGo Zero:扔掉人类棋谱,三天登顶](https://www.adam2go.site/posts/2017-10-alphago-zero): Nature 新论文:AlphaGo Zero 不用任何人类棋谱,从随机落子开始纯自我对弈,三天超越击败李世石的版本,40 天超越所有旧版。人类知识从起点变成了天花板。 - [TI 现场的彩蛋:OpenAI 的 Bot 单挑掀翻 Dendi](https://www.adam2go.site/posts/2017-08-openai-dota): Dota 2 国际邀请赛上,OpenAI 的 1v1 Bot 当场击败人气职业选手 Dendi。纯自我对弈练出来的,没喂一场人类录像。下一步他们要打 5v5。 - [国务院发文:人工智能成了国家战略,时间表画到 2030](https://www.adam2go.site/posts/2017-07-china-ai-plan): 《新一代人工智能发展规划》发布:三步走,2030 年要做世界主要 AI 创新中心。一份政府文件,会怎样改变接下来十年的人才、资本和产业流向? - [PPO:把策略优化做成“人人能跑”的默认选项](https://www.adam2go.site/posts/2017-07-ppo): OpenAI 发布 PPO:用一个裁剪过的目标函数替代 TRPO 的二阶约束,几行代码实现接近的效果。简单、稳、好调——它大概率会成为 RL 的默认算法。 - [Attention Is All You Need:八个人把 RNN 送进了历史](https://www.adam2go.site/posts/2017-06-transformer): Google 八人组的 Transformer 论文挂上 arXiv:不要循环、不要卷积,纯注意力机制做序列建模,翻译质量和训练速度双双碾压。这篇必须精读。 - [乌镇三连胜后,AlphaGo 挂靴:一个时代三年就走完了](https://www.adam2go.site/posts/2017-05-alphago-kejie): AlphaGo 3:0 战胜世界第一柯洁后宣布退役。柯洁中盘哭了,DeepMind 转身去做蛋白质和能源。这场人机故事的收尾,比开头还耐人寻味。 - [Libratus 血洗德扑职业牌手:不完全信息博弈也失守了](https://www.adam2go.site/posts/2017-01-libratus-poker): CMU 的 Libratus 在 20 天 12 万手一对一无限注德扑中,以 177 万筹码的巨大优势击败四位顶尖职业牌手。虚张声势这件事,机器干得比人还好。 - [PyTorch 发布:动态图把“写模型”变回了“写 Python”](https://www.adam2go.site/posts/2017-01-pytorch-release): Facebook 开源 PyTorch:动态计算图、原生 Python 体验、随处可断点调试。研究员们集体真香,TensorFlow 第一次有了像样的对手。 - [阿西洛玛 23 条:AI 圈给自己立的第一部“家规”](https://www.adam2go.site/posts/2017-01-asilomar-principles): 上百位研究者在加州阿西洛玛开会,敲定 23 条 AI 原则,从研究目标到长期风险。比起内容,更有意思的是“谁在什么时候立了这个规矩”。 ### 2016 - [OpenAI Universe:让 AI 像人一样用键盘鼠标玩电脑](https://www.adam2go.site/posts/2016-12-openai-universe): OpenAI 发布 Universe:让智能体通过看屏幕像素、操作键鼠的方式使用上千个游戏和网页。野心很大——通用智能体的训练场。 - [谷歌翻译换引擎:GNMT 一夜之间把错误率砍掉六成](https://www.adam2go.site/posts/2016-09-gnmt): Google 发布 GNMT 神经机器翻译系统并直接上线中英翻译:8 层 LSTM 编解码器加注意力机制,翻译错误率较老系统下降 55-85%,十年统计机器翻译时代谢幕。 - [WaveNet:DeepMind 让机器一“个”采样点一个采样点地说话](https://www.adam2go.site/posts/2016-09-wavenet): DeepMind 发布 WaveNet:直接在原始音频波形上做自回归生成,每秒预测 16000 个采样点,合成语音的自然度大幅逼近真人。 - [Prisma 刷屏:一篇论文到爆款 App 只用了十一个月](https://www.adam2go.site/posts/2016-07-prisma): 俄罗斯团队把神经风格迁移装进手机 App,Prisma 上线数周下载量破千万。学术论文到消费爆款的转化周期,被压缩到了一年以内。 - [第一起 Autopilot 致死事故:自动驾驶撞上了现实](https://www.adam2go.site/posts/2016-07-tesla-autopilot-fatality): 五月佛罗里达的一起车祸被披露:Model S 在 Autopilot 状态下未能识别横穿的白色拖挂卡车,驾驶员丧生。NHTSA 启动调查,整个行业开始重新审视“辅助”与“自动”的边界。 - [AI 安全的具体问题:终于有人把“天网焦虑”翻译成了工程任务](https://www.adam2go.site/posts/2016-06-concrete-problems-ai-safety): Google Brain、OpenAI 等联合发表 Concrete Problems in AI Safety:把 AI 安全拆成五个可研究的具体问题,从扫地机器人打翻花瓶讲起。 - [Google 亮出 TPU:原来 AlphaGo 背后还藏着一颗自研芯片](https://www.adam2go.site/posts/2016-05-google-tpu): Google I/O 上披露:自研张量处理器 TPU 已在数据中心秘密运行一年多,专为神经网络推理设计,AlphaGo 也用了它。AI 竞争正式蔓延到芯片层。 - [OpenAI Gym 发布:强化学习终于有了统一考场](https://www.adam2go.site/posts/2016-04-openai-gym): OpenAI 发布首个产品 Gym:一套统一接口的强化学习环境集合,从 CartPole 到 Atari。从此 RL 论文有了可复现的基准线。 - [上线 16 小时就下线:微软聊天机器人 Tay 的翻车实录](https://www.adam2go.site/posts/2016-03-tay-disaster): 微软在 Twitter 上线少女人设聊天机器人 Tay,网友有组织地“调教”16 小时后,它开始输出种族主义言论,微软紧急下线道歉。一堂昂贵的对齐课。 - [4:1,第 37 手:AlphaGo 战胜李世石的一周](https://www.adam2go.site/posts/2016-03-alphago-lee-sedol): 首尔五番棋,AlphaGo 4:1 战胜李世石。第二局的第 37 手让职业棋手集体沉默,第四局李世石的“神之一手”则赢回了人类唯一一盘。这一周值得写进教科书。 - [Nature 头条:AlphaGo 五比零横扫欧洲围棋冠军](https://www.adam2go.site/posts/2016-01-alphago-fan-hui): DeepMind 在 Nature 公布 AlphaGo:策略网络 + 价值网络 + 蒙特卡洛树搜索,去年十月已经 5:0 击败欧洲冠军樊麾。围棋这座“十年内攻不下”的山,被提前攻了。 ### 2015 - [OpenAI 成立:10 亿美元买一张“非营利”的 AGI 门票](https://www.adam2go.site/posts/2015-12-openai-founded): 马斯克、Altman 等人宣布成立非营利研究机构 OpenAI,承诺投入 10 亿美元,使命是“确保 AGI 造福全人类”,研究成果开放共享。 - [ResNet:把网络做到 152 层的那个“恒等捷径”](https://www.adam2go.site/posts/2015-12-resnet): 何恺明团队的 ResNet 横扫 ILSVRC 2015 所有项目:残差连接让 152 层网络的训练比 22 层还顺利,ImageNet 错误率降到 3.57%,首次超过人类水平。 - [Google 开源 TensorFlow:深度学习的基础设施战争打响](https://www.adam2go.site/posts/2015-11-tensorflow-opensource): Google 把内部第二代深度学习系统 TensorFlow 以 Apache 2.0 协议开源。巨头开始用开源框架争夺开发者心智,深度学习的工具链从此换代。 - [特斯拉 Autopilot 推送:一脚油门踩进自动驾驶的灰色地带](https://www.adam2go.site/posts/2015-10-tesla-autopilot): 特斯拉 7.0 版本通过 OTA 给数万辆车推送了 Autopilot:高速自动跟车、车道保持、拨杆变道。这是第一次有人把“辅助驾驶”当成消费级软件来发布。 - [神经风格迁移:把你的自拍画成梵高](https://www.adam2go.site/posts/2015-08-neural-style-transfer): Gatys 等人发现:卷积网络的特征天然把“内容”和“风格”分开存放。优化一张图同时匹配两者,就能让照片穿上任何画家的笔触。 - [IJCAI 上的公开信:研究者们想给自主武器踩刹车](https://www.adam2go.site/posts/2015-07-autonomous-weapons-letter): 上千名 AI 研究者在 IJCAI 发布公开信,呼吁禁止“无需人类干预即可选择并攻击目标”的自主武器。这是研究社区第一次集体对一种应用说不。 - [DeepDream:当神经网络开始做梦,满屏都是狗](https://www.adam2go.site/posts/2015-07-deepdream): Google 开源 DeepDream:把图片往“让神经元更兴奋”的方向反向优化,得到布满狗脸和漩涡的迷幻图像。这是大众第一次直观看见网络内部学到了什么。 - [目标检测的疯狂六月:Faster R-CNN 和 YOLO 同月亮相](https://www.adam2go.site/posts/2015-06-object-detection-month): 一个月内两篇目标检测里程碑:Faster R-CNN 用 RPN 把候选框也交给网络学,YOLO 干脆把检测变成一次回归。两条路线就此分野。 - [RNN 的不讲道理的有效性:一篇博客带火了字符级语言模型](https://www.adam2go.site/posts/2015-05-karpathy-rnn): Karpathy 的博客 The Unreasonable Effectiveness of RNN 火遍了圈子:一个字符级 RNN 就能生成像模像样的莎士比亚、Linux 内核代码和数学论文。 - [Hinton 的知识蒸馏:让小模型喝下大模型的“暗知识”](https://www.adam2go.site/posts/2015-03-knowledge-distillation): Distilling the Knowledge in a Neural Network:用大模型的软标签训练小模型,效果远超直接用硬标签训练。“暗知识”这个词从此进入词典。 - [DQN 登上 Nature:一个网络学会了 49 个雅达利游戏](https://www.adam2go.site/posts/2015-02-dqn-nature): DeepMind 的 DQN 论文登上 Nature 封面:同一套网络结构和超参数,只看屏幕像素和分数,学会了 49 个雅达利游戏,一半以上超过人类测试员。 - [马斯克、霍金都签了名:AI 安全第一次登上头条](https://www.adam2go.site/posts/2015-01-fli-open-letter): Future of Life Institute 发布关于 AI 研究优先级的公开信,马斯克随手捐了 1000 万美元。AI 安全从科幻话题变成了正经研究方向。