grep -l #学习笔记 posts/

#学习笔记

ls posts/ | grep 学习笔记

6 entries · 全部 →

→十一年,从一封公开信到一个替你过日子的 Agent:此刻的回望

从 2015 年那封‘AI 安全第一次上头条’的公开信,写到 2026 年一个主动替你打理生活的 Agent,我把这十一年的脉络梳理了一遍。这是一篇站在‘现在’的回望——关于我们走了多远、几条主线如何收束,以及一个产品经理在浪潮中段,最想守住的东西。

[深度思考] 4m

→‘基础模型’:斯坦福给这个时代起了个名字

斯坦福一份上百页的报告提出‘Foundation Models(基础模型)’这个词,定义一类‘大规模预训练、可适配到无数下游任务’的模型。命名,往往是一个范式成熟的标志。

[深度思考] 2m

→双下降:更大的模型为什么没有像教科书说的那样过拟合？

OpenAI 的‘深度双下降’揭示一个反常识现象:测试误差随模型变大,先降后升(经典偏差-方差),然后……又降。我们对‘过拟合’的理解,可能从一开始就太简单了。

[深度思考] 1m

→“机器学习成了炼金术”：NIPS 颁奖台上的一盆冷水

Ali Rahimi 在 NIPS 领取时间检验奖时把当下的深度学习比作炼金术：有效，但缺乏可解释的原理。LeCun 隔空反驳。这场争论比大多数论文都有营养。

[深度思考] 1m

→DeepDream：当神经网络开始做梦，满屏都是狗

Google 开源 DeepDream：把图片往“让神经元更兴奋”的方向反向优化，得到布满狗脸和漩涡的迷幻图像。这是大众第一次直观看见网络内部学到了什么。

→RNN 的不讲道理的有效性：一篇博客带火了字符级语言模型

Karpathy 的博客 The Unreasonable Effectiveness of RNN 火遍了圈子：一个字符级 RNN 就能生成像模像样的莎士比亚、Linux 内核代码和数学论文。