grep -l #学习笔记 posts/
#学习笔记
ls posts/ | grep 学习笔记
6 entries · 全部 →
2026.06.10
→十一年,从一封公开信到一个替你过日子的 Agent:此刻的回望
从 2015 年那封‘AI 安全第一次上头条’的公开信,写到 2026 年一个主动替你打理生活的 Agent,我把这十一年的脉络梳理了一遍。这是一篇站在‘现在’的回望——关于我们走了多远、几条主线如何收束,以及一个产品经理在浪潮中段,最想守住的东西。
[深度思考] 4m
2021.08.18
→‘基础模型’:斯坦福给这个时代起了个名字
斯坦福一份上百页的报告提出‘Foundation Models(基础模型)’这个词,定义一类‘大规模预训练、可适配到无数下游任务’的模型。命名,往往是一个范式成熟的标志。
[深度思考] 2m
2019.12.04
→双下降:更大的模型为什么没有像教科书说的那样过拟合?
OpenAI 的‘深度双下降’揭示一个反常识现象:测试误差随模型变大,先降后升(经典偏差-方差),然后……又降。我们对‘过拟合’的理解,可能从一开始就太简单了。
[深度思考] 1m
2017.12.08
→“机器学习成了炼金术”:NIPS 颁奖台上的一盆冷水
Ali Rahimi 在 NIPS 领取时间检验奖时把当下的深度学习比作炼金术:有效,但缺乏可解释的原理。LeCun 隔空反驳。这场争论比大多数论文都有营养。
[深度思考] 1m
2015.07.01
→DeepDream:当神经网络开始做梦,满屏都是狗
Google 开源 DeepDream:把图片往“让神经元更兴奋”的方向反向优化,得到布满狗脸和漩涡的迷幻图像。这是大众第一次直观看见网络内部学到了什么。
[短思考] 1m
2015.05.21
→RNN 的不讲道理的有效性:一篇博客带火了字符级语言模型
Karpathy 的博客 The Unreasonable Effectiveness of RNN 火遍了圈子:一个字符级 RNN 就能生成像模像样的莎士比亚、Linux 内核代码和数学论文。
[短思考] 1m