grep -l #深度学习 posts/

#深度学习

ls posts/ | grep 深度学习

26 entries · 全部 →

→诺奖的双响炮:物理学奖给了神经网络,化学奖给了 AlphaFold

同一个诺奖季,物理学奖颁给了奠定神经网络基础的 Hopfield 和 Hinton,化学奖颁给了用 AlphaFold 破解蛋白质结构的 Hassabis、Jumper(和做蛋白设计的 Baker)。科学界最高荣誉,在两天内两次盖章:AI 已经成了科学本身的引擎。

[深度思考] 3m

→扩散模型掀翻 GAN:生成式 AI 的‘改朝换代’

OpenAI 的论文证明:扩散模型在图像生成质量上首次全面超过 GAN。统治了生成领域多年的 GAN,迎来了真正的挑战者。这件事,两年后会以‘Stable Diffusion’的形式改变世界。

[论文解读] 1m

→AlphaFold2:一个困扰生物学 50 年的问题,基本被解决了

CASP14 结果公布:DeepMind 的 AlphaFold2 预测蛋白质结构的精度,达到了实验方法的水平。组织者直接宣布:蛋白质折叠这个 50 年的大难题,在很大程度上被解决了。

[深度思考] 1m

→ViT:Transformer 攻进视觉,CNN 的主场也守不住了

Google 的 Vision Transformer 把图片切成 16×16 的小块当‘单词’,直接喂给标准 Transformer。在足够大的数据上,它打赢了精心设计的 CNN。一个架构,开始通吃文本和图像。

[论文解读] 1m

→自监督的春天:SimCLR 证明‘不用标签’也能学出好表征

Hinton 组的 SimCLR 用对比学习刷新自监督视觉表征的纪录:同一张图的两个增强视角拉近、不同图推远,几乎追平有监督预训练。标注的霸权松动了。

[论文解读] 1m

→AlphaStar 打星际：DeepMind 攻进了即时战略的迷雾

DeepMind 的 AlphaStar 在《星际争霸 II》中 10:1 击败两位职业选手。实时、不完全信息、超长时域、海量动作空间——围棋之后最难的游戏之一也失守了。

[论文解读] 1m

→AlphaFold 初露锋芒：AI 开始啃生物学的硬骨头

DeepMind 的 AlphaFold 在蛋白质结构预测竞赛 CASP13 上夺冠，且大幅领先。AlphaGo 退役后转向科学的承诺，开始兑现第一笔。

[深度思考] 1m

→BERT 屠榜：双向预训练把 NLP 带进“微调时代”

Google 发布 BERT：用掩码语言模型做双向预训练，在 11 项 NLP 任务上集体刷新 SOTA，GLUE 榜单一夜变天。预训练大模型 + 微调，成了 NLP 的新默认。

[论文解读] 1m

→BigGAN：把 GAN 做大，生成的图开始“以假乱真”

DeepMind 的 BigGAN 证明：把 GAN 的批量和参数堆大，配合一些稳定技巧，能生成 512×512 高保真的 ImageNet 图像。“规模”这味药，对生成模型同样灵。

[论文解读] 1m

→GPT-1：OpenAI 押注“预训练 + 微调”的第一张牌

OpenAI 发布 GPT：用 Transformer 解码器在大量无标注文本上做语言模型预训练，再微调到各类任务。一个模型打多个任务的范式，开始成型。

[论文解读] 1m

→把模型塞进手机：MobileNet 们掀起的“轻量化”运动

深度可分离卷积、通道剪裁、量化……这一两年大家集体醒悟：模型不光要准，还得跑得起。端侧 AI 的工程学，正式成为一门显学。

[技术教程] 1m

→Hinton 的胶囊网络：对自己发明的东西最不满意的人

Hinton 发布 Capsule Networks：用向量“胶囊”取代标量神经元，动态路由取代池化。CNN 之父亲自下场革 CNN 的命，虽然这次未必成功。

→AlphaGo Zero：扔掉人类棋谱，三天登顶

Nature 新论文：AlphaGo Zero 不用任何人类棋谱，从随机落子开始纯自我对弈，三天超越击败李世石的版本，40 天超越所有旧版。人类知识从起点变成了天花板。

[论文解读] 1m

→Attention Is All You Need：八个人把 RNN 送进了历史

Google 八人组的 Transformer 论文挂上 arXiv：不要循环、不要卷积，纯注意力机制做序列建模，翻译质量和训练速度双双碾压。这篇必须精读。

[论文解读] 2m

→PyTorch 发布：动态图把“写模型”变回了“写 Python”

Facebook 开源 PyTorch：动态计算图、原生 Python 体验、随处可断点调试。研究员们集体真香，TensorFlow 第一次有了像样的对手。

[产品实践] 1m

→谷歌翻译换引擎：GNMT 一夜之间把错误率砍掉六成

Google 发布 GNMT 神经机器翻译系统并直接上线中英翻译：8 层 LSTM 编解码器加注意力机制，翻译错误率较老系统下降 55-85%，十年统计机器翻译时代谢幕。

[论文解读] 1m

→WaveNet：DeepMind 让机器一“个”采样点一个采样点地说话

DeepMind 发布 WaveNet：直接在原始音频波形上做自回归生成，每秒预测 16000 个采样点，合成语音的自然度大幅逼近真人。

[论文解读] 1m

→Google 亮出 TPU：原来 AlphaGo 背后还藏着一颗自研芯片

Google I/O 上披露：自研张量处理器 TPU 已在数据中心秘密运行一年多，专为神经网络推理设计，AlphaGo 也用了它。AI 竞争正式蔓延到芯片层。

[深度思考] 1m

→4:1，第 37 手：AlphaGo 战胜李世石的一周

首尔五番棋，AlphaGo 4:1 战胜李世石。第二局的第 37 手让职业棋手集体沉默，第四局李世石的“神之一手”则赢回了人类唯一一盘。这一周值得写进教科书。

[深度思考] 1m

→Nature 头条：AlphaGo 五比零横扫欧洲围棋冠军

DeepMind 在 Nature 公布 AlphaGo：策略网络 + 价值网络 + 蒙特卡洛树搜索，去年十月已经 5:0 击败欧洲冠军樊麾。围棋这座“十年内攻不下”的山，被提前攻了。

[论文解读] 1m

→ResNet：把网络做到 152 层的那个“恒等捷径”

何恺明团队的 ResNet 横扫 ILSVRC 2015 所有项目：残差连接让 152 层网络的训练比 22 层还顺利，ImageNet 错误率降到 3.57%，首次超过人类水平。

[论文解读] 1m

→Google 开源 TensorFlow：深度学习的基础设施战争打响

Google 把内部第二代深度学习系统 TensorFlow 以 Apache 2.0 协议开源。巨头开始用开源框架争夺开发者心智，深度学习的工具链从此换代。

[深度思考] 1m

→目标检测的疯狂六月：Faster R-CNN 和 YOLO 同月亮相

一个月内两篇目标检测里程碑：Faster R-CNN 用 RPN 把候选框也交给网络学，YOLO 干脆把检测变成一次回归。两条路线就此分野。

[论文解读] 1m

→RNN 的不讲道理的有效性：一篇博客带火了字符级语言模型

Karpathy 的博客 The Unreasonable Effectiveness of RNN 火遍了圈子：一个字符级 RNN 就能生成像模像样的莎士比亚、Linux 内核代码和数学论文。

→Hinton 的知识蒸馏：让小模型喝下大模型的“暗知识”

Distilling the Knowledge in a Neural Network：用大模型的软标签训练小模型，效果远超直接用硬标签训练。“暗知识”这个词从此进入词典。

[论文解读] 1m

→DQN 登上 Nature：一个网络学会了 49 个雅达利游戏

DeepMind 的 DQN 论文登上 Nature 封面：同一套网络结构和超参数，只看屏幕像素和分数，学会了 49 个雅达利游戏，一半以上超过人类测试员。

[论文解读] 1m