tree resources/

资源库

我常打开的清单。每一条都附上我为什么收录它的一句话。链接不更新就移除 — 这里没有“仅供参考”的东西。

必读论文/

29 entries

Attention Is All You Need (Transformer)

现代大模型的核心架构起点，必读中的必读。

BERT: Pre-training of Deep Bidirectional Transformers

预训练语言模型的重要里程碑，理解 NLP 范式转变必读。

Language Models are Few-Shot Learners (GPT-3)

GPT-3 展示了规模化语言模型的少样本能力，是大模型时代转折点。

Mastering the game of Go with deep neural networks and tree search (AlphaGo)

深度强化学习里程碑：策略网络 + 价值网络 + MCTS。

Training language models to follow instructions with human feedback (InstructGPT)

指令微调与 RLHF 的关键论文，直接影响 ChatGPT 类产品范式。

Human-level control through deep reinforcement learning (DQN)

DQN 将深度学习引入强化学习，影响深远。

LoRA: Low-Rank Adaptation of Large Language Models

参数高效微调的经典方法，理解大模型训练成本与私有化适配必读。

Playing Atari with Deep Reinforcement Learning (DQN workshop)

更早的 DQN 版本，讲清核心思路与设定。

ReAct: Synergizing Reasoning and Acting in Language Models

Agent 范式里“推理+行动”的重要论文，适合连接产品和工程。

Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

提示词与推理能力讨论的关键论文，适合理解大模型行为边界。

Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

RAG 体系源头论文，适合连接知识库产品、搜索和大模型应用。

Direct Preference Optimization (DPO)

偏好对齐的重要路线，适合理解 RLHF 之后的训练范式。

Learning Transferable Visual Models From Natural Language Supervision (CLIP)

图文对齐与多模态基础模型的代表作，理解多模态产品必读。

Deep Residual Learning for Image Recognition (ResNet)

深度残差网络经典论文，理解现代深层网络结构的基础。

Generative Adversarial Nets (GAN)

生成式模型经典范式，理解对抗训练的起点。

ImageNet Classification with Deep Convolutional Neural Networks (AlexNet)

深度学习视觉爆发的标志性论文，理解现代 CV 的历史起点。

Denoising Diffusion Probabilistic Models (DDPM)

扩散模型主线的基础论文，理解图像生成模型绕不开。

Sequence to Sequence Learning with Neural Networks

Seq2Seq 框架奠定机器翻译与序列生成基础。

Neural Machine Translation by Jointly Learning to Align and Translate

注意力机制早期代表作，Transformer 的思想前史。

Efficient Estimation of Word Representations in Vector Space (word2vec)

词向量时代的经典起点，理解分布式表示必读。

Adam: A Method for Stochastic Optimization

深度学习训练里最常见优化器之一。

An Image is Worth 16x16 Words (Vision Transformer)

把 Transformer 引入视觉主干网络的代表作。

Scaling Laws for Neural Language Models

把‘大力出奇迹’写成幂律公式，大模型时代的奠基之作。

Training Compute-Optimal LLMs (Chinchilla)

修正缩放定律：参数和数据要同比例增长，更省也更强。

GPT-4 Technical Report

能力封顶、方法保密的一份报告，本身就是时代注脚。

Mamba: Linear-Time Sequence Modeling

状态空间模型，用线性复杂度挑战 Transformer 的长序列短板。

用纯强化学习逼出推理能力，并把配方完全开源。

Constitutional AI

给模型一部‘宪法’做自我对齐，Anthropic 的招牌方法。

Mixtral of Experts

稀疏 MoE 的漂亮开源实现：激活参数小、效果却能打。

工具与库/

32 entries

OpenAI API Docs

OpenAI 官方 API 文档，做 LLM 产品和工程集成的基础入口。

深度学习研究与工程最主流框架之一，算法同学必备。

🤗 Transformers (Hugging Face)

Hugging Face 核心库，模型加载、微调、推理与生态连接都绕不开。

LLM 应用开发生态代表，适合理解工具调用、链路编排与 Agent 框架。

高吞吐 LLM 推理/服务引擎（PagedAttention 等）。

RAG 与文档型 Agent 常用框架，适合知识库产品落地。

Hugging Face Course

Hugging Face 官方课程，适合系统理解 Transformers 与生态工具。

有状态 Agent 与工作流编排框架，适合复杂 Agent 产品架构。

LLM 应用调试、评测与可观测性工具，适合产品上线前后使用。

成熟的机器学习框架，生态与生产部署资料丰富。

高性能数值计算与前沿模型研究常用工具。

本地大模型推理生态代表，理解端侧部署很有用。

本地运行开源大模型的低门槛工具。

Weights & Biases

实验追踪、模型训练可视化与团队协作常用平台。

经典 MLOps 工具，覆盖实验、模型注册与部署。

RAG 评测常用开源框架，适合知识库应用评估。

LLM/RAG 应用评估与反馈分析工具。

用程序化方式优化 Prompt 与 LLM Pipeline 的框架。

多 Agent 协作框架，适合研究 Agent 编排。

角色化多 Agent 工作流框架，产品原型验证很方便。

成熟的搜索、问答与 RAG 应用框架。

轻量向量数据库，适合快速搭建 RAG 原型。

向量检索数据库，生产化 RAG 常见选择。

开源向量数据库，适合大规模相似度检索场景。

快速做模型 Demo 与交互界面的利器。

数据应用与 AI Demo 快速搭建工具。

MCP (Model Context Protocol)

连接大模型与工具/数据的开放协议，2026 年的事实标准。

高性能 LLM 推理/服务引擎，复杂提示编排和吞吐都很强。

把 LLM 微调做到又快又省显存，个人玩家也跑得起。

用统一接口调上百家模型 API，多供应商切换的利器。

PEFT (Hugging Face)

参数高效微调工具箱：LoRA / QLoRA 等一站式。

节点式图像/视频生成工作流，扩散模型玩家的瑞士军刀。

课程/

18 entries

Stanford CS229: Machine Learning

机器学习理论基础首选课程，适合系统补算法底座。

Neural Networks and Deep Learning (Coursera)

DL 专项第一门：从零搭建神经网络基础。

Stanford CS224N: Natural Language Processing with Deep Learning

NLP 与 Transformer 体系经典课程，适合深入理解语言模型。

Stanford CS231n: Deep Learning for Computer Vision

计算机视觉经典课程，适合理解 CNN、检测、分割与视觉工程基础。

Deep Learning Specialization (DeepLearning.AI)

深度学习系统课，适合补 CNN/RNN/优化与实战基本功。

Practical Deep Learning for Coders (fast.ai)

实战导向的深度学习课程，适合快速把模型做出来。

Generative AI with Large Language Models (DeepLearning.AI)

面向 LLM 训练、微调、推理和产品落地的系统课程。

MIT 6.S191: Introduction to Deep Learning

MIT 深度学习入门课，适合快速补齐基础。

Stanford CS25: Transformers United

围绕 Transformer 的专题课程，适合追技术谱系。

Berkeley CS285: Deep Reinforcement Learning

强化学习系统课，适合理解决策智能。

Full Stack Deep Learning

从模型到产品上线的全栈 AI 工程课程。

Google Machine Learning Crash Course

Google 出品的机器学习速成课，清晰实用。

适合用小项目快速练习数据科学与机器学习。

MLOps 免费课程，适合补训练、部署、监控链路。

Karpathy: Neural Networks — Zero to Hero

从零手写到 GPT，看不到第二个能讲这么透的人。

Stanford CS336: Language Modeling from Scratch

一遍走完 tokenizer→预训练→对齐，比读十篇论文管用。

Hugging Face Agents Course

免费系统课：从零搭一个真正能用的 AI Agent。

DeepLearning.AI Short Courses

吴恩达团队的免费短课合集，跟着前沿主题快速上手。

中文社区/

11 entries

国内 AI 资讯与产业动态核心媒体，适合跟踪中文 AI 趋势。

PaperWeekly（机器之心专栏）

论文解读与精选栏目，适合跟踪中文前沿论文脉络。

AI/前沿科技资讯与趋势跟踪，适合作为中文资讯源。

智源社区（BAAI）

智源研究院相关社区与资源平台，适合关注国内大模型与开源研究动态。

ModelScope 魔搭社区

国内模型、数据集与应用生态平台，适合查找中文模型和开源样例。

国内优秀开源算法工具体系，CV 方向工程化与论文复现价值高。

中文开源学习社区，适合系统学习、组队实践和入门训练。

飞桨 AI Studio

中文机器学习实践平台，适合找教程、样例项目和训练环境。

Hugging Face 中文社区

Hugging Face 中文教程与实践资源入口。

InfoQ 人工智能频道

偏产业与工程架构视角，适合产品/技术趋势观察。

跟李沐学 AI（B 站）

李沐的论文精读和《动手学深度学习》，中文圈最佳之一。