tree resources/
资源库
我常打开的清单。每一条都附上我为什么收录它的一句话。链接不更新就移除 — 这里没有“仅供参考”的东西。
必读论文/
29 entries
01
Attention Is All You Need (Transformer)
现代大模型的核心架构起点,必读中的必读。
↗ open
02
BERT: Pre-training of Deep Bidirectional Transformers
预训练语言模型的重要里程碑,理解 NLP 范式转变必读。
↗ open
03
Language Models are Few-Shot Learners (GPT-3)
GPT-3 展示了规模化语言模型的少样本能力,是大模型时代转折点。
↗ open
04
Mastering the game of Go with deep neural networks and tree search (AlphaGo)
深度强化学习里程碑:策略网络 + 价值网络 + MCTS。
↗ open
05
Training language models to follow instructions with human feedback (InstructGPT)
指令微调与 RLHF 的关键论文,直接影响 ChatGPT 类产品范式。
↗ open
06
Human-level control through deep reinforcement learning (DQN)
DQN 将深度学习引入强化学习,影响深远。
↗ open
07
LoRA: Low-Rank Adaptation of Large Language Models
参数高效微调的经典方法,理解大模型训练成本与私有化适配必读。
↗ open
08
Playing Atari with Deep Reinforcement Learning (DQN workshop)
更早的 DQN 版本,讲清核心思路与设定。
↗ open
09
ReAct: Synergizing Reasoning and Acting in Language Models
Agent 范式里“推理+行动”的重要论文,适合连接产品和工程。
↗ open
10
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
提示词与推理能力讨论的关键论文,适合理解大模型行为边界。
↗ open
11
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
RAG 体系源头论文,适合连接知识库产品、搜索和大模型应用。
↗ open
12
Direct Preference Optimization (DPO)
偏好对齐的重要路线,适合理解 RLHF 之后的训练范式。
↗ open
13
Learning Transferable Visual Models From Natural Language Supervision (CLIP)
图文对齐与多模态基础模型的代表作,理解多模态产品必读。
↗ open
14
Deep Residual Learning for Image Recognition (ResNet)
深度残差网络经典论文,理解现代深层网络结构的基础。
↗ open
15
Generative Adversarial Nets (GAN)
生成式模型经典范式,理解对抗训练的起点。
↗ open
16
ImageNet Classification with Deep Convolutional Neural Networks (AlexNet)
深度学习视觉爆发的标志性论文,理解现代 CV 的历史起点。
↗ open
17
Denoising Diffusion Probabilistic Models (DDPM)
扩散模型主线的基础论文,理解图像生成模型绕不开。
↗ open
18
Sequence to Sequence Learning with Neural Networks
Seq2Seq 框架奠定机器翻译与序列生成基础。
↗ open
19
Neural Machine Translation by Jointly Learning to Align and Translate
注意力机制早期代表作,Transformer 的思想前史。
↗ open
20
Efficient Estimation of Word Representations in Vector Space (word2vec)
词向量时代的经典起点,理解分布式表示必读。
↗ open
21
Adam: A Method for Stochastic Optimization
深度学习训练里最常见优化器之一。
↗ open
22
An Image is Worth 16x16 Words (Vision Transformer)
把 Transformer 引入视觉主干网络的代表作。
↗ open
23
Scaling Laws for Neural Language Models
把‘大力出奇迹’写成幂律公式,大模型时代的奠基之作。
↗ open
24
Training Compute-Optimal LLMs (Chinchilla)
修正缩放定律:参数和数据要同比例增长,更省也更强。
↗ open
25
GPT-4 Technical Report
能力封顶、方法保密的一份报告,本身就是时代注脚。
↗ open
26
Mamba: Linear-Time Sequence Modeling
状态空间模型,用线性复杂度挑战 Transformer 的长序列短板。
↗ open
27
DeepSeek-R1
用纯强化学习逼出推理能力,并把配方完全开源。
↗ open
28
Constitutional AI
给模型一部‘宪法’做自我对齐,Anthropic 的招牌方法。
↗ open
29
Mixtral of Experts
稀疏 MoE 的漂亮开源实现:激活参数小、效果却能打。
↗ open
工具与库/
32 entries
01
OpenAI API Docs
OpenAI 官方 API 文档,做 LLM 产品和工程集成的基础入口。
↗ open
02
PyTorch
深度学习研究与工程最主流框架之一,算法同学必备。
↗ open
03
🤗 Transformers (Hugging Face)
Hugging Face 核心库,模型加载、微调、推理与生态连接都绕不开。
↗ open
04
LangChain
LLM 应用开发生态代表,适合理解工具调用、链路编排与 Agent 框架。
↗ open
05
vLLM
高吞吐 LLM 推理/服务引擎(PagedAttention 等)。
↗ open
06
LlamaIndex
RAG 与文档型 Agent 常用框架,适合知识库产品落地。
↗ open
07
Hugging Face Course
Hugging Face 官方课程,适合系统理解 Transformers 与生态工具。
↗ open
08
LangGraph
有状态 Agent 与工作流编排框架,适合复杂 Agent 产品架构。
↗ open
09
LangSmith
LLM 应用调试、评测与可观测性工具,适合产品上线前后使用。
↗ open
10
TensorFlow
成熟的机器学习框架,生态与生产部署资料丰富。
↗ open
11
JAX
高性能数值计算与前沿模型研究常用工具。
↗ open
12
llama.cpp
本地大模型推理生态代表,理解端侧部署很有用。
↗ open
13
Ollama
本地运行开源大模型的低门槛工具。
↗ open
14
Weights & Biases
实验追踪、模型训练可视化与团队协作常用平台。
↗ open
15
MLflow
经典 MLOps 工具,覆盖实验、模型注册与部署。
↗ open
16
Ragas
RAG 评测常用开源框架,适合知识库应用评估。
↗ open
17
TruLens
LLM/RAG 应用评估与反馈分析工具。
↗ open
18
DSPy
用程序化方式优化 Prompt 与 LLM Pipeline 的框架。
↗ open
19
AutoGen
多 Agent 协作框架,适合研究 Agent 编排。
↗ open
20
CrewAI
角色化多 Agent 工作流框架,产品原型验证很方便。
↗ open
21
Haystack
成熟的搜索、问答与 RAG 应用框架。
↗ open
22
Chroma
轻量向量数据库,适合快速搭建 RAG 原型。
↗ open
23
Qdrant
向量检索数据库,生产化 RAG 常见选择。
↗ open
24
Milvus
开源向量数据库,适合大规模相似度检索场景。
↗ open
25
Gradio
快速做模型 Demo 与交互界面的利器。
↗ open
26
Streamlit
数据应用与 AI Demo 快速搭建工具。
↗ open
27
MCP (Model Context Protocol)
连接大模型与工具/数据的开放协议,2026 年的事实标准。
↗ open
28
SGLang
高性能 LLM 推理/服务引擎,复杂提示编排和吞吐都很强。
↗ open
29
Unsloth
把 LLM 微调做到又快又省显存,个人玩家也跑得起。
↗ open
30
LiteLLM
用统一接口调上百家模型 API,多供应商切换的利器。
↗ open
31
PEFT (Hugging Face)
参数高效微调工具箱:LoRA / QLoRA 等一站式。
↗ open
32
ComfyUI
节点式图像/视频生成工作流,扩散模型玩家的瑞士军刀。
↗ open
课程/
18 entries
01
Stanford CS229: Machine Learning
机器学习理论基础首选课程,适合系统补算法底座。
↗ open
02
Neural Networks and Deep Learning (Coursera)
DL 专项第一门:从零搭建神经网络基础。
↗ open
03
Stanford CS224N: Natural Language Processing with Deep Learning
NLP 与 Transformer 体系经典课程,适合深入理解语言模型。
↗ open
04
Stanford CS231n: Deep Learning for Computer Vision
计算机视觉经典课程,适合理解 CNN、检测、分割与视觉工程基础。
↗ open
05
Deep Learning Specialization (DeepLearning.AI)
深度学习系统课,适合补 CNN/RNN/优化与实战基本功。
↗ open
06
Practical Deep Learning for Coders (fast.ai)
实战导向的深度学习课程,适合快速把模型做出来。
↗ open
07
Generative AI with Large Language Models (DeepLearning.AI)
面向 LLM 训练、微调、推理和产品落地的系统课程。
↗ open
08
MIT 6.S191: Introduction to Deep Learning
MIT 深度学习入门课,适合快速补齐基础。
↗ open
09
Stanford CS25: Transformers United
围绕 Transformer 的专题课程,适合追技术谱系。
↗ open
10
Berkeley CS285: Deep Reinforcement Learning
强化学习系统课,适合理解决策智能。
↗ open
11
Full Stack Deep Learning
从模型到产品上线的全栈 AI 工程课程。
↗ open
12
Google Machine Learning Crash Course
Google 出品的机器学习速成课,清晰实用。
↗ open
13
Kaggle Learn
适合用小项目快速练习数据科学与机器学习。
↗ open
14
MLOps Zoomcamp
MLOps 免费课程,适合补训练、部署、监控链路。
↗ open
15
Karpathy: Neural Networks — Zero to Hero
从零手写到 GPT,看不到第二个能讲这么透的人。
↗ open
16
Stanford CS336: Language Modeling from Scratch
一遍走完 tokenizer→预训练→对齐,比读十篇论文管用。
↗ open
17
Hugging Face Agents Course
免费系统课:从零搭一个真正能用的 AI Agent。
↗ open
18
DeepLearning.AI Short Courses
吴恩达团队的免费短课合集,跟着前沿主题快速上手。
↗ open
中文社区/
11 entries
01
机器之心
国内 AI 资讯与产业动态核心媒体,适合跟踪中文 AI 趋势。
↗ open
02
PaperWeekly(机器之心专栏)
论文解读与精选栏目,适合跟踪中文前沿论文脉络。
↗ open
03
量子位
AI/前沿科技资讯与趋势跟踪,适合作为中文资讯源。
↗ open
04
智源社区(BAAI)
智源研究院相关社区与资源平台,适合关注国内大模型与开源研究动态。
↗ open
05
ModelScope 魔搭社区
国内模型、数据集与应用生态平台,适合查找中文模型和开源样例。
↗ open
06
OpenMMLab
国内优秀开源算法工具体系,CV 方向工程化与论文复现价值高。
↗ open
07
Datawhale
中文开源学习社区,适合系统学习、组队实践和入门训练。
↗ open
08
飞桨 AI Studio
中文机器学习实践平台,适合找教程、样例项目和训练环境。
↗ open
09
Hugging Face 中文社区
Hugging Face 中文教程与实践资源入口。
↗ open
10
InfoQ 人工智能频道
偏产业与工程架构视角,适合产品/技术趋势观察。
↗ open
11
跟李沐学 AI(B 站)
李沐的论文精读和《动手学深度学习》,中文圈最佳之一。
↗ open