
前言项目简介近两年AI 工程已经从“会调用 API”逐渐转向“能理解原理、能搭建系统、能部署产品”。很多学习者可以快速搭建一个 Chatbot也能使用 LangChain、LlamaIndex、OpenAI API 或 Claude API 完成 Demo但一旦涉及模型训练、注意力机制、RAG 评估、Agent Loop、MCP Server、多智能体系统、生产部署与安全治理往往会发现知识体系是碎片化的。AI Engineering from Scratch正是为了解决这个问题而设计的开源课程项目。项目 slogan 是Learn it. Build it. Ship it for others.也就是说它并不满足于“学会概念”而是要求学习者经历完整闭环理解原理 → 手写实现 → 运行测试 → 产出可复用工具 → 面向真实场景交付项目 README 显示该课程目前包含435 lessons、20 phases、约 320 小时内容覆盖 Python、TypeScript、Rust、Julia 等语言。每一课都会产出一个可复用 artifact例如 prompt、skill、agent 或 MCP server。项目强调“不是只学习 AI而是从零开始构建 AI 系统”。(GitHub)从定位上看它不是普通 AI 入门教程而更像是一套AI Engineering Reference Manual从线性代数、机器学习、深度学习、计算机视觉、NLP、Transformer、LLM、RAG、MCP、Agent、多智能体到生产部署、安全对齐和最终 Capstone 项目形成一条完整的工程化学习路径。一、发布时间与项目状态截至本文撰写时GitHub 页面显示该仓库为公开项目仓库名为rohitg00/ai-engineering-from-scratch项目目前已有约9.5k stars、1.9k forks主分支为main仓库历史显示已有1,046 commits。(GitHub)从提交记录来看项目在2026 年 5 月 20 日仍然保持活跃更新当天合并了多个 PR包括 lesson run script、README counts drift check、audit backlog、strict CI、link check script 等。(GitHub)从CHANGELOG.md可以看到项目在2026 年 4 月完成了 Phase 4 Computer Vision共 28 节课覆盖从图像基础到多模态视觉、3D、视频和自监督学习等内容更早的 2026-Q1 阶段已经完成 Phase 0、Phase 1、Phase 2以及 Phase 3 的核心课程并构建了网站、术语表和 20 个阶段的初始结构。(GitHub)项目 README 中还显示该项目采用MIT License允许 fork、教学、销售和交付署名是鼓励但不是强制要求。(GitHub)简单概括项目项内容项目名称AI Engineering from ScratchGitHub 仓库rohitg00/ai-engineering-from-scratch项目定位AI 工程从零构建课程 / 实战手册当前规模435 lessons、20 phases、约 320 小时技术栈Python、TypeScript、Rust、Julia主要产出prompt、skill、agent、MCP server开源协议MIT当前状态持续活跃更新二、项目框架设计该项目的核心框架可以总结为20 个阶段 435 节课程 每课一个独立目录 每课一个可运行代码实现 每课一个可复用 artifact 最终形成 AI 工程作品集GitHub README 中展示了项目目录结构主要包括ai-engineering-from-scratch ├── .claude/skills ├── .github ├── assets ├── glossary ├── outputs ├── phases ├── projects ├── scripts ├── site ├── web ├── CHANGELOG.md ├── CODE_OF_CONDUCT.md ├── CONTRIBUTING.md ├── FORKING.md ├── LESSON_TEMPLATE.md ├── LICENSE ├── README.md ├── ROADMAP.md ├── SPONSORS.md ├── catalog.json ├── requirements.txt └── vercel.json其中最核心的是phases/、outputs/、projects/、scripts/和.claude/skills。1. phases课程主体项目 README 中说明整个课程由 20 个 phases 组成底层是数学基础顶层是 Agent、生产部署和 Capstone 项目。README 明确给出阶段关系Phase 0 是环境与工具Phase 1 是数学基础Phase 2 是机器学习基础Phase 3 是深度学习核心然后继续扩展到 CV、NLP、Speech、Transformer、GenAI、RL、LLM、LLM Engineering、Multimodal、MCP、Agent、多智能体、生产基础设施、安全对齐和最终项目。(GitHub)可以理解为如下路径Phase 0 Setup Tooling Phase 1 Math Foundations Phase 2 ML Fundamentals Phase 3 Deep Learning Core Phase 4 Computer Vision Phase 5 NLP Phase 6 Speech Audio Phase 7 Transformers Phase 8 Generative AI Phase 9 Reinforcement Learning Phase 10 LLMs from Scratch Phase 11 LLM Engineering Phase 12 Multimodal AI Phase 13 Tools Protocols Phase 14 Agent Engineering Phase 15 Autonomous Systems Phase 16 Multi-Agent Swarms Phase 17 Infrastructure Production Phase 18 Ethics Alignment Phase 19 Capstone Projects这种设计非常适合系统学习 AI 工程因为它不是从 API 开始而是先建立数学、算法、模型和系统工程基础然后再进入大模型应用和智能体系统。2. 每节课的统一结构项目规定每一节课都放在独立目录中并采用统一结构phases/NN-phase-name/NN-lesson-name/ ├── code/ 可运行实现 ├── docs/ │ └── en.md 课程讲解文档 └── outputs/ 本课产出的 prompt、skill、agent 或 MCP serverREADME 中明确说明每节课都遵循同样结构并且每一课会经历固定学习流程motto、problem、concept、build it、use it、ship it。(GitHub)也就是说每节课不是简单“看一篇教程”而是一个完整的工程小闭环MOTTO一句话抓住核心思想 PROBLEM说明实际痛点 CONCEPT建立直觉和图解理解 BUILD IT从原始数学和代码手写实现 USE IT用 PyTorch / sklearn 等生产框架复现 SHIP IT输出 prompt、skill、agent 或 MCP 工具3. outputs从课程产出真实工具该项目的一个关键设计是每节课都会产出 reusable artifact。README 中说明课程的outputs/会包含 prompts 和 skills最终这些产物可以安装到 Claude、Cursor、Codex、OpenClaw、Hermes 或任何支持SKILL.md的 agent 中。(GitHub)换句话说它不是“学完就结束”而是要求你把课程内容转化为可复用工具。例如学习 loss function → 产出 loss debugger prompt 学习 agent loop → 产出 ReAct-style agent skill 学习 MCP → 产出 MCP server 学习 RAG → 产出 RAG pipeline / evaluator这种设计使课程天然带有作品集属性。4. projects最终可交付项目Phase 19 是 Capstone ProjectsREADME 中列出了 17 个端到端项目每个项目大约 20–40 小时包括 Terminal-Native Coding Agent、Codebase RAG、Real-Time Voice Assistant、Multimodal Document QA、Autonomous Research Agent、DevOps Troubleshooting Agent、Speculative-Decoding Inference Server、GitHub Issue-to-PR Autonomous Agent 等。(GitHub)这说明项目最终目标不是“学完理论”而是让学习者能交付真实 AI 工程产品。三、关键功能解析与技术破局1. 从“碎片化 AI 学习”变成“工程化主线”很多 AI 学习资料存在一个问题今天学一点 Prompt Engineering明天学一点 RAG后天看一篇 Transformer 论文再之后照着教程调一个模型。知识很多但缺少主线。该项目的技术破局在于它把 AI 工程拆成 20 个连续阶段数学基础 → 机器学习 → 深度学习 → CV / NLP / Speech → Transformer → GenAI / RL → LLM from Scratch → LLM Engineering → Multimodal → Tools Protocols → Agent Engineering → Multi-Agent → Production → Safety → CapstoneREADME 中也明确指出普通 AI 材料往往是零散的而该课程试图提供一条 spine也就是学习主干。(GitHub)这对于 AI 工程师非常重要。因为真实项目往往不是单一知识点而是算法、数据、模型、系统、部署、安全和产品之间的综合工程。2. Build It / Use It先手写再用框架该项目最有价值的教学思想之一是Build It first, Use It later.README 中说明每一课都会先从原始数学和代码开始实现算法然后再使用 PyTorch、sklearn 等生产框架实现同样功能。这样做的目的是当学习者使用框架时已经理解框架内部到底在做什么。(GitHub)例如学习 Transformer 时不是直接调用transformers库而是先理解Tokenization Embedding Self-Attention Multi-Head Attention Position Encoding / RoPE Feed Forward Network LayerNorm KV Cache Inference Optimization然后再进入 PyTorch / Hugging Face / 推理优化框架。这种路线特别适合希望从“调包工程师”进阶为“AI 系统工程师”的学习者。3. 每课交付 artifact把知识转化为工具项目不是只要求完成代码而是要求每节课都产出可复用 artifact。README 中明确说明每课会产出 prompt、skill、agent 或 MCP server最终会形成 435 个你真正理解的工具。(GitHub)这背后是一个很重要的工程理念学习不是终点工具化才是工程化的开始。例如学习内容可转化产物Linear Regression回归建模调试 promptLoss Functionloss function selector / debuggerRAGRAG evaluation prompt / retriever skillAgent LoopReAct-style agent skillMCPMCP server templateSafetyred-team / guardrail evaluator这使得学习过程不只是“掌握概念”而是逐步形成自己的 AI 工程工具箱。4. 覆盖 LLM 全链路从预训练到生产应用Phase 10 和 Phase 11 是项目中最适合大模型工程学习者重点关注的部分。README 中列出的 Phase 10 包括 Tokenizer、数据管线、Mini GPT 预训练、分布式训练、SFT、RLHF、DPO、Constitutional AI、benchmark evaluation、量化、推理优化、完整 LLM pipeline、Speculative Decoding、Sparse Attention、DualPipe、DeepSeek-V3、Jamba、Async / Hogwild inference 等内容。(GitHub)Phase 11 则进入 LLM Engineering包括 Prompt Engineering、Few-shot、CoT、Structured Outputs、Embeddings、Context Engineering、RAG、Advanced RAG、LoRA / QLoRA、Function Calling、Evaluation、Caching、Guardrails、Production LLM App、MCP、Prompt Caching 等内容。(GitHub)这意味着它覆盖了从模型底层到应用系统的完整路线Tokenizer → Pretraining → SFT / RLHF / DPO → Quantization → Inference Optimization → RAG → Tool Use → MCP → Production LLM App → Guardrails → Evaluation对于想做 LLM 系统、RAG 应用、Agent 工程、模型推理优化的人来说这部分非常有参考价值。5. 面向 Agent 与 MCP 的新一代 AI 工程范式该项目不是停留在传统机器学习课程而是专门覆盖了 Agent Engineering、Tools Protocols、Autonomous Systems 和 Multi-Agent Swarms。README 中举了一个 Phase 14 的样例约 120 行纯 Python、无依赖实现一个 agent loop。该 loop 会维护历史消息、调用 LLM、检测 tool calls、执行工具并把结果写回历史直到返回最终回答或超过步数限制。(GitHub)这个例子非常关键因为它揭示了 Agent 系统的本质LLM 不再只是生成文本 而是在循环中进行推理、调用工具、观察结果、继续执行这也是当前 Claude Code、Cursor、Codex、OpenDevin、OpenHands 等工具背后的核心范式。6. 课程质量工程脚本化检查与 CI 约束该项目不仅课程规模大还加入了课程质量检查机制。README 中说明贡献 lesson 前需要运行python3 scripts/audit_lessons.py python3 scripts/audit_lessons.py --phase 14 python3 scripts/audit_lessons.py --json这些脚本会检查目录结构、docs/en.md、H1 标题、code/非空、quiz.jsonschema、相对链接等规则规则失败时会返回非零退出码。(GitHub)此外2026 年 5 月 20 日的提交记录显示项目还在持续加入 README counts drift check、strict CI、link check script、lesson_run.py 等工程化检查机制。(GitHub)这说明项目不是随意堆课程而是尝试用工程方式维护课程一致性。四、使用教程方式一在线阅读项目 README 推荐的第一种方式是直接在线阅读。用户可以打开官方网站aiengineeringfromscratch.comREADME 中说明在线阅读无需克隆仓库也不需要配置环境可以直接打开已完成课程或展开某个 phase 查看内容。(GitHub)适合人群想先浏览课程体系 不想本地安装环境 希望快速判断是否适合自己方式二本地克隆并运行代码如果希望完整运行课程代码可以使用 Git 克隆仓库git clone https://github.com/rohitg00/ai-engineering-from-scratch.git cd ai-engineering-from-scratchREADME 中给出的示例是运行 Phase 1 中的向量代码python phases/01-math-foundations/01-linear-algebra-intuition/code/vectors.py该方式适合想真正动手学习的用户。(GitHub)方式三使用内置 Agent Skills 找到学习起点如果你已经在使用 Claude、Cursor、Codex、OpenClaw、Hermes 或支持 SkillKit 的 Agent可以使用项目内置技能/find-your-levelREADME 中说明这个命令会通过 10 个问题评估你的知识水平然后映射到适合的起始 phase并生成带有时间估计的个性化路径。(GitHub)完成某个 phase 后可以使用/check-understanding 3该命令会对指定 phase 进行 8 题测验并给出反馈和需要复习的课程。(GitHub)推荐学习路径如果你是 AI 初学者可以按顺序学习Phase 0 → Phase 1 → Phase 2 → Phase 3 → Phase 7 → Phase 10 → Phase 11如果你已有机器学习基础只想做 LLM 工程可以从Phase 7 Transformers Phase 10 LLMs from Scratch Phase 11 LLM Engineering Phase 13 Tools Protocols Phase 14 Agent Engineering Phase 17 Infrastructure Production如果你关注多模态大模型可以重点看Phase 4 Computer Vision Phase 5 NLP Phase 6 Speech Audio Phase 7 Transformers Phase 12 Multimodal AI Phase 19 Capstone Projects如果你关注 Agent 和工程部署可以重点看Phase 11 LLM Engineering Phase 13 Tools Protocols Phase 14 Agent Engineering Phase 15 Autonomous Systems Phase 16 Multi-Agent Swarms Phase 17 Infrastructure Production Phase 18 Ethics Alignment五、适合哪些人这个项目适合以下几类用户用户类型推荐理由AI 初学者有完整阶段路线不容易碎片化学习机器学习工程师可以补齐 LLM、RAG、Agent、MCP、Production 能力后端 / 全栈工程师可以从工程角度切入 AI 系统研究生 / 科研人员适合系统补充 LLM、Transformer、推理优化和 Agent 工程AI 产品工程师可以理解从模型到应用交付的完整链路想做作品集的人Phase 19 提供端到端项目方向六、项目优势与局限优势第一体系完整。它从数学基础一路覆盖到 Agent、MCP、多智能体和生产部署适合形成系统知识框架。第二强调从零实现。每个算法和系统都尽量先手写再使用生产框架有助于理解底层原理。第三每课都有产出。prompt、skill、agent、MCP server 等 artifact 让学习成果可以进入实际工作流。第四工程化程度高。项目包含 roadmap、lesson template、audit script、CI 检查、website 和 glossary不是简单教程堆叠。第五许可证宽松。MIT License 方便个人、教学和团队二次使用。(GitHub)局限第一学习成本较高。项目总时长约 320 小时不适合只想快速调用 API 的用户。(GitHub)第二课程仍在持续建设。虽然很多 phase 已完成但从 changelog 和 commit 记录看项目仍在快速更新需要注意内容变化。(GitHub)第三内容覆盖面非常广学习者需要根据目标裁剪路线否则容易陷入“什么都学一点”的状态。第四部分高级方向例如 LLM 预训练、分布式训练、推理优化、多智能体和安全对齐需要较强的工程背景初学者可能需要额外补充资料。七、总结AI Engineering from Scratch是一个非常值得关注的 AI 工程开源课程项目。它的核心价值不只是“内容多”而是把 AI 学习组织成了一个完整的工程闭环Learn it理解概念与数学基础 Build it从零实现核心算法和系统 Use it使用生产框架复现 Ship it产出可复用工具和真实项目相比普通教程它更强调系统性20 个阶段覆盖 AI 工程主线 实践性每课都有代码实现 工程性每课都有 artifact 输出 前沿性覆盖 LLM、RAG、MCP、Agent、多智能体、安全对齐 可交付性最终通过 Capstone 项目形成作品集对于希望从“AI API 使用者”进阶为“AI 工程师”的学习者来说这个项目的价值很高。它不是让你只会调用模型而是让你理解模型、构建系统、验证效果并最终交付可运行的 AI 产品。八、互动话题如果你准备用这套项目学习 AI Engineering你最想优先学习哪个方向A. 数学基础与机器学习原理 B. Transformer 与 LLM from Scratch C. RAG、Embedding 与向量数据库 D. Agent Loop 与工具调用 E. MCP Server 与协议工程 F. 多模态 AI图像、语音、文档理解 G. LLM 推理优化与部署 H. 多智能体与自主系统 I. AI Safety、Alignment 与 Red Team J. Capstone 项目做一个真正可交付产品欢迎在评论区讨论你认为未来 AI 工程师最核心的能力是“会调模型 API”还是“能从底层理解并构建完整 AI 系统”