
【大模型12步学习路线 · 第9步 · ②代码篇】LLM 私有化部署实战:Ollama / vLLM / SGLang + LiteLLM + Docker Compose 一键起系列定位:「大模型正确学习顺序」12 步系列第 9 步 · 私有化部署的 ②代码篇。前置阅读:①原理篇 —— 2026 推理引擎格局 + 模型选型。本篇产出:从 Ollama 5 分钟启动 → vLLM/SGLang 生产部署 → LiteLLM Proxy 统一接口 → Docker Compose 整套栈 → Prometheus 监控,全部可复制可运行。🚀 0. 部署阶梯:从开发到生产🧪 L1: Ollama(5 分钟个人使用)🚀 L2: vLLM 单卡(生产小流量)🌟 L3: SGLang 多卡(生产 + agent 优化)