
如果你 2021 年听过 Codex印象大概停留在给 GitHub Copilot 提供底气的那个模型。但到 2026 年中再看Codex 已经不是一个模型了——它是 CLI、云端 Agent、桌面 App、IDE 插件、SDK 组成的产品矩阵底层模型也从 GPT-3 的代码特化版一路迭代到codex-1基于 o3 架构 RL 专项训练和 GPT-5.3-Codex。OpenAI 自己内部的数据显示截至 2026 年 6 月普通员工产出 Token 的85% 以上来自 Codex全公司每周 Token 里 Codex 占99.8%——连律师和招聘都在用它写脚本、做数据转换。这篇文章把 Codex 的来路、内核和当下形态捋一遍。 一条五年的演进线时间节点意义2021初代 Codex 发布基于 GPT-3用 GitHub 公开库约 159GB Python 代码、5400 万 仓库微调给 Copilot 供血2025.4Codex CLI 开源Rust 写的本地终端 Agentnpm 周下载很快冲到百万级2025.5Codex 云端 Agent 研究预览基于云沙箱的并行软件工程智能体先给 Pro/Enterprise6 月开放到 Plus2025.9GPT-5-Codex思考时间动态可调从几秒到 7 小时复杂任务能自己跑半天2026.2Codex 桌面 App macOS 版多 Agent 并行、线程化管理从一个助手升级到代理指挥中心2026.4Codex for almost everything加内置浏览器、电脑操作、远程 SSH往通用 AI 工作台走2026.5–6Goal Mode 转正、Locked Computer Use、Appshots 等锁屏后远程跑任务、一键把应用窗口内容投给 Codex周活从 2026 年 3 月初的 ~160 万涨到 5 月的400 万GitHub 仓库 88k Stars主语言 Rust 占 96.1%。 技术内核它和会写代码的 ChatGPT差在哪很多人对 Codex 的误解是不过是 GPT 写代码更溜。实际上模型只是决策核心之一真正让 Codex 成为产品的是围绕模型的那套工程系统。1. 底层模型codex-1 不是GPT-4o 加几个 Function Callcodex-1 基于o3 架构用强化学习在真实编码任务上专项训练——传统代码模型是监督学习看正确代码codex-1 是让模型在真实环境里跑真实任务按测试通过率、代码质量指标反向更新权重。训练目标三个风格对齐别写出机器味的代码、指令精确遵从、测试驱动迭代跑通为止不是生成完就结束。2. Agent Loop规划 → 执行 → 观察的闭环普通 ChatBot 是输入 → 想 → 输出 → 结束一次性生成不知道代码能不能跑。Codex 的工作方式是把在脑子里想 10 步摊开成一轮一轮可执行、可观察的小决策纯文本纯文本目标 → 构造上下文(Prompt) → 模型决定下一步 → 调工具(读文件/跑命令/改代码) → 真实结果塞回上下文 → 再循环 → 直到模型说可以收工像一个初级工程师坐你电脑前看目录 → 跑一下 → 报错了 → 改 → 再跑 → 直到过。每一步都依赖上一步的真实反馈而不是闭眼一次性答完。3. 云沙箱 并行调度云端 Codex 给每个任务分配一个临时隔离 Linux 环境能装依赖、跑测试、打快照不影响本地。沙箱 并行调度器意味着你可以同时丢三个 Issue 给它一个修后端 bug、一个补前端单测、一个写迁移脚本它并行跑回来给你三个 PR。4. 上下文工程有限的脑容量怎么管Codex 的上下文管理是分层级的短期ContextManager 管当前会话的消息/工具调用/结果超窗口时做智能截断保留头尾删中间或 compaction让模型把前面对话压成摘要项目级读项目根目录的AGENTS.md里面写项目规范、禁区别动 .env、别删 migrations长期会话可持久化到~/.codex/sessions/跨轮次续上5. 安全层审批 沙箱对rm -rf这种危险操作Codex 会弹审批——允许 / 拒绝 / 加入白名单。本地 CLI 还有平台级沙箱macOS 用 SeatbeltLinux 用 container云端本身就是隔离环境。 现在的 Codex 有几种入口该用哪个形态什么时候用IDE 里的补全/聊天补一段函数、问个 API 用法Codex CLI本地项目批量改文件、跑脚本、CI 风格自动化Rust 写的那版npm i -g openai/codex就能装云端 Codex AgentChatGPT 里把一个明确 Issue/PR 丢出去让它自己在云沙箱里跑完回来Codex 桌面 AppmacOS/Windows同时要跟多个代理、多个项目当指挥中心用Codex SDK把自己产品里嵌一个 Codex 能力企业流程里用 顺手提一句 vs Claude Code2026 年这个赛道基本是Codex vs Claude Code 双雄。Claude Code 路径是先有大模型后有 AgentCodex 是 OpenAI 从第一天就为本地终端编程设计的独立产品线。架构哲学上 Codex 更强调云沙箱并行 RL 训练的 codex-1 专用模型Claude Code 则更绑定 Claude 系列模型的推理优势。定价、安全模型、IDE 集成深度各有取舍选哪个多半看你团队已经在哪边生态里。一个判断Codex 这五年的关键词变迁很说明问题早期是生成中期是补全和解释现在是代理执行 工程交付。它已经不太像一个写代码的模型更像 OpenAI 给自己员工和非员工准备的通用 Agent 工作台——代码只是第一个被啃下来的垂直领域2026.4 那波Codex for almost everything内置浏览器、电脑操作、远程 SSH已经露出往更通用方向走的苗头了。 如果想亲手试最轻量的入口是npm i -g openai/codex跑 CLI如果想感受代理那个味儿去 ChatGPT 里开 Codex Agent 丢一个真实 Issue 给它——那种它自己 clone、自己跑测试、自己修、自己开 PR的体感和用 Copilot 补两行代码不是一个物种。