Claude Code / Codex 架构推测 + 可实现版本设计(从0到1复刻一个Agent系统)

发布时间:2026/5/20 5:01:20

Claude Code / Codex 架构推测 + 可实现版本设计(从0到1复刻一个Agent系统) 一、先说结论它们的核心不是“模型”而是一个“Agent运行时系统”很多人以为Claude Code / Codex 更强的模型但官方信息已经很明确能读代码仓库、改文件、执行命令 (Claude)能在 sandbox 里执行任务、并行处理多个任务 (OpenAI) 本质已经不是“生成代码”而是一个运行在真实环境中的Agent系统二、Claude Code / Codex 的真实架构推测还原结合公开信息 实际使用体验可以抽象成用户输入 ↓ Agent Runtime核心系统 ↓ Planner规划 ↓ Executor执行 ↓ Environment环境 ↓ Feedback Loop反馈 ↺循环 核心一句话它们是一个“单Agent循环系统 外部环境驱动”的架构三、核心机制那个最关键的“Agent Loop”官方其实已经给出过线索gather context → take action → verify → repeat(Anthropic) 翻译成人话就是读信息 → 动手做 → 看结果 → 再决定✔️ 完整循环while not done: 读取当前状态 规划下一步 执行动作 观察结果 判断是否成功 回答你最关键的问题❓它们有没有状态 ✅规划 ✅执行 ✅反馈 ✅失败重试 ✅答案全都有而且这是核心能力四、逐层拆解工程级视角1️⃣ Agent Runtime真正的大脑这是最容易被忽略的一层。 它负责控制循环loop管理上下文控制工具调用控制token成本管理任务生命周期 本质LLM ≠ Agent Agent Runtime LLM2️⃣ Planner规划系统Claude Code 有一个非常典型的特征 会生成 TODO / 计划列表 (PromptLayer) 说明它内部做了任务 → 拆步骤 → 逐步执行 可实现版本你可以自己做defplan(task):returnllm( 将任务拆解为步骤列表 {} .format(task)) 这其实就是Plan-and-Execute 模式3️⃣ Executor执行系统区别普通Agent的关键点❌ 普通Agentcall_tool → return✅ Claude Code / Codex- 读文件 - 写文件 - 执行shell - 跑测试 即操作真实环境Environment 官方描述也验证了编辑文件执行命令(Claude) 可实现版本classExecutor:defrun(action):ifaction.typeedit_file:write_file(action.path,action.content)elifaction.typerun_cmd:returnsubprocess.run(action.cmd)4️⃣ Environment环境层核心这是绝大多数人没意识到的 Codex每个任务运行在 sandbox 环境 (OpenAI) Claude Code直接操作本地 repo terminal (labs.adaline.ai) 本质Agent不是在“想” 而是在“与环境交互” 这一步带来的质变能力普通LLMAgent写代码✅✅运行代码❌✅修Bug❌✅自动迭代❌✅5️⃣ Feedback Loop最关键Claude Code 的行为本质请求工具 → 执行 → 返回结果 → 再判断(virtuslab.com) 这就是执行 → 观察 → 判断 → 再执行 可实现版本whileTrue:actionllm(state)resultexecutor.run(action)state.update(result)ifis_done(state):break 这一步就是让模型“用结果修正自己”五、Claude Code vs Codex 架构差异重点 Claude Code偏“规划型Agent”特点单循环single loop (PromptLayer)TODO planning强解释能力 更像一个会思考的工程师 Codex偏“执行型Agent”特点多任务并行parallel tasks (OpenAI)sandbox隔离更偏工程执行 更像一个自动化开发流水线六、你可以自己实现一个“简化版 Claude Code” 最小架构可落地1. Agent Loop 2. PlannerLLM 3. Executor工具 4. State Store 5. Environment本地/容器 代码骨架classAgent:defrun(task):stateinit_state(task)whilenotstate.done:planplanner(state)actionchoose_action(plan)resultexecutor.run(action)state.update(result)returnstate.result七、升级版本结合你的MCP你可以直接升级成Agent → MCP → Tools / Models MCP负责工具抽象多模型调度权限控制fallback 这就是工业级Agent架构八、总结最关键一句话Claude Code / Codex 不是“会写代码的模型”而是“一个运行在真实环境中的闭环Agent系统”。九、给你的一个关键启发非常重要如果你想做更强的Agent❌ 不要再优化promptfew-shot✅ 应该优化环境Environment状态State循环Loop调度Orchestration 因为智能不在模型里而在系统里

相关新闻