
AI原生交付的闭环法则Build→Review→Fix→Verify本文属于「Hermes Agent自进化智能体深度解析」系列 | 模块二 · 第2篇为什么AI写的代码不能直接上线2026年了AI写代码的能力已经很强大。一份研究显示在某些标准化的编码任务中AI生成代码的正确率已经超过90%。但正确率90%和可以上线之间隔着一道巨大的鸿沟。代码正确只是上线的基本门槛。一份生产级代码还需要满足安全性没有注入漏洞、没有敏感数据泄露可维护性代码结构清晰、命名规范、文档完备性能在真实负载下满足响应时间要求兼容性与现有系统正确集成可观测性有足够的日志和监控这就是为什么Hermes Agent的设计中交付不是一个线性过程而是一个闭环迭代过程Build → Review → Fix → Verify ↑ │ └────────────────────────┘Build不只是写代码Build阶段远比大多数人想象的复杂。它不是简单地让AI生成代码而是一个有严格输入输出定义的工程过程。Build的输入一份合格的Build输入必须包含Spec文档来自Spec Card的详细技术规格代码规范项目的编码标准和架构约束依赖清单可用的库、框架和工具测试要求需要满足的测试覆盖率和测试类型Build的执行过程Hermes的Build过程遵循分而治之的策略Goal: 用户匹配API ├── Build Task 1: 数据模型User Profile Schema ├── Build Task 2: 匹配引擎核心算法 ├── Build Task 3: API端点实现 ├── Build Task 4: 数据库查询优化 ├── Build Task 5: 单元测试编写 └── Build Task 6: 集成测试编写每个Build Task都有独立的Done State可以独立验证。这意味着即使某个子任务出了问题也不影响其他子任务的执行和验证。Build的输出Build阶段的输出不仅是代码还包含代码变更清单Changed Files新增依赖列表Dependencies自评报告Self-Assessment已知限制说明Known LimitationsReviewAI世界的代码审查Contract Invariant ReviewHermes的Review不是简单的看看代码有没有bug而是一套结构化的审查体系——Contract Invariant Review契约与不变式审查。审查覆盖六个关键维度1. API Contract ReviewAPI契约审查检查项 - API端点是否符合RESTful规范 - 请求/响应的Schema是否与Spec一致 - 错误码是否完整且语义明确 - 分页参数是否统一 - 认证和授权是否正确实现2. Schema Review数据模型审查检查项 - 数据库表结构是否满足第三范式 - 索引设计是否覆盖高频查询 - 字段类型和约束是否合理 - 迁移脚本是否可逆3. Event Payload Review事件载荷审查检查项 - 事件数据的完整性 - 事件格式的向后兼容性 - 事件消费者的幂等性4. UI State Review界面状态审查检查项 - 状态管理逻辑是否正确 - 加载/错误/空状态是否都有处理 - 响应式布局是否适配不同屏幕5. Memory Assumptions Review记忆假设审查检查项 - 对记忆层的读写操作是否正确 - 记忆的更新时机是否合理 - 是否存在记忆竞争条件6. Evidence Rules Review证据规则审查检查项 - 日志记录是否充分 - 监控指标是否覆盖关键路径 - 告警阈值是否合理Worker Handoff Protocol工作交接协议Review阶段还有一个关键机制——Worker Handoff Protocol。每当任务从一个角色传递到另一个角色时必须携带完整的交接文档Handoff Document:from:Builder-01to:Reviewer-02contents:-spec:技术规格文档完整版-diff:代码变更差异精确到行-logs:构建过程日志-risk_notes:已知风险和假设条件-verification_criteria:验证标准清单这个协议确保了信息不会在交接过程中丢失。每个角色都能获得做出正确判断所需的全部上下文。Fix不是打补丁是系统性改进问题分级Review发现的问题不是一视同仁的。Hermes使用四级分类体系级别含义示例处理方式Critical必须立即修复否则阻塞发布SQL注入漏洞、数据丢失风险立即修复重新ReviewHigh应当修复不修复有较大风险缺少错误处理、性能瓶颈本轮修复Medium建议修复提升代码质量命名不规范、缺少注释优先修复可延后Low锦上添花的优化代码风格微调、日志级别调整记录下轮迭代处理修复→验证循环每个修复都不是简单的改一下就好。它需要经过定位问题 → 理解根因 → 设计修复方案 → 实施修复 → 验证修复 → 回归测试关键在于回归测试——修复一个问题可能引入新的问题。每次修复后都必须运行全量回归测试确保没有引入回归Bug。Verify最终防线Verify阶段是交付前的最后一道防线。它执行一个全面的验证协议——Verification Cleanup Protocol五项核心检查1. Tests测试验证✓ 运行全量单元测试 ✓ 运行集成测试 ✓ 运行端到端测试 ✓ 测试覆盖率报告生成2. Build构建验证✓ 清理构建Clean Build通过 ✓ 无编译警告 ✓ 产物大小在预期范围内3. Git Status版本控制验证✓ 无未提交的变更 ✓ 无意外的文件修改 ✓ 分支状态正确4. Filesystem Diff文件系统验证✓ 变更文件列表与预期一致 ✓ 无临时文件残留 ✓ 配置文件正确更新5. Runtime Logs运行时验证✓ 无异常错误日志 ✓ 性能指标在预期范围内 ✓ 关键路径日志完整证据报告生成所有验证结果汇总为一份Final Evidence Report最终证据报告Final Evidence Report:goal:构建用户匹配APIworkers:[Builder-01,Reviewer-02]files_changed:12tests:total:47passed:47failed:0coverage:86%review_result:通过risks:-level:lowdescription:高并发场景下可能需要额外优化mitigation:已添加性能监控可后续迭代ship_decision:可发布 ✓这份报告是交付的最终凭证。它用客观数据回答了这个功能可以上线吗这个问题而不是依赖任何人的主观判断。闭环的力量Build→Review→Fix→Verify的闭环设计确保了AI原生交付的质量Build保证功能实现按Spec精确实现附带自评报告Review保证质量标准六大维度的结构化审查Fix保证问题解决分级修复回归验证Verify保证交付就绪五项核心检查证据报告兜底这不是让AI一次做对而是让AI在一个有保障的闭环中逐步做到正确。这才是工程化的交付思维。延伸阅读与交流本文涉及的Hermes Agent自进化智能体技术体系目前已有系统化的深度学习资源可供参考。中国通信工业协会通信和信息技术创新人才培养工程项目办公室将于近期组织相关技术专题分享围绕本文讨论的AI原生架构、智能体工作流、自进化数据层等方向展开系统讲解。专题信息主题AI原生Hermes自进化智能体系统时间2026年7月4-5日周末形式线上直播内容方向AI原生架构 · Hermes智能体拆解 · 全栈扩展 · 智能自动化 · 产品级实战 · Context Engine · 自进化数据层分享嘉宾王老师GavinAgentic AI企业联合创始人兼CTO十余年硅谷AI系统工程经验。长期深耕NLP、强化学习、可控AI与智能体系统架构提出语言即控制Language as Control原创范式在RLHF、PPO、DPO、GRPO等方向有系统化工程实践推动智能体技术在社交媒体、医疗、金融、法律、教育等专业场景落地。技术交流联系人Samweb chatNLP_ChatGPT_LLMHermes Agent技术文档https://hermes-agent.nousresearch.com/docs/