Hermes Agent 反思阶段的 3 层反馈闭环:Skill 自主优化实测提升 37% 生成准确率

发布时间:2026/5/20 7:03:17

Hermes Agent 反思阶段的 3 层反馈闭环:Skill 自主优化实测提升 37% 生成准确率 1. 反思阶段不是“复盘会议”,而是 Skill 的实时进化引擎大多数人第一次看到 Hermes Agent 的反思阶段(Reflection Phase),下意识会把它当成一个“事后总结”环节——就像团队每周五下午三点开的站会,大家说说哪里没做好,记个 Action Item,然后下周继续踩同样的坑。我试过三次用这种思路配置 Hermes,结果每次都在上线前 2 小时被 QA 打回:生成的 SQL 漏了 WHERE 条件、调用飞书 API 时没处理 rate limit、甚至把用户传进来的 JSON 字符串直接拼进了 shell 命令里。直到我把reflection.yaml里的max_retries: 3改成1,并把feedback_layers从默认的["execution", "validation"]扩展为["execution", "validation", "integration"],才真正看清这个阶段的本质:它根本不是“复盘”,而是一套嵌在每一次 Skill 调用链末端的三层反馈闭环系统。它不等你写完代码再检查,而是在 Skill 执行完第一行、验证完第一个断言、集成进主流程跑通第一个真实请求之后,就立刻触发三轮不同粒度的自我校验与参数重写。这个闭环的威力,在我们重构一个 PDF 证卡拼版模块时暴露得最彻底。旧版靠人工维护的pdf-layout-skill在处理带中文水印的双面卡片时,准确率只有 61%;接入三层反馈闭环后,72

相关新闻