
前言项目简介随着 Claude Code、Cursor、Codex、GitHub Copilot 等 AI Coding 工具逐渐进入真实开发流程开发者开始面临一个新问题只让 AI 写代码还不够如何让 AI 像一个工程团队一样分工、协作、审查和交付开源项目revfactory/harness正是围绕这个问题展开的。它不是一个传统意义上的代码库框架也不是单个 Agent而是一个面向 Claude Code 的 “Team-Architecture Factory”即“团队架构工厂”。用户只需要告诉 Claude CodeBuild a harness for this project或者描述自己的业务场景例如Build a harness for comprehensive code review.Harness 就会根据当前项目或领域需求自动生成一套专用的 Agent Team 和配套 Skills并将它们写入项目的.claude/agents/与.claude/skills/目录中。发布时间(v1.0.0)2026-03-27一、项目定位Harness 到底解决什么问题在使用 Claude Code 处理复杂项目时用户常常会遇到以下问题一个 Agent 处理所有任务职责过重复杂任务缺少稳定分工代码生成、审查、测试、文档之间没有明确协作机制每次都要重新设计 prompt 和工作流AI 输出质量不稳定尤其在复杂任务中容易遗漏边界条件。Harness 的设计思路是领域描述 → 任务类型识别 → 团队架构设计 → Agent 定义生成 → Skill 生成 → 协作协议编排 → 验证与测试这意味着它将 AI 编程从“单 Agent 执行任务”升级为“多 Agent 团队协作”。二、项目框架设计从仓库结构看Harness 的核心非常清晰主要由插件清单、核心 Skill、参考文档和项目说明组成。harness/ ├── .claude-plugin/ │ └── plugin.json ├── skills/ │ └── harness/ │ ├── SKILL.md │ └── references/ │ ├── agent-design-patterns.md │ ├── orchestrator-template.md │ ├── team-examples.md │ ├── skill-writing-guide.md │ ├── skill-testing-guide.md │ └── qa-agent-guide.md ├── docs/ ├── README.md ├── README_KO.md ├── README_JA.md ├── CHANGELOG.md ├── CONTRIBUTING.md └── LICENSE1..claude-plugin/plugin.json插件元信息该文件定义了插件名称、版本、作者、协议、关键词和项目描述。其中最核心的描述是The team-architecture factory for Claude Code也就是说Harness 是一个 Claude Code 插件专门用于把领域描述转化为 Agent Team 与 Skills。关键词中包含agent-team skill-architect meta-skill orchestration multi-agent pipeline fan-out-fan-in expert-pool producer-reviewer supervisor hierarchical-delegation这些关键词基本概括了项目的核心能力多 Agent、技能生成、团队编排和架构模式。2.skills/harness/SKILL.md核心元技能SKILL.md是 Harness 的核心逻辑文件。它不是普通技能而是一个“元技能”。普通 Skill 解决具体问题例如写文档、审查代码、生成测试而 Harness 这个 Skill 的作用是生成其他 Agent 和 Skills。可以理解为普通 Skill完成一个任务 Harness生成完成任务所需的 Agent 团队和 Skill 系统它的工作流程包括Phase 0现状审计 Phase 1领域分析 Phase 2团队架构设计 Phase 3Agent 定义生成 Phase 4Skill 生成 Phase 5集成与编排 Phase 6验证与测试 Phase 7运行后的演化维护这使 Harness 更像一个“AI 团队架构师”。3.references/架构模板与方法论资料references/目录是项目知识库主要包含文件作用agent-design-patterns.md6 种 Agent 团队架构模式说明orchestrator-template.md团队/子代理编排模板team-examples.md真实团队配置示例skill-writing-guide.mdSkill 编写方法skill-testing-guide.mdSkill 测试与评估方法qa-agent-guide.mdQA Agent 集成指南这些文件决定了 Harness 的工程质量。它不是简单写几个 prompt而是把 Agent 团队设计方法、技能编写规范、测试验证方法都整理成了可复用模板。三、核心架构6 种 Agent Team 模式Harness 最重要的能力是内置了 6 种团队架构模式。1. Pipeline流水线模式适用于强依赖的顺序任务。例如需求分析 → 方案设计 → 代码实现 → 测试验证 → 文档生成每个 Agent 负责一个阶段前一阶段的结果作为后一阶段的输入。适合场景全栈开发文档生成数据处理流程迁移任务复杂工程任务拆解。2. Fan-out/Fan-in并行分发与汇总模式适用于可以并行分析的问题。例如代码审查场景架构审查 Agent 安全审查 Agent 性能审查 Agent 测试审查 Agent 代码风格审查 Agent ↓ 汇总 Agent 输出统一报告这种模式的优势是提升覆盖面避免单 Agent 审查视角过窄。适合场景代码审查论文调研竞品分析多角度风险评估多模块并行检查。3. Expert Pool专家池模式适用于任务类型不固定需要按需调用不同专家的场景。例如一个复杂项目中可能需要数据库专家 前端专家 后端专家 安全专家 DevOps 专家 测试专家Supervisor 或 Orchestrator 根据当前问题选择合适的专家而不是每次都让所有 Agent 参与。适合场景大型项目维护多技术栈系统故障排查长期工程助手。4. Producer-Reviewer生成-审查模式适用于需要质量控制的产出型任务。典型流程Producer Agent 生成初稿 Reviewer Agent 审查问题 Producer Agent 根据反馈修改 Finalizer Agent 输出最终版本这种模式非常适合防止 AI “一次性生成但质量不可控”的问题。适合场景代码生成技术文档PR 描述论文摘要产品方案测试用例生成。5. Supervisor监督者模式适用于动态任务分配。一个 Supervisor Agent 负责理解目标 拆解任务 分配给不同 Agent 跟踪状态 处理失败 合并结果 输出最终答案这种模式类似真实团队中的技术负责人或项目经理。适合场景长流程项目多步骤工程任务需求不完全明确的开发任务需要动态调整执行路径的复杂任务。6. Hierarchical Delegation层级委派模式适用于规模更大、任务可递归拆解的系统。例如总负责人 Agent ├── 前端负责人 Agent │ ├── UI Agent │ └── 状态管理 Agent ├── 后端负责人 Agent │ ├── API Agent │ └── 数据库 Agent └── QA 负责人 Agent ├── 单元测试 Agent └── 集成测试 Agent这种结构适合大型复杂任务但也会带来更高的编排成本。适合场景大型系统设计多模块项目重构企业级软件开发复杂研究报告多角色内容生产流程。四、关键功能解析与技术破局1. 从“写代码”转向“设计 AI 团队”大多数 AI 编程工具关注的是用户提出需求 → AI 直接写代码而 Harness 关注的是用户提出领域目标 → AI 先搭建团队 → 团队再协作完成任务这是一种明显的范式变化。它解决的不是“某段代码怎么写”而是“复杂任务应该由哪些 AI 角色协作完成”。2. 自动生成.claude/agents/与.claude/skills/Harness 的输出不是简单文本而是项目中的 Claude Code 配置资产。生成后的项目结构类似your-project/ ├── .claude/ │ ├── agents/ │ │ ├── analyst.md │ │ ├── builder.md │ │ └── qa.md │ └── skills/ │ ├── analyze/ │ │ └── SKILL.md │ └── build/ │ ├── SKILL.md │ └── references/这意味着 Harness 生成的结果可以在后续 Claude Code 会话中继续复用而不是一次性 prompt。3. Agent 和 Skill 分离Harness 强调 Agent 与 Skill 分离Agent谁来做 Skill怎么做 Orchestrator如何协作这种设计很重要。因为在真实工程中角色和方法应该分离一个 QA Agent 可以复用多个测试 Skill一个 Builder Agent 可以调用多个实现 Skill一个 Reviewer Agent 可以根据任务使用不同审查模板。这种结构更接近工程化系统而不是零散提示词集合。4. Progressive Disclosure控制上下文加载AI Coding 工具的一个常见问题是上下文过载。如果每个 Agent 一开始就读取所有文档、所有规则、所有模板会浪费上下文窗口也会降低推理质量。Harness 通过 Skill 的 Progressive Disclosure 机制将主要信息放在SKILL.md将更详细的模板、指南和案例放在references/中按需加载。这种设计可以减少无关上下文让 Agent 在需要时再读取细节。5. 编排协议让 Agent 之间真正协作Harness 不只是生成多个 Agent 名字还会考虑Agent 之间如何传递数据谁负责汇总结果谁负责质量检查失败时如何处理是否使用 Agent Teams是否使用 Subagents是否采用 Hybrid 模式。在 Claude Code Agent Teams 模式下Agent 可以通过TeamCreate、SendMessage、TaskCreate等机制进行协作。这让多 Agent 不再只是“多个并行 prompt”而是具备团队通信和任务协调的结构。6. Validation验证生成的团队是否有效Harness 的工作流中包含验证阶段重点包括触发词是否有效 技能是否能被正确调用 Agent 定义是否完整 团队协作协议是否清晰 有 Skill 与无 Skill 的效果对比 dry-run 测试这对 AI Agent 工程非常关键。因为生成 Agent 本身并不难难的是生成之后是否真的能在项目中稳定触发、稳定协作、稳定产出。7. Harness 不是固定系统而是可演化系统项目的核心 Skill 中强调Harness 不是固定物而是会随着执行反馈持续演化。也就是说当某个 Agent 不好用、某个 Skill 触发不稳定、某个团队结构不合理时可以继续让 Harness 审计和修改现有.claude/agents/与.claude/skills/。这让它更像一个长期维护的 AI 工程系统而不是一次性脚手架。五、使用教程1. 前置要求Harness 当前主要面向 Claude Code并要求启用 Agent Teamsexport CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS1如果没有启用 Agent Teams也可以使用 Subagents 模式但 Harness 默认推荐 Agent Teams因为多个 Agent 之间需要协作、通信和任务协调。2. 通过 Marketplace 安装在 Claude Code 中执行/plugin marketplace add revfactory/harness然后安装插件/plugin install harnessharness-marketplace安装完成后就可以在 Claude Code 中使用 Harness。3. 直接作为全局 Skill 安装如果你不通过插件市场也可以把项目中的 Skill 拷贝到本地 Claude Code Skills 目录git clone https://github.com/revfactory/harness.git cd harness cp -r skills/harness ~/.claude/skills/harness这种方式适合想手动查看和修改 Skill 内容的用户。4. 基础使用方式进入你的项目目录后打开 Claude Code然后输入Build a harness for this project或者Design an agent team for this domain也可以输入更具体的任务描述Build a harness for full-stack website development. The team should handle design, frontend, backend, API, and QA testing.Harness 会分析你的项目或需求并生成对应的 Agent Team 与 Skills。5. 代码审查场景示例如果你希望为项目生成一个多 Agent 代码审查团队可以输入Build a harness for comprehensive code review. I want parallel agents checking architecture, security vulnerabilities, performance bottlenecks, testing coverage, and code style, then merging all findings into a single report.可能生成的团队结构如下code-review-supervisor ├── architecture-reviewer ├── security-reviewer ├── performance-reviewer ├── testing-reviewer └── style-reviewer输出目录可能如下.claude/ ├── agents/ │ ├── code-review-supervisor.md │ ├── architecture-reviewer.md │ ├── security-reviewer.md │ ├── performance-reviewer.md │ ├── testing-reviewer.md │ └── style-reviewer.md └── skills/ ├── architecture-review/ ├── security-review/ ├── performance-review/ ├── testing-review/ └── report-synthesis/这样后续你就可以让 Claude Code 使用这套专用审查团队来处理 PR、重构和代码质量检查。6. 技术文档场景示例如果你希望自动生成 API 文档可以输入Build a harness that generates API documentation from this codebase. Agents should analyze endpoints, write descriptions, generate usage examples, and review for completeness.可能生成的团队结构api-analyzer doc-writer example-generator doc-reviewer documentation-orchestrator这种方式比单纯让 AI “帮我写文档”更稳定因为它拆分了分析、撰写、示例生成和质量审查等环节。7. 深度研究场景示例如果用于研究任务可以输入Build a harness for deep research. I need an agent team that can investigate any topic from multiple angles, including web search, academic sources, community sentiment, then cross-validate findings and produce a comprehensive report.可能采用的模式是 Fan-out/Fan-inacademic-research-agent web-research-agent community-sentiment-agent fact-check-agent report-synthesis-agent这种结构适合论文调研、竞品分析、技术路线比较等任务。六、适合哪些用户Harness 适合以下用户已经在使用 Claude Code 的开发者需要多 Agent 协作处理复杂任务的团队想把 AI 编程流程工程化、模板化的开发者需要构建专用 AI 工作流的技术负责人关注 Agentic Coding、AI Workflow、Multi-Agent System 的研究者想为项目沉淀.claude/agents/和.claude/skills/的团队。如果你只是偶尔让 AI 写一个小脚本Harness 可能显得偏重。但如果你的任务涉及长期项目、复杂模块、多角色审查或持续协作它的价值会更明显。七、项目优势与不足优势第一定位清晰。Harness 不和通用 Agent 框架抢定位它专注于 Claude Code 生态中的团队架构生成。第二模式抽象完整。项目内置 6 种常见团队协作模式覆盖流水线、并行汇总、专家池、生成审查、监督者、层级委派等典型场景。第三输出可复用。它生成的是.claude/agents/和.claude/skills/文件而不是一次性回答。这使得团队配置可以沉淀到项目中。第四适合复杂任务。对于代码审查、文档生成、研究分析、全栈开发等任务多 Agent 分工比单 Agent 更容易覆盖完整链路。第五重视验证。项目不仅生成 Agent 和 Skills还强调触发验证、dry-run 测试、with-skill vs without-skill 对比。不足第一目前官方运行环境主要是 Claude Code。如果你主要使用 Codex、Cursor 或其他 Agent 平台需要寻找兼容方案或参考相关移植项目。第二上手需要理解 Claude Code 的 Agent Teams 机制。如果用户不了解.claude/agents/、.claude/skills/、Agent Teams、Subagents 等概念初次使用会有一定学习成本。第三多 Agent 不一定总是更好。对于简单任务单 Agent 直接完成可能更高效。Harness 更适合复杂任务、长期项目和团队化协作场景。第四生成结果仍然需要人工审查。Harness 可以生成团队架构但生成的 Agent 定义和 Skill 内容是否真正适合你的项目仍需要开发者检查和迭代。八、总结revfactory/harness是一个很有代表性的 Claude Code 插件项目。它的核心价值不是“让 AI 写一段代码”而是让 AI 帮你设计一套可复用的多 Agent 工程团队。它把 AI 编程流程从用户提问 → AI 回答推进到用户描述领域 → Harness 生成团队 → Agent 协同执行 → Skill 沉淀复用 → 持续演化这代表了 AI Coding 的一个重要方向从单点代码生成走向多 Agent 协作从临时 prompt走向可复用工程资产从“AI 助手”走向“AI 工程团队”。对于正在使用 Claude Code 的开发者来说Harness 非常适合用于代码审查 文档生成 全栈开发 研究报告 数据管道设计 营销内容生产 复杂项目自动化如果你正在探索 Agentic Engineering、Claude Code Plugin 或 AI 软件工程自动化revfactory/harness是一个值得深入研究的项目。互动话题你认为未来 AI 编程最有价值的形态是哪一种单 Agent 快速生成代码多 Agent 分工协作AI 自动生成项目级工作流人类负责架构判断AI 团队负责执行每个项目都拥有自己的专属 AI 工程团队。欢迎在评论区分享你的观点。