【项目自荐】Agent System Prompt Architect v0.1:让 AI Agent 更稳定地编写系统提示词的 Skill

发布时间:2026/5/22 7:04:21

【项目自荐】Agent System Prompt Architect v0.1:让 AI Agent 更稳定地编写系统提示词的 Skill Agent System Prompt Architect v0.1让 AI Agent 更稳定地编写系统提示词的 SkillGitHubhttps://github.com/CR-730/agent-system-prompt-architect-skill项目简介Agent System Prompt Architect 是一个面向 Codex / Claude Code 风格环境的 Skill用于帮助 AI Agent 为其他 Agent 项目生成可部署的 System Prompt。今天的新版本做了一轮比较大的整理不仅补强了 Skill 本身还补上了中文 README、安装说明、评估用例和自动化 eval runner。现这次更新了什么1. README 改成中文项目首页新版 README 不再只是目录说明而是更明确地说明- 这个 Skill 适合什么场景- 它主要解决哪些 prompt 编写问题- 如何安装和使用- 有哪些核心能力- 当前 eval 结果如何- 为什么 Skill 正文仍然保持英文Skill 本体和 reference 文件仍然保持英文主要是为了让 Agent 在运行时更稳定地理解和执行面向人的项目说明则改成中文方便国内用户阅读。2. 新增 Codex 安装说明新增了.codex/INSTALL.md里面包含- macOS / Linux 安装方式- Windows PowerShell 安装方式- clone symlink / junction 的推荐安装方式- 直接复制安装方式- 验证、更新、卸载步骤安装命令也做了防重复检查避免用户重复执行时把目录套出多层或者误覆盖已有 Skill。3. 新增自动化评估体系这次补了 test/ 目录test/evals.jsontriggers.jsonREADME.md它主要评估两件事- 这个 Skill 会不会在正确场景被触发- 使用 Skill 后生成的 system prompt 质量是否真的比 baseline 更好同时新增了 MIMO 兼容的 eval runnerscripts/run_skill_evals.py可以跑- 输出质量评估- 触发评估- with skill / without skill 对照- 单 case 调试- 多轮 iteration 归档当前内部基准结果- 模型mimo-v2.5-pro- with skill 平均通过率0.917- without skill 平均通过率0.554- 触发评估14 / 14 通过解决的问题让 AI 直接写 system prompt 时常见问题包括- 根据项目名、品牌名乱推角色- 把工具能力写成不存在的 API- 把 schema 字段、class 名、上下游管线词直接塞进 prompt- 生成过长、重复、不可部署的提示词- 把经验偏好写成固定流程- 缺少领域、工具、证据、输出格式和失败处理的判断标准- 输出 system prompt 之前夹带“设计说明”“供你审阅”等非部署内容核心设计- 名称只作为标签不直接作为角色- 稳定事实和判断标准优先- 工具能力和真实工具规格分离- 没有真实 runtime spec 时不虚构 API- 默认直接输出可部署 system prompt- 领域适配使用 checklist但不强行补全所有字段- prompt 技术按需选择而不是越复杂越好- 写完初稿后用 evaluation 清单检查、压缩和修正- README 和测试说明面向用户中文化Skill 正文保持英文以利于 Agent 执行目录结构skills/agent-system-prompt-architect/SKILL.mdagents/openai.yamlreferences/test/evals.jsontriggers.jsonREADME.mdscripts/run_skill_evals.py.codex/INSTALL.md适合谁参考如果你也在做- AI Agent- Codex / Claude Code Skill- system prompt 设计- 多工具 Agent- RAG / research / support / code agent- prompt eval 和自动化评估这个项目应该会有参考价值。GitHubhttps://github.com/CR-730/agent-system-prompt-architect-skill非常欢迎 star也欢迎在 issues 里提建议。我会继续根据真实使用和 eval 结果迭代。

相关新闻