
摘要YC CEO Garry Tan 开源了他的软件工厂gstack——把 Claude Code 变成 15 个专家角色组成的虚拟工程团队。从需求逼问到并行部署一套完整的研发流水线帮他在兼职状态下每天产出 1-2 万行生产代码。MIT 协议30 秒安装免费。大家好我是顾北三个月前Garry Tan 发了一条推特让我看了好几遍。他说自己在过去 60 天写了超过60 万行生产代码。每天 1 到 2 万行。而这只是他在担任 Y Combinator CEO 的同时兼职完成的。我的第一反应是这不可能。第二反应是就算用 AI这个数字也……很离谱吧然后我去看了他开源的这个仓库gstack。看完之后我信了。一个人等于一支团队gstack 的核心想法很简单但执行起来很有讲究把 Claude Code 变成你真正可以管理的虚拟工程团队。注意真正可以管理这几个字。用过 Claude Code 的人都知道裸跑 AI 写代码是什么感觉——你说帮我写个用户认证模块AI 会洋洋洒洒给你一堆代码但架构合不合理不知道有没有生产级的安全漏洞不知道测试写了吗可能没写文档更新了吗肯定没更新这个功能真的是你该做的吗没人问过你这些问题在真实团队里分别由架构师、安全工程师、QA、技术写作、和产品经理来把关。gstack 做的就是把这些角色全部用 Slash 命令封装进来形成一套完整的研发流水线。15 个专家角色 6 个超级工具gstack 的核心是一个工作流// 思考 → 计划 → 构建 → 审查 → 测试 → 发布 → 反思 Think → Plan → Build → Review → Test → Ship → Reflect每个阶段有对应的命令每个命令的产出会自动流入下一个阶段。我来重点讲几个让我眼前一亮的/office-hours在写代码之前先逼你想清楚这是整个流程的起点也是最容易被忽视的一步。你告诉它我想做一个日历提醒 App。它不会直接开始写代码而是用 6 个强迫性问题重新框架你的需求。你说的是日历提醒 App但你描述的痛点是多个日历信息分散、会前准备费时、信息经常过期。你其实在构建一个个人 AI 助理而不是一个提醒工具。然后它会生成 3 种实现方案、给出最小可行版本的建议并输出一份设计文档供后续所有命令读取。这个命令的逻辑跟真实的 YC Office Hours 如出一辙——先杀掉错误方向再讨论怎么走。/plan-eng-review不是 AI 帮你画图是 AI 帮你暴露假设工程评审做得好不好关键在于有没有把隐藏的技术假设逼出来。这个命令会生成数据流的 ASCII 架构图状态机和错误路径安全考量清单测试矩阵最关键的是它会主动挑战你的设计选择问你为什么不用 X、如果 Y 挂了怎么办。/qa给 AI 一双真实的眼睛这是 gstack 里技术含量最高的部分也是 Garry 说的最大的解锁。/qa会打开一个真实的 Chromium 浏览器点进你的 staging URL像真实用户一样操作。找到 bug自动修复生成回归测试再验证。背后的技术实现很有意思gstack 跑了一个长驻的 Chromium daemon第一次启动约 3 秒之后每条命令只需要100-200ms。用的是 ARIA 树 ref 系统e1、e2来定位元素而不是注入 DOM attribute——这样不会被 CSP 策略拦截也不会和 React hydration 冲突。Cookie 也能导入。你在真实浏览器登录的会话可以通过/setup-browser-cookies同步过来直接测试需要认证的页面。/review找那些 CI 通过但上线会炸的 bug很多代码问题不是语法问题是逻辑问题、竞态条件、边界情况。/review专门找这类问题并且分两类处理明显的直接自动修复有争议的标记出来让你决定。/ship一条命令完成发布前的所有准备同步 main 分支 → 跑测试 → 审计覆盖率 → 推送 → 开 PR → 自动调用/document-release更新文档。如果项目没有测试框架它会从零帮你搭建。真正的魔法10-15 个并行 Sprint光有这些命令gstack 只是效率工具。真正让 Garry 能做到每天两万行代码的是配合Conductorconductor.build跑并行 Sprint。想象一下第 1 个 session 在跑/office-hours分析新功能第 2 个 session 在跑/review审查一个 PR第 3 个 session 在实现某个已经规划好的需求第 4 个 session 在跑/qa测 staging 环境第 5-15 个 session 在做其他分支的事这才是一个人等于 20 人团队的关键——不是每个 AI 命令效率更高而是你能同时让 15 个 AI 在干活而你只需要在关键决策点介入。gstack 的流程化设计让并行变得可控每个 Sprint 知道自己在哪个阶段什么时候该停下来等人决策什么时候可以自动继续。没有这套结构10 个并行 Agent 就是 10 个混乱来源。一个值得关注的细节安全设计AI 工具跑代码最让人担心的是搞坏了怎么办。gstack 对这个问题有几层回答**/careful**执行rm -rf、DROP TABLE、git push --force这类破坏性命令前强制警告。**/freeze**调试时把编辑范围锁定在一个目录防止 AI 在修复一个 bug的过程中顺手改了不该改的东西。**/guard**两者合一生产环境操作的最高安全模式。/investigate也有一个铁律3 次修复尝试失败强制停下来重新审视不允许无限循环瞎改。这些设计体现了一个成熟工程师的直觉AI 会犯错关键是别让它犯得太大。安装只需 30 秒在 Claude Code 里粘贴这一行Install gstack: run gitclonehttps://github.com/garrytan/gstack.git \ ~/.claude/skills/gstack cd~/.claude/skills/gstack ./setup需要Claude Code、Git、Bun v1.0就这样。全部是 Markdown 文件没有后台进程不修改你的 PATH不需要额外订阅。MIT 协议永久免费。我的一点观察坦白说我第一次看完这个仓库有种奇怪的感觉。这不像一个开源工具更像一个人的操作系统外化。Garry 把他过去几十年做产品、带团队的肌肉记忆全部编码进了这些 Markdown 文件。每个命令背后都是一套经过验证的工作方法怎么逼问需求、怎么做工程设计、怎么 QA、怎么上线。AI 的能力在快速提升但使用 AI 的方法论才是真正的护城河。那些随便让 AI 写代码的人和那些用结构化流程驾驭 AI的人产出质量会越来越大。gstack 是目前我见过把这个方法论落地最彻底的工具。如果你在用 Claude Code或者在认真思考怎么用 AI 提升研发效率这个仓库值得花一个下午认真看。仓库地址https://github.com/garrytan/gstack你现在每天用 AI 写多少行代码欢迎评论区聊聊你的工作流。我是顾北关注我获取更多AI前沿动态我们下期再见