Loop Engineering彻底改写AI编程:不用手写提示词,让AI自主循环干活

发布时间:2026/6/15 21:58:19

Loop Engineering彻底改写AI编程:不用手写提示词,让AI自主循环干活 文章目录AI编程又双叒变天了这次连提示词都不用写了Loop Engineering到底是个啥AI编程的三次革命从打字员到架构师Loop的核心原理AI的五环之歌最重要的哲学别把记忆交给AI的脑子Loop的六大核心要素AI的六脉神剑1. Automations自动化让AI按时打卡上班2. Worktrees工作树给每个AI配独立办公室3. Skills技能给AI写本员工手册4. Connectors连接器让AI接入现实世界5. Sub-agents子代理自己写代码自己找茬6. State状态Loop的记忆脊柱闭环 vs 开环新手别一上来就搞自动驾驶实战案例搭一个自动修CI的Loop步骤1创建Skill代码修复技能步骤2定义子Agent步骤3配置MCP连接器步骤4创建GitHub Actions工作流步骤5初始化状态文件成本与安全Loop不是免费的午餐写在最后P.S. 目前国内还是很缺AI人才的希望更多人能真正加入到AI行业共同促进行业进步增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow教程通俗易懂高中生都能看懂还有各种段子风趣幽默从深度学习基础原理到各领域实战应用都有讲解我22年的AI积累全在里面了。注意教程仅限真正想入门AI的朋友否则看看零散的博文就够了。AI编程又双叒变天了这次连提示词都不用写了6月7号谷歌工程师Addy Osmani扔出一篇文章AI编程圈直接炸锅。文章标题叫《Loop Engineering》。我第一眼还以为是循环工程——好家伙大学计算机课里那个让我挂科的while循环现在又回来找我了结果看完才发现这次不是循环找你是AI自己循环自己。你躺平它加班。OpenAI的Peter Steinberger说“你不应该再给编程Agent写提示词了。你应该设计一套循环机制让这些循环去提示你的Agent。”Claude Code负责人Boris Cherny更绝“我不再提示Claude了。我有一堆循环在运行它们才是在提示Claude。我的工作变成了写循环。”翻译成人话就是以前咱们是AI的打字员现在咱们是AI的包工头。以前你一句一句哄着AI干活现在你给AI画个跑道它自己一圈一圈跑跑到你满意为止。这感觉就像什么呢就像你以前养了一条狗每天手把手教它握手。现在你直接建了个狗乐园狗自己进去跑跑完还知道回来报告今天握了多少次手。更扎心的是这条狗不要狗粮只要API额度。跑一圈几块钱跑一百圈就是几百块。养AI比养狗贵多了。Loop Engineering到底是个啥用大白话讲Loop Engineering就是**让AI自己给自己布置作业、自己检查作业、自己改作业直到全对为止**。传统模式是啥样的你→提示词→AI→你看结果→新提示词→AI→你再看看……循环的控制者是你。你就像个监工AI每砌一块砖你都要看一眼。Loop Engineering模式呢你→设计循环系统→系统→系统自动发现工作→自动分派任务→自动检查结果→自动记录状态→自动决定下一步→系统新提示词→AI→……循环的控制者变成了系统。你从一个搬砖监工升级成了**建筑公司CEO**。这有点像管理学里的PDCA循环但PDCA是人来转的Loop Engineering是机器自己转的。就像你以前骑自行车现在换成了自动驾驶。当然前提是你得先把路修好。路修歪了自动驾驶也能给你开进沟里。而且开进沟里的速度比手动驾驶快十倍。所以别觉得Loop Engineering就是躺赢。它更像是——你以前是厨子亲自炒菜现在你是餐厅老板雇了一群AI厨子。菜炒糊了客人骂的还是你。## 四层技术栈Loop站在金字塔尖 ** Prompt层**解决怎么问——角色设定、输出格式、示例。就像你教AI怎么说话。Context层解决让AI看到什么——RAG、记忆管理、文件检索。就像你给AI配眼镜。Harness层解决AI在什么环境里工作——工具调用、沙箱、权限控制。就像你给AI配工具箱。Loop层解决AI做完一步后怎么办——自动检查、修正、继续、停止。就像你给AI装了个大脑让它自己思考下一步。Loop Engineering不是替代下面三层而是**站在它们肩膀上**。就像金字塔尖的那块石头没有下面三层它也得掉下来砸你脚。AI编程的三次革命从打字员到架构师这三年AI编程经历了三次大升级每次都在刷新我们对程序员这个词的理解。2023年Prompt Engineering。那时候程序员的新title叫提示词工程师。你精心雕琢每一个prompt就像给皇上写奏折一样生怕哪个词用错了AI就给你胡来。生产力提升2-3倍但局限性很明显单轮对话、上下文有限、每一步都需要你人工干预。2025年Context Harness Engineering。这时候大家发现光会写提示词不够还得给AI配环境、配工具、配上下文。程序员变成了AI环境设计师。生产力提升到5-8倍但还得人工协调验证。2026年Loop Engineering。现在连协调验证都不需要你了。程序员正式升级为AI系统架构师。生产力直接干到10-20倍。这三次升级本质上就是**从手艺活到规则制定的跃迁**。以前你是工匠现在你是立法者。打个比方2023年你是饭店大厨亲自炒菜2025年你是中央厨房管理员配好调料包让AI炒2026年你直接开了个连锁餐厅AI自己买菜、炒菜、上菜、收桌子你只需要看看财务报表。当然财务报表要是不好看那说明你的规则有问题不是AI的锅。AI不会背锅锅都是你的。而且说实话这三次升级的速度比我头发掉得还快。2023年我还在学怎么写prompt2026年我已经在教AI怎么自己写prompt了。再过两年是不是AI要教我做人了Loop的核心原理AI的五环之歌Addy Osmani给Loop设计了一个通用五阶段循环我管它叫**“AI的五环之歌”**——Discover、Plan、Execute、Verify、Iterate。唱完一轮不行就再来一轮。Discover发现AI自己扫描代码库发现CI失败了、有新Issue了、代码审查有评论了。就像你雇了一个自动巡逻的保安24小时盯着仓库还不打瞌睡。Plan计划把目标分解成具体步骤明确约束和依赖关系。AI自己写TODO清单自己排优先级。以前你写TODO现在AI写TODO你只管看。Execute执行编辑代码、运行工具、提交更改、打开PR。AI开始搬砖。而且它不喊累不喝水不上厕所不刷抖音。Verify验证根据客观信号检查结果——测试通过了吗lint干净了吗类型检查过了吗性能达标了吗AI自己给自己打分。Iterate迭代验证失败自动修复问题重新循环。验证成功进入下一个任务或停止。这五个阶段不管是单Agent还是多Agent都遵循完全相同的循环直到满足可验证的停止条件。说白了这就是把以前你手动干的活——看报错、想方案、改代码、跑测试、不行再改——全部自动化了。你以前是个手动档司机现在换成了自动驾驶。不过自动驾驶也得有地图。Loop的地图就是状态文件。没有地图AI就像个没导航的外卖小哥在代码库里乱窜。最重要的哲学别把记忆交给AI的脑子Loop Engineering最核心的思想就一句话不要信任模型的上下文窗口作为持久化存储。为什么因为模型会遗忘会漂移会压缩信息导致约束丢失。你跟AI聊久了它就像个金鱼——七秒记忆。你前面叮嘱的编码规范聊到后面它全忘了给你整出一堆花活。所以企业级最佳实践是所有状态都存在外部系统里——git仓库、markdown文件、数据库、issue跟踪系统。每次循环都从一个全新的上下文窗口开始但基于实际持久化的内容工作。这就好比你跟同事交接工作你不能指望他记住三个月前你说的每一句话你得写文档。AI也一样文档才是它的真大脑上下文窗口只是它的短期记忆。最原始的Ralph Loop就深谙此道只用了一行bash代码就让AI永无止境干活while:;docatPROMPT.md|claude-code;done这行代码啥意思每次循环都重新读取PROMPT.md和当前代码库状态完全忽略之前的对话历史。简单粗暴但有效。当然国内朋友看到这里先别激动。这个玩法在2025年的AI能力下你跑一圈可能够你吃顿火锅的钱。白烧钱不值得。除非你是土豪那当我没说。Loop的六大核心要素AI的六脉神剑Addy Osmani指出所有现代AI编码工具Claude Code、Codex等都已经内置了Loop Engineering所需的六大核心要素。掌握了这六脉神剑你就能在任何AI工具里设计出有效的循环。六脉神剑一剑更比一剑贵。准备好你的API额度了吗1. Automations自动化让AI按时打卡上班自动化是把一次性AI运行变成真正循环的关键。你可以指定任务何时运行、运行频率、在什么环境下运行。比如每天早上7点半自动处理前一天的bug每当有新PR打开时自动审查代码每2小时检查一次性能基准每周五下午5点自动生成CHANGELOG。AI终于也体验到了**996的快乐**——而且它没有怨言不会摸鱼不会上厕所刷抖音。它唯一的摸鱼方式就是循环跑太久烧光你的API额度。Claude Code里的写法是这样的# 每天早上6点运行处理CI失败 /loop Run the triage skill on yesterdays CI failures --schedule 0 6 * * * # 运行直到所有测试通过 /goal all tests in test/auth pass and the lint step is clean看到那个/goal了吗这就是停止条件。AI跑到测试全绿为止不绿就一直跑。就像一个不达目的誓不罢休的实习生只不过这个实习生不要工资只要API额度。而且这实习生还不会跟你抱怨老板我加班了。它只会默默烧你的钱烧到你心疼为止。2. Worktrees工作树给每个AI配独立办公室当你同时运行多个AI时最怕什么文件冲突。两个AI同时改同一个文件那场面就像两个厨师抢一口锅菜没炒好锅先砸了。Git工作树Worktrees给每个AI Agent提供了一个独立的工作目录共享相同的仓库历史但不共享文件。每个AI都有自己的独立办公室互不干扰。流程是这样的主分支作为基线→为每个Agent创建独立分支→各Agent在自己的分支上独立干活→工作完成后合并回主分支。这本质上就是把Git那套协作机制搬到了Loop工程里。Git用了20年解决人类协作冲突现在拿来解决AI协作冲突经典永不过时。而且AI之间不会互相甩锅。人类同事合并冲突时可能会说你那段代码写得有问题AI不会它只会默默rebase然后继续跑。Claude Code示例# 在独立的工作树中打开一个会话 claude-code --worktree feature/add-search # 子代理自动使用独立工作树 /subagent Build the search API --isolation worktree3. Skills技能给AI写本员工手册Skills是把项目知识编码到磁盘上的一种方式。包含SKILL.md文件、可选脚本、参考资料用文件夹组织。AI Agent可以在需要的时候调用这些技能而不是每次都重新学习项目约定。这就好比你公司的新员工不用每次入职都重新培训直接发本员工手册自己看。Skills解决的核心问题• 每次会话都要重新解释项目结构——烦不烦就像你每次见朋友都要重新自我介绍一样。• AI经常忘记编码规范和最佳实践——金鱼记忆。你前面说不要用var后面它给你整了十个var。• 相同的错误在不同会话中反复出现——屡教不改。就像你教小孩别摸插座他下次还摸。本质上Skills就是**经验的复用包**。你把你踩过的坑、总结的经验、项目的规范全部写成文档AI每次开工前先读一遍。企业级Skills文件结构示例skills/ database/ SKILL.md scripts/ migrate.sh references/ schema.md api/ SKILL.md testing/ SKILL.md看到没AI也有自己的知识体系。你给它配得越全它干活越靠谱。你啥都不给它就像个没培训就上岗的新员工能把数据库给你删了。4. Connectors连接器让AI接入现实世界连接器基于MCP协议让循环能够跟你在用的工具交互。它是AI告诉你该做什么和AI实际帮你完成了什么之间的关键区别。没有连接器AI就像个只会纸上谈兵的顾问给你一堆建议但啥也干不了。就像你请了个健身教练他只会在旁边说你应该去跑步但绝不陪你跑。有了连接器AI就像个全能助理能发Slack、建Issue、跑CI、查数据库。就像那个健身教练突然变成了你的私人管家不仅能指导你还能帮你订健身房、买蛋白粉、记录训练数据。常见连接器类型GitHub Issues、Jira、Slack、PostgreSQL、AWS、GitHub Actions……MCP协议把M×N的集成问题变成了MN的问题。工具方实现一个MCP Server客户端实现一个MCP Client双方就能互通。就像USB接口你管它是鼠标还是键盘插上就能用。当然前提是你得有USB线。没有线再好的接口也是摆设。5. Sub-agents子代理自己写代码自己找茬最高效的循环设计原则是一个代理负责实现另一个代理负责验证。让编写代码的模型来评判自己的代码就像让学生给自己的考试打分——能靠谱吗他写了个bug然后给自己打满分你还觉得挺好。这叫自我欺骗循环不是Loop Engineering。经典的三层代理协作架构•Orchestrator任务分配与进度管理大管家。就像餐厅经理谁负责炒菜、谁负责端盘子他安排得明明白白。•Maker Agent编写代码、实现功能搬砖的。就像厨师只负责炒菜不管菜好不好吃。•Checker Agent代码审查、测试验证监工的。就像质检员专门挑刺。而且他跟厨师不是一个人所以挑刺比较客观。这种执行者与校验者分离的设计是Loop中最有价值的结构性设计。它提供了让系统无人值守运行所需的**信任基础**。就像工厂里的质检员不能跟生产员是同一个人不然次品率能飙到天上。你让厨师自己尝菜他永远觉得还行能出锅。6. State状态Loop的记忆脊柱模型会遗忘但仓库不会。所有复杂运行循环都依赖外部状态来记住自己的运行阶段——什么已经完成了什么还在跑。常见状态存储方式Markdown文件STATE.md、AGENTS.md、任务队列tasks.json、Issue跟踪系统、数据库。状态文件是整件事的脊柱——它记得试过什么、过了什么、还开着什么所以明早的运行从今天停下的地方接着跑。就像你打游戏时的存档点。没有存档每次开机都得从头打谁受得了AI也一样没有STATE.md它每次循环都像失忆了一样“我是谁我在哪我要干什么”而且STATE.md还能帮你查账。AI跑了多少轮、修了哪些bug、花了多少token全记在上面。就像你的信用卡账单看了心疼但不看更心慌。闭环 vs 开环新手别一上来就搞自动驾驶Loop Engineering有两种基本类型分别适用于不同场景。** 闭环Closed Loop**有明确目标、充足上下文、受限动作、客观反馈、清晰停止条件。适合可验证的任务比如修复CI失败、重构代码、更新依赖。就像你开车有导航、有目的地、有红绿灯。开环Open Loop没有预设停止条件持续探索和学习。适合研究性任务、探索新架构、生成创意方案。就像你开车没导航想去哪去哪但可能开到荒郊野外。我的建议是从闭环开始。只有当你完全掌握了闭环设计并且有足够的预算和评估能力时再尝试开环。就像学开车先学会在封闭场地开再上路。你上来就在高速上搞开环那画面太美我不敢看。而且开环的账单可能比高速违章罚款还贵。实战案例搭一个自动修CI的Loop光说不练假把式。下面带大家搭一个**每天早上自动运行、修复前一天CI失败**的循环。这个案例够实用吧以后你每天早上醒来CI已经修好了PR已经建好了你只需要点个合并。这就是Loop Engineering给你的**“起床惊喜”**。步骤1创建Skill代码修复技能在.claude/skills/code-fixer.md里定义修复规范# Code Fixer Skill ## 目的 快速修复CI中发现的常见问题。 ## 常见问题类型及修复策略 1. 依赖版本不兼容 → 升级/降级对应依赖 2. 语法错误 → 修复语法问题 3. 测试失败 → 修复测试或被测试代码 4. Lint错误 → 自动格式化或修复 ## 工作流程 1. 仔细阅读错误日志 2. 定位问题代码 3. 实施最小必要修复 4. 本地运行测试验证 5. 提交修复并创建PR这个Skill就是AI的维修手册。告诉它看到什么报错怎么修修完怎么验证。就像你给修理工一本说明书他按图索骥不会乱来。步骤2定义子Agent创建.claude/agents/ci-fixer.tomlname ci-fixer description 专注修复CI失败的Agent model claude-3-5-sonnet-20260514 tools [edit, run-command, git, github] skills [code-fixer]再创建审查Agentname code-reviewer description 独立代码审查Agent model claude-opus-4.8 tools [read, github] skills [code-review]注意ci-fixer用的是Sonnet便宜但够用code-reviewer用的是Opus贵但严谨。分工明确该省省该花花。步骤3配置MCP连接器在.mcp.json中配置GitHub连接器{mcpServers:{github:{command:npx,args:[modelcontextprotocol/server-github],env:{GITHUB_TOKEN:${GITHUB_TOKEN}}}}}这就是AI的外部接口。没有它AI只能在自己的小圈子里打转连GitHub的门都进不去。步骤4创建GitHub Actions工作流name:CI Fix Loopon:schedule:-cron:0 6 * * *workflow_dispatch:jobs:fix-ci:runs-on:ubuntu-lateststeps:-uses:actions/checkoutv4-uses:actions/setup-nodev4-run:npm install-g anthropic-ai/claude-code-name:Run CI Fix Loopenv:ANTHROPIC_API_KEY:${{secrets.ANTHROPIC_API_KEY}}GITHUB_TOKEN:${{secrets.GITHUB_TOKEN}}run:|claude-code --worktree ci-fix-$(date %Y%m%d) Use the ci-triage skill to analyze all failed CI runs from yesterday. For each auto-fixable issue: 1. Create a new branch 2. Spawn the ci-fixer subagent to fix the issue 3. Spawn the code-reviewer subagent to review the fix 4. If approved, open a PR with a clear description 5. Update STATE.md with the results Write all findings and actions to STATE.md. -name:Commit state updaterun:|git add STATE.md git commit -m Update CI fix loop state for $(date %Y-%m-%d) || true git push这个工作流每天早上6点准时启动。GitHub Actions是闹钟Claude Code是执行者Worktree是独立办公室Skills是维修手册Sub-agents是分工协作State是工作日志。六脉神剑齐活。你睡觉它干活。你醒来PR已经躺在GitHub里了。这就是传说中的睡后收入——只不过收的不是钱是代码。步骤5初始化状态文件# CI Fix Loop State ## 运行历史 - 暂无运行记录 ## 待处理 - [ ] 等待第一次运行STATE.md刚开始是空的就像新员工的入职档案。跑几次之后里面会记满AI的工作日记今天修了3个bug建了2个PR花了50万token……成本与安全Loop不是免费的午餐Loop Engineering虽然强大但使用不当可能带来高昂的成本和安全风险。Peter Steinberger曾透露其月度Token成本高达**130万美元**。130万够在北京五环外买套房了。他一个月烧掉一套房就为了养AI循环。当然人家是OpenAI的工程师烧的是公司的钱。你烧的是自己的钱所以成本管控是必须的•设置严格的迭代限制永远不要省略max-iterations。不然AI能给你跑到地老天荒账单跑到你哭。就像你出门没关水龙头回家发现水费单够买辆车。•从小规模开始先跑10-20次迭代观察行为再逐步扩大。别一上来就全量那是土豪玩法。咱们普通人先点个试用装。•计算ROI500元的循环节省20小时工作值得。完成30分钟能做的任务不值得。别用大炮打蚊子也别用AI去算11。•用便宜模型简单任务用Sonnet别啥都用Opus。Opus是核武器修个标点符号你也用核武器那成本比请个真人编辑还贵。•监控和警报设置每日API使用警报避免一觉醒来房子没了。就像你设置了信用卡消费限额超过就短信提醒。## 三大陷阱别踩 ** 1. 理解债Comprehension Debt**Loop越快地发布你没写的代码仓库里实际存在的东西和你真正理解的东西之间的鸿沟就越大。一个顺滑的loop只会让这道鸿沟长得更快——除非你去读loop产出的东西。不然半年后你会发现仓库里有一堆你完全看不懂的代码就像你请了个保姆她把你家重新装修了但你不知道开关在哪。2. 认知投降Cognitive Surrender当loop自己跑起来停止持有观点、照单全收它给的东西很有诱惑力。带着判断去设计loop它是解药为了逃避思考去设计loop它是助燃剂。就像你请了私教但你完全不动脑子他说啥你练啥最后练出一身伤。3. 验证盲区无人值守地跑的loop也是无人值守地犯错的loop。把verifier子agent从maker拆出来正是为了让loop的完成了有分量。但即便如此“完成是一个声明不是一个证明。就像你让朋友帮你检查作业他说没问题”但考试时你还是错了。这三条说白了就是一个意思Loop是放大器不是替代品。它放大好工程师的能力也同样放大坏决定的后果。而且因为你盯着的时间更少坏决定的后果来得更快、更隐蔽。就像你买了辆跑车它能让你更快到达目的地也能让你更快撞到树上。关键看你怎么开。写在最后Loop Engineering代表了AI编程范式的一次重要跃迁从人驱动到目标驱动从单次对话到持续迭代从手动操作到系统设计。它不是Harness的替代品而是叠在它之上的一层。杠杆点移动了但工作没有变简单。一个设计良好的loop会放大一个好工程师一个设计糟糕的loop会同样快地放大一个坏决定。对于普通开发者来说现在是开始学习Loop Engineering的好时机。你可以从一个简单的自动化开始——比如每天早上把CI失败分诊进markdown文件——在信任它去开PR之前先看清它的行为。Loop Engineering仍在早期手动直接prompt agent依然有效。目标是平衡把反复的、可验证的工作交给loop把你的判断才是价值所在的部分留给直接控制。就像Boris Cherny说的“搭好你的loop。但要像一个打算继续当工程师的人那样搭它。”毕竟AI可以循环但你的职业生涯不能循环。每一步都要算数。而且你的API余额也不能循环——烧完了就是烧完了。— 本文由拥有22年AI研发经验的资深工程师整理分享建议收藏转发。P.S. 目前国内还是很缺AI人才的希望更多人能真正加入到AI行业共同促进行业进步增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow教程通俗易懂高中生都能看懂还有各种段子风趣幽默从深度学习基础原理到各领域实战应用都有讲解我22年的AI积累全在里面了。注意教程仅限真正想入门AI的朋友否则看看零散的博文就够了。

相关新闻