高效Agents的尽头是，Harness-尧图网站设计

玩过Agent的人都有这种体验前五轮它像个天才十五轮后开始犯蠢二十轮后它连自己最开始要干嘛都忘了。很多人把Agent当成一个“模型工具”的简单组合。但跑长了就知道这远远不够。philschmid打了个比方模型是CPU上下文是内存而Harness是操作系统。没有操作系统再强的CPU也撑不起复杂任务。模型是CPU提供原始处理能力上下文窗口是RAM有限的、易失性工作内存Agent Harness是操作系统管理上下文处理启动序列提示词、钩子并提供标准驱动工具处理Agent是应用程序运行在操作系统之上的特定用户逻辑目前通用型Harness还很罕见。OpenDev是这一新兴类别的典型代表他们把Agent跑长跑会遇到的坑一个一个填平了。AI编程助手正在经历一场根本性转变。从Copilot的代码补全到Claude Code、Aider等终端原生Agent开发者们发现真正的自动化需要直接运行在开发者管理源码、执行构建、部署环境的地方——终端。但构建一个生产级的终端Agent绝非易事。长周期会话中的上下文窗口爆炸、破坏性命令的安全风险、以及多步骤任务的推理退化这些都是IDE插件时代不必面对的挑战。Figure 2: OPENDEV的四层系统架构Entry UI → Agent → Tool Context → PersistenceOpenDev团队在这篇论文中提出了一个核心观点Coding Agent的架构应该分为两个明确的阶段——Scaffolding构建期和 Harness运行时。这篇论文不仅贡献了代码更贡献了一整套工程化的设计哲学。2 核心理念Scaffolding Harness传统Agent往往混淆了两个不同的阶段Scaffolding脚手架在第一个Prompt到达之前完成的工作——组装System Prompt、构建Tool Schema、注册Subagent。这部分应该eager construction即时构建确保Agent在运行时已是完全就绪状态。Figure 4: Agent Harness的详细视图展示了ReAct循环周围的七个支撑子系统Harness马具/运行时框架第一个Prompt之后的所有工作——工具调度、上下文管理、安全强制执行、会话持久化。这是Agent的运行时编排层。关键洞察将构建期与运行时分离开意味着你可以独立演化每个部分。新增工具只需修改Registry而变更压缩策略只需调整Harness。3 Extended ReAct不只是思考-行动Agent Harness架构实现了一个扩展的ReAct循环包含六个阶段Pre-check Compaction检查注入队列执行上下文压缩Thinking独立的思考阶段无工具访问防止过早行动Self-Critique自批判阶段仅在HIGH级别启用Action主LLM调用产生工具调用Tool Execution并行/串行执行工具Post-processing学习记录、会话保存Figure 8: Extended ReAct执行循环的详细视图展示了从Initialization到Iteration的完整流程特别值得注意的是Phase 0的Staged Context Management。系统监控Token使用率在70%、80%、85%、90%、99%五个阈值采取不同策略Algorithm 1: Extended ReAct Loop with Five-Stage Compaction and Doom-Loop Detection4 Context Engineering上下文是一等公民在长周期终端会话中上下文管理不是优化项而是基础性工程问题。OpenDev提出了Context Engineering Layer包含四个关键子系统4.1 动态System Prompt组装通过Priority-ordered conditional composition根据运行时环境动态加载Prompt片段。例如只有在Git仓库中才加载Git工作流指南只有启用Todo跟踪时才加载任务管理指令。Figure 10: PromptComposer的工作流程Filter → Sort → Load → Join4.2 自适应上下文压缩ACC不同于简单的到达阈值就总结ACC采用渐进式策略Active State最近的消息完整保留Faded State较旧的消息替换为引用指针Archived State归档到磁盘完全移出上下文Figure 13: 五级压缩管道Warning → Masking → Pruning → Aggressive Masking → Full Compaction4.3 系统提醒System Reminders解决指令衰减问题随着会话变长模型对初始System Prompt的关注度下降。OPENDEV通过事件驱动的即时提醒Event-driven System Reminders在关键时刻注入短小的user-role消息检测到未完成Todo却调用task_complete时连续5次只读操作后防止探索螺旋工具调用失败后Figure 11: 系统提醒如何防止过早完成任务左无提醒导致用户信任丧失右有提醒确保任务完成4.4 双记忆架构Dual-Memory为Thinking模型设计的特殊架构Episodic MemoryLLM生成的长程对话摘要每5条消息更新一次Working Memory最近6条消息的原文这既避免了长上下文超限又保留了关键细节。Figure 14: Agentic Context Engineering (ACE) 记忆管道包含Bullet Selector、Reflector、Curator和Playbook防御纵深五层安全架构终端Agent能执行任意Shell命令这带来了巨大风险。OPENDEV采用五层独立的安全机制Prompt-Level GuardrailsSystem Prompt中的安全策略Schema-Level Tool Restrictions通过Tool Schema过滤如Planner Subagent只能看到只读工具Runtime Approval SystemManual/Semi-Auto/Auto三级审批Tool-Level Validation危险模式检测rm -rf /等、陈旧读取检测Lifecycle Hooks用户自定义的Pre/Post工具钩子Figure 3: 防御纵深安全架构的五层独立防线关键设计让危险工具不可见而非被阻止。当Tool Schema中根本不包含写工具时LLM甚至不会尝试生成写操作这比运行时权限检查更 robust。复合AI系统多模型路由OPENDEV采用Compound AI System架构将不同工作负载路由到不同模型Model RolePurposeFallback ChainAction主要执行模型-Thinking深度推理无工具ActionCritique自评估Thinking → ActionVision图像处理Action (if capable)Compact快速总结ActionFigure 1: OPENDEV的并发会话架构每个Session包含多个Subagent各自绑定到LLM Pool中的不同模型这种设计实现了模型无关性切换提供商只需改配置无需改代码。工具系统延迟发现与高效扩展7.1 MCPModel Context Protocol延迟发现为避免100个外部工具消耗20,000 Token的上下文OPENDEV采用Lazy Discovery只有在Agent调用search_tools或直接调用某个MCP工具时该工具的Schema才被加载到上下文中。Figure 19: ToolRegistry的延迟发现机制将MCP集成的基线Token成本降至接近零7.2 9-Pass模糊匹配编辑LLM生成的代码编辑往往有微小偏差空格、缩进、转义序列。edit_file工具实现了9级渐进式匹配链从精确匹配到上下文感知匹配大幅降低了内容未找到的错误率。Table D: Edit Tool的九级模糊匹配链7.3 完整工具目录Table 1: OPENDEV内置工具完整目录按Handler分类关键经验五个设计权衡OpenDev总结了五个跨领域的设计张力最后Harness作为新的抽象层OpenDev的贡献不仅是又一个开源Coding Agent而是提出了Harness这一关键抽象——将Agent的运行时编排从业务逻辑中分离出来。在终端原生Agent的时代我们需要的不是更聪明的Prompt而是更健壮的Scaffolding Harness架构Scaffolding确保Agent以正确的能力组合启动Harness确保Agent在长周期、高风险的终端环境中安全、高效、持续地运行正如论文所言“The design space for terminal-native agentic tools remains largely underexplored.” 而Harness或许就是这个设计空间中最关键的 missing piece。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

高效Agents的尽头是，Harness

相关新闻

3分钟革新体验：让Windows用户突破模拟器束缚的APK直装方案

三步打造你的专属阅读空间：开源阅读鸿蒙版深度体验

解决Qt打包setup.exe时的常见问题：32位与64位兼容性、依赖文件处理

Slide离线阅读功能详解：随时随地浏览Reddit内容的完整教程

告别Makefile！Android Soong编译系统保姆级入门：从Android.bp到Ninja全流程解析

2024热门AI工具，让AI写专著更轻松，一键生成20万字专著无压力！

超越单通道！YOLOv5特征图合并可视化实战：一张图看清模型‘注意力’在哪

别再只调API了！手撕五次多项式轨迹规划，深入理解位置、速度、加速度的耦合关系

终极指南：Visual C++运行库合集AIO - 一站式解决Windows软件依赖问题

Claude Code 在 AI Agent 项目上线阶段的 4 类运维问题与自动化迭代方案

m4s-converter：开源跨平台工具实现B站缓存视频无缝转换

保姆级教程：在Ubuntu 20.04上用kitti2bag工具把KITTI Raw Data转成ROS Bag（避坑实录）

2026年十大最佳地区搜索排名优化工具：权威榜单赋能企业高效增长

DDR3内存Row Hammer问题解析与防护方案

为ItsyBitsy ESP32设计3D打印外壳：从原型到产品的完整实践

别再手动点关了！用PowerShell永久关闭Windows Defender的保姆级教程（含Server 2016/2019）

别再只换芯片了！BP2832A替换CL1502，你的电感参数算对了吗？

全平台智能资源下载工具：res-downloader 完整使用教程