LLM Agent外部化架构最新综述:记忆、技能、协议与Harness工程

发布时间:2026/5/20 16:40:57

LLM Agent外部化架构最新综述:记忆、技能、协议与Harness工程 最近刷到一篇来自上交大和中科院团队的综述发表于2026年4月题目叫Externalization in LLM Agents说的是一个很有意思的视角大模型Agent的核心进化不是在把模型做得更大而是在把认知负担一件一件地搬出去。读完之后觉得这个框架真的很有解释力结合最近做Agent开发的感受整理成这篇文章。先说个反直觉的结论很多人觉得Agent能力强不强关键看底座模型好不好。这话没错但不够准确。论文里给了一个很直白的观察实际系统里很多可靠性的提升根本没有改模型参数。是通过加持久化记忆、整理可复用的技能文件、标准化工具接口、约束执行流程、给行为打日志……来实现的。问题的核心从模型多能变成了模型外面那圈东西有多好。这个框架论文叫做Externalization外化借的是认知科学家Norman的认知制品理论。核心洞察其实很朴素制品的力量不在于它给你加了什么能力而在于它改变了任务本身的形态。购物清单不是扩大了人类的记忆容量它把回忆这件困难的事变成了对照这件容易的事。地图不是让人变成导航达人它把隐藏的空间关系变成了眼睛直接可见的结构。LLM Agent的基础设施做的是同一件事。三层演进从权重到上下文再到Harness论文把近几年大模型Agent的发展分成了三个时代。第一层能力在权重里。模型越大越好知识都烧进参数里想更新一个事实就要重新训练。那时候大家的思路就是堆参数、堆数据、搞对齐。这没什么问题但问题在于知识、流程、策略都被锁死在一个静态的模型文件里想查、想改、想针对不同用户差异化都很难。第二层能力在上下文里。Chain-of-Thought、RAG、ReAct……这些方法的共同逻辑是不改模型而是把任务需要的信息、推理步骤在调用前塞进去。这把模型记住了吗这个召回问题变成了把答案放在眼前模型能用吗的识别问题效率高多了。但上下文窗口是有限的而且是一次性的会话结束就忘多智能体协同也没有公共的接口标准。第三层能力在Harness里。这就是现在正在发生的事。可靠性越来越依赖于模型外面的那圈持久化设施记忆库、技能文件、协议层、沙箱、审批门、日志系统……模型仍然是推理引擎但智能不再只住在模型里。外化的三个维度论文把需要从模型里搬出去的负担分成三类。记忆把状态搬出去裸模型没有记忆。每次对话都是白纸开始。用户的偏好、上次任务的进度、已经踩过的坑都要靠提示词手动携带这既浪费Token也不可靠。外化记忆之后记忆系统接管了这件事。论文把需要存的状态分成四层当前任务的工作上下文、历史执行的情节记忆、跨任务的语义知识、跟特定用户绑定的个性化偏好。从架构上系统也从整个历史塞进提示词进化到按需检索再到分层管理、主动遗忘最新的方向甚至是用强化学习来优化检索策略。关键洞察记忆好不好不在于存了多少而在于能不能在对的时候把对的东西调出来。让当前决策看得清楚才是记忆系统的真正目标。技能把流程搬出去模型每次执行任务都要从权重里临时发明一套工作流。步骤顺序、遇到分支怎么选、什么情况下停止……每次都可能不一样。长任务、多步骤任务里这种不稳定性是真实的痛点。外化技能就是把这类任务该怎么做写成一个显式的、可复用的制品——比如一个SKILL.md文件说清楚适用场景、执行步骤、约束条件、注意事项。技能不只是提示词也不只是工具。工具暴露的是能做什么操作协议规范的是怎么调用这个操作技能编码的是这类任务应该怎么完成是更高层的程序性知识。论文提了一个很有意思的机制叫Progressive Disclosure渐进展开先只把技能名字和摘要给模型看只有真的需要的时候才把完整的步骤指南加载进来。这样避免了一上来就把上下文塞满没用的细节——Claude Code的技能系统就是这个思路。协议把交互搬出去模型跟外部工具、其他Agent交互的时候如果全靠自由发挥生成格式非常脆弱。工具接口变了、另一个Agent的理解方式不同都可能导致整个链路崩掉。协议把这件事变成了结构化的契约字段类型是什么、调用的状态机是什么、权限边界在哪、怎么发现有哪些能力可以用。MCPAnthropic推的Model Context Protocol是Agent-工具协议里最具代表性的解决的就是每个工具都要单独适配的问题。A2AGoogle、ACPIBM解决的是Agent之间怎么标准化协作。AG-UI、A2UI解决的是Agent执行状态怎么标准化暴露给前端界面。这些协议的价值不只是让调用更整齐而是把格式对不对、权限够不够、状态机走到哪这些判断从模型的推理任务里移除掉交给运行时来强制保证。Harness把三者缝合起来的那一层记忆、技能、协议各自解决了一块但它们各自为政就是一堆散件。把它们缝合成一个能跑起来的系统靠的是Harness。论文把Harness的核心职责拆成六个维度执行循环与控制流负责感知—检索—规划—行动—观察这个循环的调度同时设置最大步数、递归深度、资源上限防止无限循环或爆费。沙箱与执行隔离决定Agent能碰什么、不能碰什么让副作用可控、失败可回滚。人工审批门对敏感操作或高风险步骤暂停等待确认自主程度是可配置的参数不是非此即彼的开关。可观测性与结构化反馈每次调用、每个工具调用、每次记忆读写都留下结构化日志一方面用于调试和审计另一方面把失败记录写回记忆为技能优化提供依据。配置、权限与策略编码把能做什么、不能做什么、在什么条件下可以从提示词里抽出来变成可版本管理、可分层继承的声明式规则。上下文预算管理记忆检索、技能加载、协议schema、工具描述都在抢同一个Token窗口Harness负责在不同执行阶段动态分配而不是让它们无序地互相挤占。三者之间的联动论文里有一张循环图把记忆、技能、协议之间的流向画得很清楚这里用文字说一下记忆积累的执行轨迹经过蒸馏能变成可复用的技能技能执行产生的新轨迹又写回记忆让技能有了自我修正的依据。技能最终要通过协议绑定到可执行的工具或子Agent上才能真的跑起来而协议调用的结果又要被规范化地写入记忆才能支撑后续的决策。记忆里的历史经验还能影响协议路由的选择比如某个工具反复失败系统可以学会优先走别的路。这个闭环系统有个好处也有个风险。好处是能够自我强化更好的记忆带来更好的技能更好的技能积累更丰富的记忆。风险是错误也会自我放大一条被污染的记忆可能蒸馏出一个有缺陷的技能这个技能的执行结果再进一步污染记忆。单靠某一个模块自己的质量控制没法打断这个级联——这是Harness层面必须要管的问题。往后看几个有意思的方向论文末尾谈了几个前沿方向选几个我觉得比较值得关注的说一下。具身智能里的同构。VLA模型视觉-语言-动作模型的演进正在复刻数字Agent的这套外化逻辑。原来想用一个大模型端到端解决感知、规划、执行现在越来越多的系统把高层规划交给LLM/VLM把底层的精细操作交给专门的VLA技能模块两者之间用结构化协议通信。这跟大脑皮层和小脑的分工异曲同工。自进化Harness。现在修记忆策略、改技能文件、优化执行逻辑主要还是靠人工。如果把Harness的配置本身也变成可程序化修改的对象Agent系统就能在三个层面自我进化策略层调整检索粒度、技能排序规则、管线层重新安排调度策略、边界层决定什么时候新增一个外化模块什么时候裁掉一个冗余的。这很诱人但风险也在这里——失控的自进化可能引入新问题的速度比解决旧问题还快。从私有脚手架到共享基础设施。现在大多数外化设施是一个Agent一套但协作链路变长之后共享记忆、共享技能库、统一协议的需求会越来越强。这时候技能文件开始类似于开源库记忆系统开始类似于共同知识库而配套的版本管理、权限审计、溯源机制也就变成了Agent生态的治理基础设施。最后这篇论文提供的最有价值的视角是把Agent能力这个模糊的概念拆解成了一个可以被系统化设计的工程问题哪些认知负担应该留在模型里哪些应该搬出去搬出去之后用什么形式组织不同形式之间怎么联动联动过程怎么被治理。这对实际做Agent开发的人来说比单纯比较模型benchmark要有用得多。模型好坏当然重要但很多时候系统可不可靠靠的是外面那圈东西设计得好不好。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关新闻