08_Agent介绍

发布时间:2026/6/13 18:05:09

08_Agent介绍 Agent什么是 Agent?我们可以将智能体(Agent)理解为一个具备自主理解、规划、记忆和工具使用能力的数字化实体。想象一个高度智能的个人助理你只需告诉他“帮我规划一次去北京的周末旅行”他就能自主完成以下任务:感知(Perception):理解用户的自然语言指令。规划与推理(PlanningReasoning):借助模型推理能力将任务拆解为查询往返机票、筛选酒店、规划景点路线、预估预算等子任务。记忆(Memory):记住你之前的偏好比如喜欢靠窗的座位、偏爱的经济型酒店。工具(Tool):调用外部工具如机票预订API、酒店查询系统、地图服务等来执行这些子任务。反馈与迭代(FeedbackIteration):将规划好的行程草案反馈给你并根据你的修改意见进行调整最终完成预订。智能体让AI从一个只会内容生成的语言模型进化成一个具备自主规划能力的行动者。\为什么要学习Agent简历中的职责就包含大量的Agent开发部分岗位职责直接以agent开发命名智能体的主流开发范式随着智能体技术的不断成熟业界出现了多种有效的智能体开发范式。根据解决问题的场景与复杂度我们可以将主流的智能体应用开发范式大致分为4种:简单LLM应用、单智能体(SingleAgent)、工作流(Workflow)以及多智能体系统(Multi-Agent)。简单LLM应用:我们将直接调用模型API实现内容生成的应用归类为简单LLM应用它们完全依赖模型服务实现内容生成。大家应该还记得在大模型刚刚面世之时各类Generative AI概念的Chat应用大部分都是这类应用。单智能体:相比于直接调用模型API的应用单智能体应用是一种Augmented LLM应用它的核心理念是为普通LLM应用增加RAG、Tool、Memory等让模型具备与特定环境交互的能力。工作流:对于一些复杂的业务应用使用单智能体的架构效果欠佳。为此我们可以将应用拆分开来形成多个独立子智能体(每个子智能体是一个SingleAgent)的架构再将这些独立的子智能体按照预定义的流程编排起来这就是Workflow范式的基本定义。多智能体系统:和Workflow非常类似都是遵循将复杂智能体应用拆分成多个独立子智能体的理念但相比于Workflow 的确定性流程Multi-Agent采用的是模型驱动的、对话式的流程编排各个子智能体在协作上具备更多的自主决策权(通常通过模型决策)。单智能体为什么要提出这个概念简单LLM应用存在什么固有缺陷吗?大模型预训练特性在应用开发上存在如下局限性无法获取最新的数据、私有领域数据.无法对本地工具发起调用.无状态因此无法形成有效的历史记录.典型架构典型的单智能体架构如下。我们将这种架构称之为最简单的智能体应用同时也是最高级的智能体应用。说它简单是因为我们不用做过多的智能体拆分编排等工作开发者只需要把工具等上下文都给到模型一切都由模型驱动。说它高级是因为整个应用由模型作为大脑来驱动和决策不论任何问题我们预期模型都能够正确的推理、选择合适的工具、检索到正确的上下文最终生成复合预期的答案。单智能体架构的高级性非常依赖底层模型能力然而在当前的实践中我们发现当前的模型能力是受限的(不够聪明、上下文窗口等)单智能体模式面临很多的挑战。为此业内才设计出工作流、多智能体系统等模式在工程上做更多事情来弥补模型能力的不足。以下是单智能体架构下的一些典型问题:如果一个Agent包含有太多的可用Tools模型会在决策工具选择时无所适从效果变差。多轮执行下来消息上下文会变得很大消耗大量的Token且影响模型当前专注度。很多复杂的任务需要很多个步骤通常在某些环节还需要专业领域技能支持比如科学计算、深入研究、写代码、绘画、任务规划等。单Agent在复杂任务场景下的可维护性会变差。工作流工作流是一种编排模式需要开发者将一个复杂任务拆解为一系列有序步骤这些步骤之间的调用关系和条件分支在设计阶段就明确好。例如接下来要说到的链式工作流(Chain)和路由工作流(Routing)它们都强调通过规则、逻辑或预设分支把任务从输入到输出组织成可控的流程。工作流的特点是确定性强、可调试性高、可控性好。你可以很清楚地看到“先生成大纲检查写文章”或者“先判断输入类别路由到对应模块”因此非常适合流程清晰、可拆解的任务以及对稳定性要求高的场景。简单来说工作流像是固定的流水线强调任务执行的透明度和安全性。Chain - 链式工作流链式工作流是一种将复杂任务分解为一系列较小、清晰的子任务的方式。每一步由一个独立的LLM调用完成并将上一阶段的输出作为下一阶段的输入。典型应用包括先生成营销文案再翻译成另一种语言或先写文章大纲、检查大纲是否满足要求再基于大纲完整撰写文章。Routing - 路由工作流 [ 意图识别、任务分类 ]路由工作流通过对输入进行分类将它们分派到专门设计的下游任务或处理路径(通常也叫做意图识别)以实现关注点分离与更精准的响应。例如在客服系统中可以将普通咨询、退款请求、技术支持等不同类型的用户问题路由到不同的处理流程与工具或者在成本和速度优化中根据问题复杂度将简单请求分发给小模型而复杂或罕见问题则交给更强大的模型处理。多智能体系统多智能体系统更偏向一种自治协作模式。在这种模式下系统由多个具备一定自治能力的Agent组成每个Agent有自己的角色、能力或工具使用范围。它们之间可以通过消息或上下文进行交互协同完成复杂目标。这种方式更接近团队合作而不是预先定义好的流程。优点是灵活性和适应性强尤其在任务边界不清晰、需要动态规划时表现突出比如研究型问答、复杂数据分析或跨领域问题求解。但多智能体系统的挑战在于难以预测和调试因为不同Agent的交互和决策路径可能高度动态不像工作流那样可控。

相关新闻