Agent学习笔记（一）——总体概览-尧图网站设计

Agent学习笔记一文章目录Agent学习笔记一前言一、Agent是什么二、Agent和workflow的区别和联系三、Agent基础范式1.ReActReasoning Acting2.Plan-and-Execute3.对比4.补充Reflection总结前言本系列文章聊以记录自己在学习Agent过程中的浅显见解以加深自己的学习印象同时若能对读者有些许帮助不慎宽慰。本文将集中对Agent基础概念进行初步展开。一、Agent是什么AI Agent是一类具备目标驱动、环境感知、自主决策、工具调用、记忆留存与迭代反思能力的智能系统Agent LLM Planning Memory Tools从本质来看大模型LLM是以理解生成文本为核心的语言模型被动响应指令仅能完成问答类交互不会自主推进任务。而 Agent 在此基础上实现了能力跨越可端到端处理复杂任务核心依托三大能力任务流程规划、记忆、外部工具调用。二、Agent和workflow的区别和联系核心结论Workflow 是「预设固定流程」按步骤机械执行Agent 是「自主决策动态流程」带感知、思考、规划、工具调用的智能体。二者不是对立关系而是「基础流程」与「智能增强」的层级关系Agent 内部往往会嵌套 Workflow。Workflow工作流一套预先编排、逻辑固定、分支有限的任务执行链路严格遵循有向无环图DAG。人 / 系统提前定义好先做什么、再做什么、遇到分支走哪条、结束条件。执行逻辑条件判断顺序 / 并行 / 分支流转无自主思考。本质自动化流水线。Agent智能代理 / 智能体具备感知、推理、规划、工具调用、记忆、动态决策的自主执行单元。非 DAG支持任意图结构包括自环、多入边本质是状态驱动的图遍历。不依赖固定步骤接收目标后自主拆解任务、选择工具、调整路径、纠错重试。核心能力大模型驱动的 “主动思考动态执行”。本质带智能决策的自主执行者。层级关系Workflow 是 Agent 的基础组成单元用户目标 ↓ Agent顶层规划、决策、调度、纠错 ↓ 子任务 → 调用固定 Workflow / 原子工具三、Agent基础范式1.ReActReasoning Acting核心思想让大模型在每一步同时完成「逻辑推理」和「动作执行」形成「思考→行动→观察→再思考」的循环闭环。ReAct 是单步决策、逐轮迭代模式没有提前生成全局大计划每一轮只决定「下一步做什么」通俗来讲就是走一步看一步完整循环如下用户任务/初始问题 ↓ ┌─────────────┐ │ Reasoning │ 思考下一步该做什么 └──────┬───────┘ ↓ ┌─────────────┐ │ Acting │ 执行调用工具/发起操作 └──────┬───────┘ ↓ ┌─────────────┐ │ Observation │ 观察接收工具返回结果 └──────┬───────┘ ↓ 回到推理环节循环 ↓ 任务完成 → 输出最终答案Reasoning 推理思考基于当前任务、历史对话、上一轮执行结果LLM 分析现状、判断目标、思考下一步需要执行什么动作。Acting 执行动作根据推理结果主动调用外部工具搜索、数据库、API、计算器、代码解释器等落地具体行为。Observation 接收观察获取工具返回的结果、环境反馈、外部信息作为新的上下文输入。Loop 循环迭代将「原始任务历史推理动作观察结果」全部送入 LLM进入下一轮推理直到任务完成。举个生活化的例子从家去公司 **思考**我现在要去公司第一步该干嘛 **行动**打开地图搜路线。 **观察**看到有地铁和公交两种方案地铁更快。 **思考**那我先去地铁站需要带交通卡吗 **行动**找交通卡出门。 **观察**到地铁站发现临时封站了。 **思考**那我改坐公交先查公交路线…2.Plan-and-Execute核心思想先全局规划出完整步骤清单再按计划一步步执行执行中可动态调整但始终以 “整体蓝图” 为核心。用户目标 ↓ ┌─────────────┐ │ Planner │ 全局思考生成完整步骤清单 └──────┬───────┘ ↓ ┌─────────────┐ │ Executor │ 逐条执行调用工具、拿到结果 └──────┬───────┘ ↓ ┌─────────────┐ │ Replaner │ 检查结果是否需要调整计划 └──────┬───────┘ ↺调整后继续执行 ↓ 任务完成 → 输出最终结果核心组件1. Planner规划器角色全局大脑能力任务拆解、步骤排序、依赖分析、工具分配实现通常用强 LLMPrompt 要求输出结构化 plan2. Executor执行器角色干活的手脚能力工具调用、参数传递、结果收集、状态管理实现可以是轻量 LLM / 函数 / 脚本不需要强推理3. Replaner重规划器角色反馈调整中枢能力结果校验、偏差判断、计划修正、异常处理实现轻量 LLM 或规则引擎只改后续步骤不改历史Plan-and-Execute 的灵魂规划和执行彻底分开。规划Plan只负责想不干活输入用户目标输出结构化、有序、可执行的子任务列表含步骤、依赖、工具、预期结果执行Execute只负责干不想大方向输入单条子任务输出工具调用结果、状态、数据反馈 / 重规划Replan检查结果是否符合预期必要时修改后续计划但不会全盘推翻。同样的生活化案例规划我先一次性定好完整路线 ① 7:30 出门 ② 7:35 到地铁站 ③ 7:40 上地铁 ④ 8:10 出地铁 ⑤ 8:15 到公司执行按这个步骤一步步走。遇到突发情况地铁封站发现和计划不符需要重新规划路线再继续执行。3.对比维度ReActPlan-and-Execute核心逻辑边想边做走一步看一步先定好完整路线再按步骤执行思考方式每次只决定「下一步该做什么」一次性拆解出完整的任务执行计划执行方式「思考 → 行动 → 观察 → 再思考」循环「生成计划 → 按计划依次执行」推理位置每步前都要推理只在开始推理一次执行中不推理灵活性极高随时调整中等调整需要重规划全局视野弱容易丢目标强全程有蓝图并行能力无只能串行有独立步骤可并行Token 消耗高每步调用 LLM低规划一次执行轻量对复杂任务的处理适合动态调整但容易在长任务中跑偏路线稳定但应对突发变化不够灵活适用场景简单、动态、未知、短任务复杂、固定、多步骤、长任务技术层面的核心差异思考的 “粒度” 不同ReAct 是单步决策每次只决定下一个动作思考的粒度非常细。Plan-and-Execute 是全局规划先定好所有步骤再批量执行思考的粒度更粗。对错误的容错方式不同ReAct每一步都能根据反馈调整小错误能马上纠正。Plan-and-Execute如果计划本身就错了后续步骤都会跟着错需要重新规划。适用场景不同ReAct 更适合信息不明确、需要边探索边做的任务比如查资料、写代码调试。Plan-and-Execute 更适合目标明确、流程固定、步骤清晰的任务比如项目排期、数据报表生成。4.补充Reflection核心思想Reflection反思是一种让 Agent 自己检查自己、评判自己、修正自己的增强范式。它不是独立架构而是给 ReAct / Plan-and-Execute 叠加的 “纠错大脑”。反思自我评估错误归因策略修正用户任务 ↓ 执行ReAct 或 Plan-and-Execute ↓ 【观察结果 Observation】 ↓ ┌─────────────────────┐ │ Reflection 反思 │ → 评判归因修正 └─────────────────────┘ ↓ 需要修正→ 是 → 重新执行 ↓ 任务完成总结本文系统性地梳理了AI Agent的核心概念与基础范式旨在帮助读者构建清晰的理解框架。核心要点回顾Agent是什么AI Agent是目标驱动、具备感知、规划、决策、工具调用与记忆能力的智能系统。其核心公式为Agent LLM Planning Memory Tools实现了从被动问答到主动处理复杂任务的跨越。Agent vs. WorkflowWorkflow工作流是预设的、固定的自动化流水线遵循DAG结构按既定步骤机械执行。Agent智能体是具备自主决策能力的动态执行者其内部可以调用和编排多个Workflow。二者是“智能增强”与“基础流程”的层级关系。两大基础范式ReActReasoning Acting采用“走一步看一步”的单步决策循环思考→行动→观察。优势在于灵活性极高能即时调整劣势是缺乏全局视野长任务中易偏离目标且Token消耗大。Plan-and-Execute采用“先规划后执行”的全局蓝图模式。优势在于路线稳定、全局视野强、支持步骤并行、Token效率高劣势是对突发变化的响应不够灵活初始计划若出错影响较大。范式选择指南选择 ReAct当任务简单、动态、未知或需要频繁探索时例如调试代码、信息检索。选择 Plan-and-Execute当任务复杂、固定、步骤清晰且可预规划时例如生成数据报表、执行项目排期。增强模式Reflection反思Reflection 是一种为上述范式叠加的“纠错大脑”通过自我评估、错误归因和策略修正来提升任务的完成质量和鲁棒性。展望理解这些基础范式是构建和运用更复杂Agent系统如多智能体协作、分层规划等的基石。在实际应用中往往需要根据具体场景灵活组合或改造这些模式以设计出最有效的智能体解决方案。

Agent学习笔记（一）——总体概览

相关新闻

STM32CubeIDE项目结构优化：像搭积木一样管理你的BSP和OLED驱动代码

Linux ACL 权限

从标准库迁移到HAL库，你的RTC日期还好吗？一个STM32老鸟的避坑实录

如何自定义DFlash目标层：Qwen3.6-35B-A3B-DFlash配置详解

小屏幕交互设计：从费茨定律到响应式布局的实战指南

别再折腾官方教程了！手把手教你用Ubuntu 22.04 + ROS2 Humble搞定YDlidar雷达驱动（附常见报错解决）

基于单调迭代与保守离散化的随机变量期望上界计算

别再让半孔焊盘一焊就掉！用Allegro 17.4制作‘双钻孔’坚固半孔的保姆级教程

航空级FPGA加速：开源VTA编译器实现DO-178C认证

036、模糊PID控制器设计

别只调学习率了！深入YOLOv8源码，看懂NMS与IoU的底层实现与优化

Lens-Turbo 整合包发布：解压即用，文生图、图生图。12G 显存畅玩 AI 视觉生成（完美适配 50 系显卡）

【英语学习笔记】基于“底层逻辑转换”与“去动词化”的英汉互译核心方法论及写作高分公式

终极视频下载解决方案：VideoDownloadHelper 完全指南

2026最新！AI论文写作工具测评：这几款知网都认可

Harness 中的响应合并：将多个片段组装为完整输出

Windows Cleaner终极教程：5分钟彻底解决C盘爆红问题，让系统重获新生！

别再只会用ifconfig了！在Ubuntu 22.04/20.04上，教你用ip命令并顺带配置好国内镜像源