
范式名称核心思想类比理解核心工作流程典型应用场景ReAct范式**推理Reasoning与行动Action**交替进行通过外部反馈Observation来指导下一步决策。人类解题拿到一道数学题先思考推理解题步骤然后动笔计算行动检查结果观察再根据结果决定是继续下一步还是修正错误。Thought - Act - Observe循环需要与外部环境如数据库、API、工具交互的复杂任务例如数据分析、智能客服、自动运维。Plan-and-Solve (或 Plan-and-Execute)先规划后执行。一次性制定完整的步骤计划然后按计划逐步执行通常缺乏执行中的动态调整。建造房子建筑师先画出全套设计图纸规划施工队再严格按照图纸施工执行。如果图纸有误或遇到意外整个工程可能受阻。Plan - Step1 - Step2 - ... - Result目标明确、步骤清晰、环境稳定的任务例如按照固定模板生成报告、执行预设的数据处理流水线。Reflection (或 Self-Reflection)行动后反思。在执行完一个或一系列行动后对结果进行批判性评估发现问题并生成改进方案然后重新执行。学生写作文写完初稿后通读一遍观察结果反思哪里逻辑不通、语句不顺推理然后修改文章新的行动。Act - Observe - Critique - Reflect - (Re)Act对输出质量要求高、需要迭代优化的任务例如代码调试、文章润色、方案设计评审。Multi-Agent多角色协作。多个具备不同角色和能力的智能体通过通信协议如A2A进行分工合作共同完成复杂任务。医院会诊内科、外科、影像科等多位专家多个Agent各自检查病人然后开会讨论通信共同制定治疗方案协作决策。AgentA - (Communicate) - AgentB - (Cooperate) - Result涉及多领域知识、需要分工或辩论的复杂任务例如复杂项目评估、辩论赛模拟、集成多源数据的决策系统。核心循环拆解以ReAct为例ReAct范式的核心是一个循环迭代的过程其标准步骤可用以下伪代码表示# ReAct 核心循环伪代码 def react_agent(initial_question): # 初始化 context initial_question max_steps 10 for step in range(max_steps): # 1. Thought推理分析当前情况决定下一步做什么 thought llm_reason(context, available_tools) # print(fThought {step}: {thought}) # 2. Act行动执行决策通常是调用一个工具或API action, action_input parse_thought_to_action(thought) # print(fAct {step}: 调用工具【{action}】输入{action_input}) # 假设我们有一个工具调用函数 if action in available_tools: observation available_tools[action](action_input) # else: observation 错误未知工具。 # 3. Observe观察获取行动结果作为下一次推理的输入 print(fObserve {step}: {observation}) context f 行动结果{observation} # 检查任务是否完成 if is_task_complete(observation, initial_question): final_answer llm_generate_final_answer(context) print(f最终答案{final_answer}) return final_answer return 任务未能在最大步数内完成。 # 示例可用工具字典 available_tools { search_web: search_function, calculate: calculator_function, lookup_database: db_query_function, # }范式间的关系与演进这四种范式并非互斥而是常常在高级的**智能体工作流Agentic Workflows**中被组合使用形成更强大的问题解决能力 。基础单元ReAct是构建智能体最基础的“原子”循环它赋予了智能体与环境交互和动态决策的能力 。增强与组合Plan-and-Execute ReAct可以先制定一个高层计划Plan然后在执行每个步骤时使用ReAct循环来处理其中的不确定性 。这就像项目经理制定了季度目标规划但每个工程师在完成具体模块时仍需灵活解决技术难题推理-行动。ReAct Reflection在每次或每几次Act-Observe后加入一个Reflection步骤评估当前进展和质量从而纠正错误或优化后续策略 。这就像学生在解题过程中每做两步就回头检查一下计算和逻辑。复杂系统Multi-Agent是更高层次的架构范式其中的每个智能体Agent内部可能采用ReAct、Plan或Reflection等范式。它们通过A2AAgent-to-Agent通信协议进行结构化信息交换与协作共同完成超大型任务 。通俗示例如何用这些范式点外卖假设任务是“帮我订一份适合感冒患者吃的、清淡的午餐预算50元以内。”只用 Plan-and-Solve规划1. 打开外卖APP。2. 搜索“粥”。3. 按价格排序。4. 选择第一个。5. 下单。 执行严格按上述步骤执行。风险可能选到一份“皮蛋瘦肉粥”虽然清淡但皮蛋对感冒未必好规划时未考虑“食材适应性”。使用 ReAct思考用户感冒了需要清淡、易消化的食物。粥或清汤面比较合适。先看看附近有什么店。 行动调用【搜索外卖商家】工具关键词“粥 面 清淡”。 观察返回A店的“青菜粥”20元B店的“鸡汤面”35元C店的“海鲜粥”45元。 思考海鲜是发物感冒时可能不宜食用。鸡汤面听起来不错有营养。检查一下用户评价。 行动调用【查看商家评价】工具商家B。 观察评价显示鸡汤面较油腻。 思考评价说油腻那可能不适合。青菜粥最安全。在预算内。决定下单A店的青菜粥。 行动调用【下单】工具商品“青菜粥”。(这个过程展示了ReAct如何根据观察到的信息动态调整决策)。加入 Reflection在ReAct流程下单后可以增加一个反思步骤“我刚刚推荐了青菜粥虽然安全但营养单一。是否应该再建议用户搭配一份蒸蛋或者询问用户是否有其他口味偏好” 这可以优化本次建议或为下次服务积累经验 。使用 Multi-Agent营养专家Agent分析感冒饮食需求推荐“粥类、清汤面、蒸蛋”。美食侦探Agent负责搜索和筛选符合要求、评价好的外卖商家。预算管家Agent确保总价在50元以内并计算优惠。三个Agent通过通信A2A交换信息营养清单、商家列表、价格共同协商出最优解——比如“青菜粥蒸蛋”的组合 。总结来说ReAct是让AI学会“边想边做”的核心范式Plan-and-Solve提供了宏观蓝图Reflection赋予了其“复盘优化”的能力而Multi-Agent则是构建分工协作的AI团队的架构思想。在实际的AI智能体系统中这些范式像积木一样被灵活组合以应对不同复杂度的现实世界任务。参考来源收藏备用ReAct范式深度解析LangGraph落地实战小白也能学会的大模型Agent构建指南收藏大模型智能体Agent入门从概念到ReAct范式实操全解析第四章深度解析智能体经典范式实战指南——从ReAct到Reflection的全流程拆解AI Agent核心技术范式深度解析从ReAct到智能体工作流小白也能轻松掌握并收藏ReAct、Plan-and-Execute、Reflection、Multi-AgentAI Agent 核心工程范式解析小白程序员必备收藏AI Agent开发实战基于ReAct范式的智能体构建与优化