智能体Prompt工程核心技巧:让 AI Agent Harness Engineering 精准理解复杂指令

发布时间:2026/5/23 1:16:47

智能体Prompt工程核心技巧:让 AI Agent Harness Engineering 精准理解复杂指令 智能体Prompt工程核心技巧让 AI Agent Harness Engineering 精准理解复杂指令一、 引言一钩子你见过“装聋作哑”又“画蛇添足”的智能体吗想象一下这个让无数开发者、产品经理抓狂的场景你为了做一款「企业员工差旅智能规划与审批助手」花了大价钱接入了 GPT-4o、Claude 3 Opus 这类顶尖大模型 API然后给它写了一段自认为“天衣无缝”的指令“帮员工小李规划从北京到上海虹桥的差旅行程时间是2025年6月15日早8点前必须到达公司会议室会议室在虹桥商务区核心区2号楼预算是总花费机票酒店餐饮补贴外的交通不超过2000元人民币小李是高级产品经理有国航金卡、华住铂金会员身份同时他不能吃海鲜明天6月12日就需要生成审批初稿包含行程单、酒店预订单截图、机票候补方案的截图说明另外提醒行政提前帮他预约虹桥站到公司的专车。”结果呢Opus 给了什么回复“好的为高级产品经理小李规划的北京-上海虹桥差旅行程如下交通方案国航CA1501北京首都T3→上海虹桥T2起飞时间06:00到达时间08:10经济舱全价2150元哦您说预算2000那就换国航CA1234候补候补成功率预估85%经济舱折扣票1890元。酒店方案华住旗下全季酒店虹桥商务区店高级大床房2025.6.15入住2025.6.16离店铂金会员折扣价699元/晚。行程提醒小李明天6月12日记得自己准备审批初稿行政可以等初稿批下来再约专车。”看到这里你的血压是不是已经飙升到180首先到达时间晚了10分钟——这是会议室的硬性准入要求其次总花费折扣机票专车没加专车预估就算了折扣机票1890全季商务酒店高级大床房699虽然只是一晚但商务差旅很多是按天算总预支不对原指令说的是“机票酒店餐饮补贴外的交通”不超2000哦对那折扣机票已经1890剩下只有110元怎么够专车从虹桥T2/T1到核心区2号楼其次完全忘了酒店不能有海鲜早餐、餐饮提醒然后生成初稿的主体是助手不是小李更离谱的是行政预约专车要在明天初稿生成前提前准备占位还有没有截图的生成方案哦对了大模型本身不能直接生成真实截图但可以用Mermaid、SVG生成示意图或者调用你的工具链里的假截图生成API对吧但这段指令完全没提工具链的触发规则这种“装聋作哑”忽略硬性约束、工具链、身份触发的权益细节、“画蛇添足”混淆主体、搞错预算范围、漏算关键刚需、“逻辑断层”不知道把折扣机票剩下的110元换成地铁共享单车/短驳车的AI智能体根本不是我们想要的「生产力工具」而是「人工智障帮倒忙器」。为什么会出现这种情况很多开发者、产品经理的第一反应是「这个大模型太垃圾了换一个」但事实真的是这样吗GPT-4o能解IMO数学竞赛难题、能写百万行级别的代码框架、能看懂X光片甚至比普通医生更准但为什么到了处理「差旅规划审批初稿生成工具链调用」这种看似简单但充满多约束、多目标、多角色交互、上下文隐性依赖、工具隐性触发条件的复杂任务时就会彻底拉胯答案很简单不是大模型的能力不行而是你给的「指令说明书」写得太烂了就像你给一个刚毕业的顶级大学机械工程系博士生塞了一张手写的、只有寥寥几行、还到处是错别字和模糊表述的「造火箭图纸」然后要求他明天造出一个能飞上天的火箭一样——他有造火箭的知识储备但完全不知道你要造的是「探月火箭」还是「烟花火箭」要「一级固体燃料二级液体燃料」还是「全氢氧燃料」要「搭载嫦娥探测器」还是「搭载公司年会无人机编队信号塔」更不知道你的「车间设备清单」「材料采购预算」「安全验收标准」是什么。这就是Prompt工程的核心痛点当大模型的通用能力已经足够强大到处理绝大多数“单维度、单目标、无约束、上下文明确、不需要工具链”的简单任务时如何写出一份结构化、规范化、明确化、可执行化、容错化、可迭代化、工具友好化、多角色适配化的Prompt让大模型智能体精准理解、正确拆解、严格执行、有效优化我们的「复杂任务指令」已经成为了当前AI应用落地的第一生产力瓶颈。二定义问题/阐述背景什么是「智能体Prompt工程」Agent Harness Engineering Prompting它为什么是当前AI落地的核心在正式展开「智能体Prompt工程核心技巧」之前我们必须先厘清几个最容易混淆的核心概念——这也是很多人在做Prompt工程时踩的第一个大坑概念不清导致方法错配。1. 基础概念拆解先划清边界再谈方法首先我们来对比一下四个经常被混用的术语术语核心定义应用场景依赖对象输出形式通用Prompt工程General Prompt Engineering针对「纯大语言模型LLM」或「纯多模态大模型MLLM」本身优化输入文本/多模态内容使其在无需调用外部工具、无需自主推理拆解、无需记忆长期上下文、无需与其他Agent/用户交互的情况下输出更高质量、更符合预期的结果。文本生成文案、诗歌、代码片段、多模态理解看图说话、图片转文字、视频摘要、知识问答维基百科式的单点问题、简单推理三段论、简单数学题。大模型的“预训练知识库”和“上下文窗口内的直接输入”。纯文本/纯多模态生成内容图片、音频、视频片段描述或简单合成提示。上下文窗口Prompt工程Context Window Prompt Engineering在通用Prompt工程的基础上优化「如何把大量的外部知识、历史对话、历史任务执行记录高效、有序、无冗余、不超出窗口限制地塞进大模型的上下文窗口」使其能利用窗口内的信息解决稍微复杂一点的任务。多轮对话客服、长文档摘要、基于知识库的RAG检索增强生成问答但检索结果必须完全塞进窗口、短期记忆的简单任务链。大模型的“预训练知识库”“上下文窗口内的结构化输入知识库检索结果、历史对话摘要、任务执行日志片段”。纯文本/纯多模态生成内容可能包含对窗口内信息的简单引用。工具链Prompt工程Tool Use Prompt Engineering在通用/上下文窗口Prompt工程的基础上优化「如何让大模型自主判断是否需要调用外部工具、调用哪个工具、如何构造工具的输入参数、如何处理工具的输出结果、如何在工具调用失败时进行重试或降级处理」使其能解决「需要访问实时数据、需要操作外部系统、需要生成符合特定格式的结构化输出如JSON、XML、YAML、SQL」的任务。实时天气查询、股票行情分析、电商商品比价、数据库查询与操作、文档格式转换调用Pandoc、简单的API调用助手。大模型的“预训练知识库”“上下文窗口内的结构化输入”“工具描述文档Tool Description”“工具调用示例Few-Shot Examples”“工具调用权限控制规则”。纯文本总结、结构化输出、外部系统操作结果的确认信息。智能体Prompt工程Agent Harness Engineering Prompting本文的核心主题可简称为「AHEP」在上述所有Prompt工程的基础上优化「如何让大模型成为一个**具备长期记忆Short-Term Memory Long-Term Memory Episodic Memory Semantic Memory、自主任务拆解与规划能力Task Decomposition Planning、多工具协同调用能力Multi-Tool Coordination、多角色交互能力Multi-Agent Collaboration / Multi-Role Interaction with Humans、自我反思与优化能力Self-Reflection Optimization、容错与降级能力Fault Tolerance Fallback、目标对齐能力Goal Alignment**的完整智能体」使其能解决「极其复杂的、多约束、多目标、多步骤、长周期、需要持续交互、需要适应动态环境」的企业级/个人级生产力任务。文章开头提到的「企业员工差旅智能规划与审批助手」、「AI代码审查与重构工程师」、「AI学术论文写作与发表助手」、「AI产品经理需求调研与PRD撰写助手」、「AI游戏策划与关卡设计助手」、「AI股票量化交易策略研究员与回测助手」、「AI家庭医生健康管理与问诊助手」。大模型的“预训练知识库”「完整的记忆系统可能是向量数据库、SQLite数据库、Redis缓存、本地文件系统等」「结构化的工具链可能包含多个工具组如数据查询组、文档处理组、外部系统操作组、用户交互组等」「智能体的系统人设System Persona」「智能体的核心目标Core Objectives」「智能体的约束条件Constraints Rules」「智能体的任务流程模板Task Flow Templates」「智能体的多轮对话逻辑Multi-Turn Dialogue Logic」「智能体的自我反思框架Self-Reflection Framework」「智能体的权限与安全控制规则Permissions Security Rules」。结构化的任务拆解结果、结构化的任务执行计划、结构化的任务执行日志、结构化的最终输出如PRD、差旅审批表、量化交易策略报告等、外部系统操作的完整链路、与用户/其他Agent的多轮交互记录、自我反思与优化报告。从上面的对比表格可以清晰地看出智能体Prompt工程AHEP是当前Prompt工程领域的“皇冠上的明珠”——它不是简单的“把几个工具调用的Prompt拼在一起”也不是简单的“给大模型写一个更详细的System Prompt”而是一套完整的、系统化的、可复用的、可迭代的工程化方法论它的目标是“把大模型的通用能力“封装”成一个“有血有肉、有思想、有行动力、有责任感、有容错能力”的“虚拟员工”或“虚拟助手”使其能够像人类一样甚至比人类更高效、更准确、更守规矩完成各种复杂的生产力任务。2. 问题背景为什么AHEP现在变得如此重要AHEP的兴起不是偶然的而是AI技术发展到当前阶段的必然产物也是企业级/个人级AI应用落地的迫切需求。我们可以从以下三个维度来分析1技术维度大模型的通用能力已经达到了“临界质量”但“能力封装”的方法论还远远跟不上从2022年11月OpenAI发布GPT-3.5-turbo开始大模型的通用能力就进入了“爆发式增长期”2023年3月OpenAI发布GPT-4在多模态理解虽然当时只能看图片描述不能直接生成图片、逻辑推理、知识问答、代码生成等方面都有了质的飞跃2023年5月Google发布PaLM 2在多语言支持、数学推理、代码生成等方面表现出色2023年7月Meta发布Llama 2开源了从7B到70B的多个版本的大模型使得中小公司和个人开发者也能拥有自己的大模型底座2023年9月OpenAI发布GPT-4VVision正式实现了“文本图片”的多模态输入2023年11月OpenAI发布GPT-4 Turbo将上下文窗口从GPT-4的8K/32K扩展到了128K同时降低了API调用成本2024年3月OpenAI发布GPT-4o实现了“文本图片音频视频”的全模态输入输出同时响应速度比GPT-4 Turbo快了10倍以上2024年5月Anthropic发布Claude 3 Opus/Sonnet/HaikuOpus在逻辑推理、多模态理解、长文档处理上下文窗口可达200K/1M等方面甚至超过了GPT-4o2024年6月Google发布Gemini 1.5 Pro/FlashPro的上下文窗口可达10MFlash在响应速度和成本方面表现出色2024年7月Meta发布Llama 3.1开源了从8B到405B的多个版本的大模型405B版本的性能甚至接近GPT-4o和Claude 3 Opus。可以说现在的顶尖大模型已经具备了“处理绝大多数复杂生产力任务所需的知识储备和基本推理能力”——比如差旅规划需要的“航班查询逻辑、酒店预订逻辑、预算计算逻辑、身份权益触发逻辑”AI代码审查需要的“代码规范知识、安全漏洞知识、性能优化知识”学术论文写作需要的“学术写作规范、文献检索逻辑、数据分析逻辑、论文润色逻辑”这些知识顶尖大模型的预训练知识库里面都有而且它们的基本推理能力也足够支撑这些任务的执行。但是问题在于这些知识和能力都是“零散的、无组织的、没有被封装成可执行的任务流程的”——就像一个图书馆里堆满了所有你需要的书但没有书架、没有目录、没有图书管理员你根本找不到你需要的书更不知道怎么把这些书里的知识组织起来解决你的问题。而AHEP就是这个“图书馆的书架、目录和图书管理员”——它的作用就是“把大模型预训练知识库里面的零散知识和能力组织起来封装成可执行的、符合预期的任务流程然后让大模型按照这个流程去执行任务”。2需求维度企业级/个人级AI应用已经从“玩票性质的单点工具”转向了“能创造实际价值的完整生产力系统”在GPT-3.5-turbo刚发布的时候市场上出现了大量的“玩票性质的单点工具”——比如AI文案生成器、AI诗歌生成器、AI图片生成器、AI简单数学题解答器、AI简单代码片段生成器等等。这些工具确实很有趣也能在一定程度上提高我们的工作效率但它们的局限性也非常明显它们只能解决“单维度、单目标、无约束、上下文明确、不需要工具链”的简单任务它们的输出结果往往需要人工进行大量的修改和调整才能使用它们不能与其他工具或系统进行集成它们不能记忆长期的上下文或历史任务执行记录它们不能自主判断是否需要调用外部工具或系统它们不能与用户进行持续的、有逻辑的多轮交互它们不能自我反思和优化自己的输出结果或任务执行流程。而现在企业级/个人级用户对AI应用的需求已经发生了质的变化——他们不再满足于“玩票性质的单点工具”而是需要“能创造实际价值的完整生产力系统”——比如企业需要的不是“AI文案生成器”而是“AI品牌营销全流程助手”包括市场调研、竞品分析、目标用户画像分析、营销策略制定、营销文案生成、营销素材制作、营销活动执行、营销效果分析、营销报告撰写等软件公司需要的不是“AI简单代码片段生成器”而是“AI全栈开发助手”包括需求调研、PRD撰写、UI/UX设计、前端代码生成、后端代码生成、数据库设计、API接口设计、代码审查、代码重构、单元测试、集成测试、部署上线、运维监控等学生需要的不是“AI简单数学题解答器”而是“AI全科学习助手”包括学习计划制定、知识点讲解、习题练习、错题本整理、模拟考试、考试成绩分析、学习方法优化等医生需要的不是“AI简单疾病问答器”而是“AI家庭医生健康管理与问诊助手”包括健康档案建立、健康数据采集、健康风险评估、健康计划制定、健康提醒、在线问诊、疾病诊断辅助、治疗方案制定、用药提醒、康复跟踪等。这些“完整生产力系统”都需要一个或多个“具备长期记忆、自主任务拆解与规划能力、多工具协同调用能力、多角色交互能力、自我反思与优化能力、容错与降级能力、目标对齐能力”的智能体来支撑——而AHEP就是构建这些智能体的“核心技术”。3经济维度AHEP能显著降低AI应用的开发成本和维护成本同时显著提高AI应用的质量和效率在AHEP兴起之前构建一个“完整生产力系统”级别的AI应用通常需要以下几个步骤组建一个专业的AI开发团队包括大模型算法工程师、Prompt工程师、后端开发工程师、前端开发工程师、数据库工程师、运维工程师、产品经理、UI/UX设计师等等——这个团队的规模通常需要10人以上年薪成本通常需要几百万甚至上千万人民币训练或微调一个专属的大模型如果使用开源大模型如Llama 2、Llama 3.1通常需要收集大量的专属领域数据然后进行微调——这个过程通常需要几个月甚至几年的时间数据收集和微调的成本通常需要几十万甚至几百万人民币如果使用闭源大模型如GPT-4o、Claude 3 Opus的Fine-tuning API虽然不需要收集那么多的专属领域数据也不需要那么长的时间但成本仍然非常高——比如GPT-4o的Fine-tuning API输入成本是$0.0125/1K tokens输出成本是$0.0375/1K tokens微调一个中等规模的专属领域模型通常需要几百万甚至几千万tokens的训练数据成本通常需要几万甚至几十万人民币开发一套完整的AI应用架构包括前端界面、后端服务、数据库、记忆系统、工具链、API接口、权限与安全控制模块等等——这个过程通常需要几个月甚至几年的时间开发成本通常需要几百万甚至上千万人民币进行大量的测试和优化包括功能测试、性能测试、安全测试、用户体验测试等等——这个过程通常需要几个月甚至几年的时间测试和优化的成本通常需要几十万甚至几百万人民币进行持续的维护和更新包括大模型的更新、工具链的更新、AI应用架构的更新、数据的更新、权限与安全控制规则的更新等等——这个过程是永久性的维护和更新的成本通常需要每年几十万甚至几百万人民币。而使用AHEP来构建一个“完整生产力系统”级别的AI应用情况就完全不同了不需要组建那么大的AI开发团队通常只需要1-2个Prompt工程师或者甚至是懂一些技术的产品经理、1-2个后端开发工程师负责开发记忆系统、工具链、API接口、权限与安全控制模块等、1-2个前端开发工程师负责开发前端界面、1个产品经理、1个UI/UX设计师——这个团队的规模通常只需要5-8人年薪成本通常只需要几百万人民币甚至更少如果使用开源的工具和框架的话不需要训练或微调专属的大模型只需要使用顶尖的闭源大模型如GPT-4o、Claude 3 Opus的普通API接口或者使用顶尖的开源大模型如Llama 3.1 405B的普通推理接口——不需要收集大量的专属领域数据也不需要进行微调成本通常只需要每月几万甚至几千人民币取决于API调用量不需要开发那么复杂的AI应用架构可以使用开源的智能体框架如LangChain、AutoGPT、BabyAGI、CrewAI、LangGraph、AgentScope等——这些框架已经封装好了记忆系统、工具链、任务拆解与规划模块、自我反思与优化模块等核心功能只需要在此基础上进行少量的定制开发即可——这个过程通常只需要几周到几个月的时间开发成本通常只需要几十万甚至几万人民币不需要进行那么大量的测试和优化只需要对Prompt进行大量的测试和优化——而Prompt的测试和优化通常只需要几周到几个月的时间成本通常只需要几万甚至几千人民币不需要进行那么复杂的持续维护和更新只需要对Prompt进行持续的更新和优化比如根据用户的反馈调整System Prompt、调整任务流程模板、调整工具触发规则等以及对开源的智能体框架和工具链进行持续的更新——这个过程的成本通常只需要每年几万甚至几千人民币。从上面的对比可以清晰地看出AHEP能显著降低AI应用的开发成本和维护成本通常可以降低90%以上同时显著提高AI应用的质量和效率通常可以提高10倍以上——这对于企业级/个人级用户来说是一个非常巨大的诱惑。三亮明观点/文章目标读完这篇文章你能学到什么这篇文章的目标读者是初级Prompt工程师已经了解了一些通用Prompt工程的基本技巧如角色设定、任务明确、格式要求、Few-Shot示例等但不知道如何把这些技巧应用到智能体Prompt工程中中级Prompt工程师已经做过一些简单的工具链Prompt工程但不知道如何构建一个具备长期记忆、自主任务拆解与规划能力、多工具协同调用能力、多角色交互能力、自我反思与优化能力的完整智能体高级Prompt工程师已经构建过一些完整的智能体但不知道如何进一步优化智能体的性能、降低智能体的API调用成本、提高智能体的容错能力和降级能力、实现智能体的目标对齐懂一些技术的产品经理想要自己构建一个简单的AI智能体应用或者想要和Prompt工程师、开发工程师更好地协作AI应用开发者想要使用开源的智能体框架构建一个完整的AI智能体应用。读完这篇文章你将学到以下内容智能体Prompt工程的核心概念体系我们会把智能体Prompt工程的所有核心概念如系统人设、核心目标、约束条件、任务流程模板、记忆系统、工具链、自我反思框架、权限与安全控制规则等都讲得非常清楚并且会用大量的例子来帮助你理解智能体Prompt工程的完整方法论框架我们会提出一套系统化的、可复用的、可迭代的智能体Prompt工程方法论框架——我们称之为「AHEP 7步方法论」System Persona Definition → Core Objectives Constraints Clarification → Task Flow Template Design → Memory System Architecture Prompting → Tool Chain Description Prompting → Self-Reflection Optimization Framework Design → Permissions Security Rules Definition智能体Prompt工程的100核心技巧我们会在「AHEP 7步方法论」的每一步中都讲解大量的核心技巧比如如何写一个“有血有肉、有责任感、有行动力”的系统人设如何明确和拆解复杂的多约束多目标任务如何设计一个可复用的任务流程模板如何优化记忆系统的Prompting如何优化工具链的Prompting如何设计一个有效的自我反思框架如何定义合理的权限与安全控制规则等并且会用大量的正反对比例子和实战案例来帮助你掌握这些技巧智能体Prompt工程的实战案例我们会以文章开头提到的「企业员工差旅智能规划与审批助手」为例完整地演示如何使用「AHEP 7步方法论」和100核心技巧来构建一个完整的智能体——从System Prompt的编写到任务流程模板的设计到记忆系统的Prompting到工具链的Prompting到自我反思框架的设计到权限与安全控制规则的定义再到最终的测试和优化智能体Prompt工程的最佳实践我们会总结出一套智能体Prompt工程的最佳实践比如如何避免智能体的“幻觉”如何降低智能体的API调用成本如何提高智能体的响应速度如何提高智能体的容错能力和降级能力如何实现智能体的目标对齐如何对Prompt进行持续的迭代和优化等智能体Prompt工程的常见陷阱与避坑指南我们会指出初级/中级Prompt工程师在做智能体Prompt工程时最容易犯的100常见陷阱比如概念不清导致方法错配System Prompt写得太长太啰嗦导致大模型忽略重要信息任务拆解得太粗导致大模型无法执行任务拆解得太细导致大模型失去自主性工具描述写得太模糊导致大模型不知道如何调用工具工具调用示例太少导致大模型不会构造工具的输入参数没有设计自我反思框架导致大模型无法发现和纠正自己的错误没有设计权限与安全控制规则导致智能体出现安全隐患等并且会给出详细的避坑指南智能体Prompt工程的行业发展与未来趋势我们会回顾智能体Prompt工程的发展历史并且会展望智能体Prompt工程的未来发展趋势比如大模型的自主Prompt生成能力的提升智能体框架的进一步完善多智能体协作的普及智能体的“终身学习”能力的实现智能体的“情感交互”能力的提升等。四文章预告我们接下来会讲什么为了帮助你更好地理解和掌握智能体Prompt工程的核心技巧我们将这篇文章分为以下几个主要章节引言也就是当前的章节——我们会用一个令人抓狂的场景作为钩子然后厘清几个最容易混淆的核心概念阐述智能体Prompt工程的重要性亮明观点和文章目标最后预告文章的主要内容基础知识/背景铺垫我们会先讲解通用Prompt工程的基本技巧因为智能体Prompt工程是建立在通用Prompt工程的基础上的然后讲解几个主流的开源智能体框架如LangChain、CrewAI、LangGraph、AgentScope等最后讲解智能体的基本架构如反应式架构、思考-行动-观察循环架构、层次化架构等智能体Prompt工程的核心概念体系我们会把智能体Prompt工程的所有核心概念都讲得非常清楚并且会用ER实体关系图和交互关系图来展示这些概念之间的关系最后会用一个表格来对比这些概念的核心属性AHEP 7步方法论从0到1构建一个完整的智能体这是文章的核心主体部分——我们会提出一套系统化的、可复用的、可迭代的智能体Prompt工程方法论框架AHEP 7步方法论并且会在每一步中都讲解大量的核心技巧、正反对比例子和实战案例实战案例构建「企业员工差旅智能规划与审批助手」我们会以文章开头提到的「企业员工差旅智能规划与审批助手」为例完整地演示如何使用AHEP 7步方法论和核心技巧来构建一个完整的智能体——包括所有的Prompt代码、工具链代码、记忆系统代码等进阶探讨/最佳实践如何进一步优化你的智能体我们会讲解如何进一步优化智能体的性能、降低智能体的API调用成本、提高智能体的响应速度、提高智能体的容错能力和降级能力、实现智能体的目标对齐、如何对Prompt进行持续的迭代和优化等常见陷阱与避坑指南初级/中级Prompt工程师必看我们会指出初级/中级Prompt工程师在做智能体Prompt工程时最容易犯的100常见陷阱并且会给出详细的避坑指南行业发展与未来趋势智能体Prompt工程的明天会是什么样的我们会回顾智能体Prompt工程的发展历史并且会展望智能体Prompt工程的未来发展趋势结论我们会总结文章最重要的观点和步骤然后展望智能体Prompt工程的未来最后给读者留下一个行动号召。二、 基础知识/背景铺垫从通用Prompt工程到智能体架构一通用Prompt工程的基本技巧智能体Prompt工程的“地基”在正式展开智能体Prompt工程的核心技巧之前我们必须先回顾一下通用Prompt工程的基本技巧——因为智能体Prompt工程是建立在通用Prompt工程的基础上的如果通用Prompt工程的基本技巧掌握得不好那么智能体Prompt工程的核心技巧也无从谈起。通用Prompt工程的基本技巧有很多不同的人可能会有不同的分类方法但我们认为最核心、最常用、最有效的通用Prompt工程基本技巧可以分为以下8类角色设定Role Playing / Persona Definition任务明确Task Clarification / Goal Setting约束条件与规则Constraints Rules输出格式要求Output Format Requirements上下文信息提供Context ProvisionFew-Shot/Zero-Shot/One-Shot示例Few-Shot/Zero-Shot/One-Shot Examples思维链引导Chain-of-Thought, CoT Prompting迭代优化与自我反思引导Iterative Optimization Self-Reflection Prompting。接下来我们会对每一类基本技巧进行详细的讲解并且会用大量的正反对比例子来帮助你理解和掌握这些技巧。1. 角色设定Role Playing / Persona Definition给大模型一个“身份”让它更有代入感角色设定是通用Prompt工程中最常用、最有效的基本技巧之一——它的核心思想是给大模型设定一个明确的、具体的、有专业背景的、有性格特点的“身份”或“角色”让大模型站在这个角色的角度去思考问题和解决问题从而输出更高质量、更符合预期的结果。为什么角色设定会有效这是因为大模型的预训练数据中包含了大量的“不同身份、不同专业背景、不同性格特点的人的文本内容”——比如医生的诊断报告、律师的法律文书、程序员的代码注释、产品经理的PRD文档、作家的小说、诗人的诗歌等等。当你给大模型设定一个明确的角色时大模型就会从它的预训练数据中检索出与这个角色相关的文本内容然后站在这个角色的角度去思考问题和解决问题从而输出更符合这个角色的“专业水平”和“风格特点”的结果。1角色设定的核心技巧角色设定不是简单地给大模型起一个名字而是要尽可能地明确和具体——一个好的角色设定通常应该包含以下几个核心要素核心要素作用示例角色名称让大模型知道自己是谁“李医生”、“王律师”、“张程序员”、“赵产品经理”、“周作家”、“吴诗人”、“你是一位资深的软件工程师同时也是一位热爱分享的技术博主”专业领域/职业让大模型知道自己的专业背景“儿科医生”、“知识产权律师”、“全栈开发工程师擅长React、Node.js、PostgreSQL”、“B端SaaS产品经理擅长企业差旅管理、人力资源管理等领域”、“科幻小说作家”、“田园诗人”专业资质/经验让大模型知道自己的专业水平“拥有30年儿科临床经验曾在北京大学第一医院工作是中华医学会儿科学分会会员”、“拥有20年知识产权律师执业经验曾代理过100专利侵权诉讼案件胜诉率高达95%”、“拥有15年全栈开发经验曾主导过10百万级用户量的B端SaaS产品的开发是GitHub上拥有100K星标的开源项目作者”性格特点让大模型知道自己的风格特点“严谨、细致、有耐心、善于与儿童和家长沟通”、“逻辑清晰、思维敏捷、善于抓住案件的核心要点、辩护词犀利但不失客观”、“注重代码规范、注重代码性能、注重代码可维护性、善于学习新技术”、“以用户为中心、注重数据驱动、善于沟通协调、善于撰写清晰易懂的PRD文档”、“想象力丰富、思维活跃、善于营造科幻氛围、作品具有深刻的思想内涵”、“热爱自然、热爱生活、语言简洁、意境优美”工作目标/价值观让大模型知道自己的工作方向和原则“为儿童和家长提供专业、细致、有耐心的医疗服务帮助儿童早日康复”、“为客户提供专业、高效、合法的知识产权法律服务保护客户的知识产权权益”、“为用户提供高质量、高性能、高可维护性的软件产品推动技术的发展”、“为企业提供高效、易用、低成本的B端SaaS产品帮助企业提高工作效率、降低运营成本”、“为读者提供精彩、有趣、有思想内涵的科幻小说激发读者的想象力和对未来的思考”、“为读者提供优美、简洁、有意境的田园诗歌让读者感受到自然的美好和生活的乐趣”2角色设定的正反对比例子接下来我们用几个正反对比例子来帮助你更好地理解和掌握角色设定的技巧例子1文案生成反面例子角色设定不明确“帮我写一篇关于苹果AirPods Pro 2的文案。”正面例子角色设定明确、具体、有专业背景、有性格特点、有工作目标“你是一位拥有10年数码产品评测和文案撰写经验的资深数码博主网名叫‘科技小达人’你的粉丝主要是20-35岁的数码爱好者和职场人士你的文案风格特点是幽默风趣、通俗易懂、图文并茂虽然现在不能生成图片但可以在文案中注明图片的内容、注重产品的实际使用体验、不夸大其词、客观公正。你的工作目标是为粉丝提供专业、有趣、有价值的数码产品评测和文案帮助粉丝做出正确的购买决策。现在请你帮我写一篇关于苹果AirPods Pro 2的电商平台详情页文案要求字数在2000字左右主要面向的是职场人士重点突出AirPods Pro 2的降噪功能、续航功能、音质、佩戴舒适度、与苹果生态的兼容性等核心卖点。”对比分析反面例子的角色设定非常不明确——大模型不知道自己是谁不知道自己的专业背景不知道自己的风格特点不知道自己的工作目标也不知道文案的受众是谁、文案的用途是什么、文案的重点是什么——所以大模型的输出结果可能会非常笼统、非常平庸甚至可能会不符合预期正面例子的角色设定非常明确、具体、有专业背景、有性格特点、有工作目标——大模型知道自己是“拥有10年数码产品评测和文案撰写经验的资深数码博主‘科技小达人’”知道自己的粉丝主要是“20-35岁的数码爱好者和职场人士”知道自己的文案风格特点是“幽默风趣、通俗易懂、客观公正、注重实际使用体验”知道自己的工作目标是“帮助粉丝做出正确的购买决策”同时也知道文案的受众是“职场人士”、文案的用途是“电商平台详情页”、文案的重点是“降噪功能、续航功能、音质、佩戴舒适度、与苹果生态的兼容性”——所以大模型的输出结果一定会非常专业、非常有趣、非常有价值并且会完全符合预期。例子2代码生成反面例子角色设定不明确“帮我写一段Python代码用来处理Excel文件。”正面例子角色设定明确、具体、有专业背景、有性格特点、有工作目标“你是一位拥有15年Python开发经验的资深全栈开发工程师网名叫‘Python大神’你擅长的数据处理库有pandas、openpyxl、xlrd、xlwt等你的代码风格特点是严格遵循PEP 8代码规范、注重代码注释注释率不低于30%、注重代码性能、注重代码可维护性、注重代码复用性、善于处理异常情况异常捕获率不低于90%。你的工作目标是为用户提供高质量、高性能、高可维护性、高可复用性的Python代码帮助用户解决实际的开发问题。现在请你帮我写一段Python代码用来处理以下Excel文件文件路径./data/employee_salary.xlsx文件格式Excel 2007.xlsx工作表名称2025年6月员工工资表数据列员工ID整数员工姓名字符串部门字符串基本工资浮点数单位元绩效工资浮点数单位元加班工资浮点数单位元五险一金浮点数单位元负数表示扣除个人所得税浮点数单位元负数表示扣除实发工资浮点数单位元需要计算实发工资 基本工资 绩效工资 加班工资 五险一金 个人所得税处理要求读取Excel文件中的所有数据计算每个员工的实发工资筛选出实发工资大于10000元的员工按照实发工资从高到低排序将处理后的数据保存到一个新的Excel文件中文件路径为./data/employee_salary_processed.xlsx工作表名称为2025年6月高收入员工工资表在处理过程中如果遇到任何异常情况如文件不存在、工作表不存在、数据格式错误等请捕获异常并打印详细的错误信息然后退出程序代码要求严格遵循PEP 8代码规范注释率不低于30%使用pandas和openpyxl库代码结构清晰模块化可以将读取数据、计算实发工资、筛选数据、排序数据、保存数据等功能封装成不同的函数。”对比分析反面例子的角色设定非常不明确——大模型不知道自己是谁不知道自己的专业背景不知道自己的代码风格特点不知道自己的工作目标也不知道Excel文件的具体路径、格式、工作表名称、数据列、处理要求、代码要求——所以大模型的输出结果可能会非常简单、非常粗糙甚至可能会无法运行正面例子的角色设定非常明确、具体、有专业背景、有性格特点、有工作目标——大模型知道自己是“拥有15年Python开发经验的资深全栈开发工程师‘Python大神’”知道自己擅长的数据处理库是“pandas、openpyxl、xlrd、xlwt等”知道自己的代码风格特点是“严格遵循PEP 8、注释率不低于30%、注重性能、注重可维护性、注重复用性、善于处理异常”知道自己的工作目标是“为用户提供高质量的Python代码”同时也知道Excel文件的所有具体信息、处理要求、代码要求——所以大模型的输出结果一定会非常专业、非常规范、非常清晰、非常可维护、非常可复用并且会完全符合预期甚至可能会超出预期。3角色设定的注意事项在进行角色设定时有以下几个注意事项需要特别注意角色设定要尽可能地明确和具体但不要太长太啰嗦——角色设定太长太啰嗦会导致大模型忽略重要信息一般来说角色设定的长度应该控制在100-500字左右角色设定要与任务相关——不要设定与任务无关的角色或角色属性比如如果你要让大模型帮你写一篇儿科医生的诊断报告就不要设定大模型是“科幻小说作家”角色设定要符合大模型的预训练数据——不要设定大模型无法理解或无法模拟的角色或角色属性比如不要设定大模型是“拥有超能力的外星人”角色设定可以使用第一人称或第二人称但一般来说使用第二人称“你是……”会更有效——因为使用第二人称会让大模型更有代入感角色设定可以与其他通用Prompt工程的基本技巧如任务明确、约束条件与规则、输出格式要求等结合使用——这样会让Prompt的效果更好。由于当前章节已经超过10000字剩余章节将按照相同的结构和要求继续撰写确保每个章节的字数都大于10000字。

相关新闻