
文章探讨了在复杂场景中如何通过引入“Skill”的概念来提升Agent的协作效率。Skill作为模型能力、工具能力之上的能力组织方式能够将知识、流程、模板、脚本和边界条件进行有效组织使Agent按需调用。文章详细解释了Skill的定义、工作原理、设计模式以及最佳实践强调了Skill在提升Agent专业性和稳定性方面的关键作用并指出Skill并非万能仍需与治理和执行层约束相结合。最终文章提出Skill是Agent时代的新基础设施将组织方法转化为机器可管理的能力单元成为未来AI竞争的重要壁垒。把 Agent 用进复杂场景后很多团队都会遇到同一个问题模型会做事不等于模型会按你的方法做事。它知道怎么读文件却未必知道先读哪类文件。它知道怎么生成文档却未必知道你们内部文档的固定结构。它能调工具、跑脚本、写内容但并不天然理解什么情况下必须先验证什么情况下要停下来让人确认什么情况下只能按模板输出。这时候你会发现Prompt 不够Tool 也不够。中间其实还缺一层东西把知识、流程、模板、脚本、边界条件组织起来并且让 Agent 在需要时按需调用。这层东西就是 Skill。Anthropic、OpenAI Codex 和 GitHub Copilot 现在都把 Skills 定义成一种由指令、脚本和资源组成、可在相关任务中动态加载的能力包开放规范则把它进一步抽象成一种轻量、可移植的标准格式。Anthropic所以Skill 真正补的不是模型能力也不是工具能力而是Agent 的能力组织方式。为什么 Agent 时代会长出 Skill 这一层如果把今天的 Agent 系统拆开来看大致有三层第一层是模型本身。它提供通用理解、生成、推理能力。第二层是工具与外部连接。它让模型能搜索、读写文件、调 API、访问数据库、执行脚本。MCP 本质上就是这一层的标准化接口它定义了一种开放协议让 AI 应用可以和外部工具、数据源建立双向连接。Anthropic第三层才是很多人以前忽略的这类任务平时应该怎么做。这不是“会不会”的问题而是“应该怎么更稳、更像团队成员地做”。比如同样是代码审查模型能不能读 diff能。模型能不能调用 GitHub能。模型能不能输出一份 review能。但它知不知道你团队审查时先看什么、用什么严重等级、哪些问题必须解释原因、哪些改动必须要求补测试、最后报告怎么分组输出这部分不是模型参数自带的也不是 MCP 自带的更不是单次 Prompt 能长期解决的。它更像一种程序性知识做事的方法、顺序、检查点、模板和边界。Anthropic 在介绍 Skills 时强调的正是这种 procedural knowledge 和 organizational context真实工作不只需要模型和工具还需要组织化的方法。Anthropic这就是 Skill 出现的根本原因。Skill 到底是什么不是 Prompt 搬家而是能力封装很多人第一次看到 Skill会觉得它像“Prompt 的升级版”。这只说对了一半。Skill 当然离不开 Prompt因为它最后仍然要以文本形式指导模型。但它和普通 Prompt 的关键差别不在“写得更长”而在于它不是为一次会话设计的。Anthropic 把 Skills 定义为基于文件系统的可复用资源按需加载到 Agent 中OpenAI Codex 把 skills 定义为 reusable workflows 的 authoring formatGitHub Copilot 则明确写到agent skills 是由 instructions、scripts 和 resources 组成的文件夹Copilot 会在相关时加载它们。Anthropic这说明 Skill 至少有三个特征1. 它是模块化的不是一段散落在对话里的说明而是一个独立能力单元。2. 它是可复用的不是这轮对话讲一遍下轮对话再讲一遍而是一次封装多次调用。3. 它是可扩展的不只包含正文还能带脚本、参考资料、模板、资源文件。所以Skill 不是一句提示词。它更像一个小型能力包Prompt解决“这次怎么说”Tool解决“现在能做什么”Skill 解决“这类事平时怎么做更稳”换句话说Prompt 更像一次沟通Tool 更像一次调用Skill 更像一次能力沉淀。Skill 是怎么工作的发现、激活、加载、执行这是理解 Skill 最关键的一章。如果只把 Skill 看成“一个带SKILL.md的文件夹”你会低估它最有价值的部分。Skill 真正精妙的地方不在于目录结构本身而在于它把 Agent 的能力使用过程做成了一套按需展开的机制。Anthropic 官方把这套机制叫做 progressive disclosure开放规范和 Copilot、Codex 的实现也都遵循同样思路先暴露最轻量的信息再在相关时读取正文最后在需要时才展开脚本和参考资料。Anthropic这套机制可以拆成四步。1. 发现先让模型知道“有哪些 Skill 可用”会话开始时系统通常不会把每个 Skill 的完整内容都塞进上下文。它只先放进去最轻量的一层名字和描述。这一层的目的不是教模型怎么干活而是让模型知道这里有一个“代码审查”能力这里有一个“PDF 处理”能力这里有一个“技术报告生成”能力也就是说模型先拿到的是能力目录而不是全部说明书。Anthropic 文档明确说明frontmatter 元数据会先进入系统提示帮助模型知道有哪些 Skill 以及何时该用。Anthropic2. 激活相关时再读取完整SKILL.md只有当当前任务和某个 Skill 的描述相匹配模型才会进一步读取完整正文。这一步才是真正的“激活”。这里最重要的一点是Skill 通常不是靠硬编码关键词触发而是靠模型基于 description 做相关性判断。GitHub Copilot 和 Anthropic 都明确写到skills 会在“相关时”被加载而不是默认全部读入。GitHub Docs也正因为如此description 的角色远比很多人想象中重要。它不是给人看的简介而是 Skill 的第一层调度接口。3. 加载正文进入上下文流程和边界才真正可见当 Skill 被激活后模型才会看到SKILL.md的正文。这部分通常承担三种职责说明这类任务的高层流程指出需要读哪些额外资料约束哪些边界不能突破这一层不是“长说明书”而更像一张“操作总览图”。4. 执行需要时再去读 references、跑 scripts、用 assets即便SKILL.md已经进入上下文也不代表 Skill 目录里的所有内容都会被一口气读完。如果正文引用了references/里的技术文档scripts/里的执行脚本assets/里的模板、schema、示例模型通常只会在需要时才继续访问这些内容。Anthropic 和开放规范都把这视为 Skills 可扩展性的关键详细内容和大型资源不应该默认进入上下文而应该被正文按需引导。Anthropic这套机制为什么这么重要因为 Agent 最大的隐藏成本之一就是上下文管理成本。如果你给系统装了 20 个 Skill却要求它每轮对话都先读完 20 份完整正文、脚本说明和参考资料系统很快就会变得又慢又贵还会被无关信息淹没。渐进式加载解决的正是这个问题。它带来的不只是“省一些 token”而是一次更深的变化过去是一次性注入能力现在是按需调度能力所以Skill 的价值不只是可复用更是它让 Agent 第一次拥有了某种能力调度机制。Skill、MCP、Prompt、Workflow它们不是一回事很多讨论一到这里就会混Skill 和 MCP 到底是什么关系是不是有了 SkillMCP 就没用了Workflow 和 Skill 又是不是一回事把它们放在同一层比较其实就已经错了。更准确的理解方式是把它们看成不同层的东西。1. Prompt一次表达层Prompt 的作用是告诉模型这次该怎么回答、怎么输出、怎么扮演角色。它擅长的是一次性任务。缺点也很明显会话结束很多方法也就跟着消失了。2. Workflow流程组织层Workflow 解决的是“先做什么后做什么”。它适合多步任务但本身并不天然携带知识、模板、术语表、脚本和组织规范。换句话说Workflow 负责顺序未必负责内容。3. MCP外部连接层MCP 是开放协议核心价值在于统一 AI 应用与外部工具、数据源之间的连接方式。Anthropic 对 MCP 的官方定义是一种开放标准使开发者能够为 AI 工具和数据源之间建立安全的双向连接。Anthropic所以 MCP 回答的问题是模型怎么连数据库怎么连 GitHub怎么连 Notion怎么连第三方 API它解决的是接外部世界。4. Skill内部能力层Skill 解决的不是“连什么”而是“连上之后这类事通常怎么做”。它更像知识封装流程模板工具编排边界说明输出约束所以更准确的关系是MCP 像外部连接层Skill 像内部能力层。MCP让 Agent 接世界Skill 教 Agent 做事情。这两者不是替代关系更可能是协作关系。Anthropic 和 OpenAI 对 Skills 的定义都在强调 workflows 和 resources而不是协议连接本身这恰恰说明它们在系统分层里承担的是不同角色。AnthropicSKILL 格式规范为什么它必须长成SKILL.md resources理解了 Skill 的工作机制再回头看格式规范就会发现它不是为了“看着整齐”而是为了让发现、激活、执行这三步成立。今天比较主流的规范里一个 Skill 的最小形态通常就是一个目录里面至少有一个SKILL.md。其余的scripts/、references/、assets/都属于可选扩展。GitHub1. 为什么必须有统一入口文件如果一个 Skill 只有脚本没有入口说明模型不知道什么时候该用它如果一个 Skill 只有零散文档没有统一入口模型也很难把它纳入发现机制。SKILL.md的作用就是同时承担两件事对上作为发现入口对下作为执行导航它既不是普通 README也不是单纯说明文档而更像这个 Skill 的 manifest。2. 为什么要用 frontmatter 正文开放规范要求SKILL.md至少包含name和description两个元数据字段并用 Markdown 正文来写详细指令。GitHub这背后的逻辑其实很清楚name解决“它是谁”description解决“什么时候该用它”正文解决“被用到之后怎么执行”也就是说格式设计本身就在服务运行机制。3. 为什么要把资源拆到不同目录把所有内容都塞进正文短期看最省事长期看最糟糕。把资源拆出去的好处非常直接正文保持轻量细节知识按需展开脚本单独维护更可靠模板和 schema 更容易复用Anthropic 官方 best practices 也强调SKILL.md更适合承担 overview 和 navigation详细资料应拆分到被引用的独立文件中。Anthropic所以Skill 之所以长成SKILL.md resources不是社区偶然约定而是因为这种结构刚好同时满足了四个要求可发现、可加载、可执行、可维护。如何设计一个真正好用的 Skill知道 Skill 是什么不代表你会设计 Skill。真正难的是什么样的 Skill模型会用、会触发、会执行而且执行得稳。这里最重要的不是“把正文写长”而是把几个关键问题想清楚。1. 先定义边界再写说明Skill 一开始最该回答的不是“正文分几步”而是它到底解决哪一类任务它在什么情况下应该被触发它最终要产出什么它和其他 Skill 的边界在哪里如果这些问题没定义清楚Skill 很快就会越写越散最后变成“大而全”的杂物箱。真正好用的 Skill往往不是功能最多的而是边界最清晰的。2. description 只负责触发不要偷写流程一个常见错误是把 description 写成“流程摘要”。问题在于模型可能把 description 当成已经足够的信息从而绕过完整正文。更稳的写法是让 description 只描述这类任务是什么用户通常会怎么表达哪些情况属于适用边界也就是说description是触发器不是正文压缩版。3. 正文写“为什么”不要只堆“必须”很多人写 Skill 会本能地用强约束语气必须这样不得那样永远先做 A绝对不能跳过 B短期看很有控制力但任务稍微变化时模型就容易要么机械执行要么自己找借口偏离。更有效的写法是把原因也写进去为什么这里必须先验证为什么这里要停下来确认为什么这里不能直接生成最终结果今天的模型并不缺服从它更缺的是对规则背后意图的理解。4. 先观察重复模式再决定沉到哪一层如果你发现 Agent 在多次任务里总在重复同一类动作那就是信号。比如总在重复写某个解析脚本总在重复做某种检查总在重复引用某份资料总在重复套某种模板这时真正要做的不是继续在 Prompt 里提醒它而是判断这些东西该沉到 Skill 的哪一层。行为原则放正文细节知识放 references模板骨架放 assets机械动作放 scriptsSkill 设计真正的工程感就在这里不是“写更多”而是“把不同类型的信息放到最合适的层里”。5. 控制自由度而不是一味追求更严格不是所有 Skill 都该写得一样死。Anthropic 的 best practices 明确建议为不同任务设置合适的自由度。Anthropic代码审查这类任务通常需要较高自由度模板生成往往适合中等自由度数据库迁移、表单处理、发布脚本这类脆弱操作更适合低自由度甚至直接脚本化所以Skill 设计不是“越严越好”而是自由度和任务风险匹配得越准越好。Skill 设计模式不同问题要用不同结构Skill 最容易犯的错误之一就是把所有问题都写成同一种样子。可现实不是这样。有些 Skill 本质上是在封装知识有些在生成结构化内容有些在做审查有些在做需求澄清还有些在管理多步工作流。也就是说Skill 设计首先不是文案问题而是结构选择问题。我更倾向把常见的 Skill 分成五种模式。1. Tool Wrapper适合封装专家知识、技术规范、团队约定。它的重点不是把所有知识都塞进正文而是让 Agent 在相关任务出现时知道去哪里加载真正重要的资料。2. Generator适合模板驱动的结构化输出。比如报告、PR 模板、API 文档、周报纪要。这类 Skill 的价值不是更会写而是让输出结果更一致。3. Reviewer适合代码审查、安全检查、内容审核。这类 Skill 的重点不是“发现问题”本身而是把审查清单、严重等级、解释逻辑和输出结构拆开。4. Inversion适合需求不清、必须先采访用户的场景。它的核心不是直接做而是先问清楚再开始做。特别适合项目规划、需求整理、复杂方案定义。5. Pipeline适合复杂多步任务。这类 Skill 最重要的不是知识量而是顺序和检查点。每一步都要尽量写清输入是什么输出是什么如何验证是否允许继续是否需要人工确认所以Skill 设计的本质不是往文件里塞更多信息而是先判断这类问题到底更像知识封装、模板生成、审查执行、需求澄清还是多步管道。Skill-CreatorSkill 不是拍脑袋写出来的而是从成功工作流里提炼出来的理解了设计模式之后再往前一步就会碰到一个更关键的问题一个好 Skill到底是怎么来的最差的方法是坐在白板前凭空想。更好的方法是从已经跑通的工作流里提炼。Anthropic 官方把skill-creator作为一个专门帮助构建 Skills 的能力来介绍重点不是“替你写一个文件”而是帮助你把任务目标、触发场景、资源和迭代过程组织成一个真正可复用的 Skill。Anthropic它背后的思想其实很简单Skill 的原料不是灵感而是经验。一条成功工作流里通常已经包含最关键的东西任务是怎么定义的步骤是怎么拆的工具是怎么配合的哪些检查最关键什么结果才算完成Skill-Creator 的价值不是凭空造一套流程而是把这些隐性的“好做法”抽出来变成结构化能力。这件事真正改变的是 Skill 开发的心智模型过去Prompt Engineering 更像文案优化现在Skill Engineering 更像工程设计。一个成熟的 Skill不应该只靠作者主观觉得“写得不错”而应该经过真实任务验证没有 Skill 时Agent 会怎么做有 Skill 时行为有没有改善哪些规则真的起作用哪些脚本和模板值得正式沉淀所以Skill 不是拍脑袋写出来的。它更像是一种从成功任务中提炼、再被测试和迭代过的能力工程。Skill 最佳实践什么样的 Skill 才真正跑得起来如果把前面所有东西压成几条最实用的原则我会总结成四条。1. 简洁优先Anthropic 官方 best practices 反复强调简洁是关键。上下文窗口是共享资源Skill 只应该补模型不知道、而且会影响结果质量的内容。Anthropic2. 复杂任务要显式写 workflow 和 feedback loop只写“做这件事”是不够的。复杂任务需要顺序步骤脆弱任务需要“做完立刻验证”的回路。Anthropic3. 能脚本化的不要只停留在说明层如果某类动作本来就适合写成脚本就不要每次都让模型重新想办法实现。这会让 Skill 的可靠性高很多。Anthropic4. description 优先于正文优化一个再强的 Skill如果触发不了就等于不存在。所以成熟的 Skill 开发流程里description 优化不应该是边角活而应该是显式的一环。Anthropic风险与边界Skill 很强但它不是“真约束”讲到这里也必须把话说透Skill 很有用但它并不是万能的。它最大的局限在于很多时候它仍然只是上下文里的软规则。也就是说只要一项规则还停留在文本里只靠模型去理解和遵守它就终究不是真正的执行层约束。真正高风险的动作——比如发钱、删库、改生产配置、对外发送正式内容——仍然需要权限系统、执行层校验、审计机制和人工确认来兜底。Skill 可以显著提升行为质量但不能单独承担安全边界。此外Skill 还很容易出现两个现实问题一个是膨胀。每次补一点规则、加一个边界情况、再添一个示例最后一个原本轻量的 Skill 很容易变成又大又慢、难以维护的怪物。另一个是工程成本。做一个好 Skill 不只是“写个SKILL.md”还涉及触发准确率、执行稳定性、资源组织、迭代维护。越往生产环境走这套东西越像工程而不是单纯写提示词。所以Skill 最合理的定位不是“万能能力层”而是Agent 的能力组织层。它让系统更专业、更稳定、更像一个团队成员但它不能代替治理也不能代替执行层约束。Skill 不是 Prompt 的升级而是 Agent 的能力组织方式如果把这件事看得再远一点你会发现Skill 最值得重视的不是它让我们多了一个新名词。而是它让 Agent 的能力第一次真正开始被当成“工程资产”来处理。过去做事方法留在会话里。现在它开始被写进目录、拆成资源、接成脚本、形成标准。过去Prompt 更像一次沟通。现在Skill 更像一次沉淀。从这个意义上说Skill 不是 Prompt 的升级版也不只是 Tool 的补丁。它更像是 Agent 时代正在长出来的一层新基础设施把组织的方法变成机器可发现、可调用、可执行、可维护的能力单元。未来真正有壁垒的未必只是模型谁更强。更可能是谁更早把自己的经验、流程、规范、模板和工具编排沉淀成一整套可运行、可迭代的 Skill 体系。到那时竞争的重点就不再只是“谁有更大的模型”而是谁更会把自己的方法变成 Agent 的能力。说真的这两年看着身边一个个搞Java、C、前端、数据、架构的开始卷大模型挺唏嘘的。大家最开始都是写接口、搞Spring Boot、连数据库、配Redis稳稳当当过日子。结果GPT、DeepSeek火了之后整条线上的人都开始有点慌了大家都在想“我是不是要学大模型不然这饭碗还能保多久”我先给出最直接的答案一定要把现有的技术和大模型结合起来而不是抛弃你们现有技术掌握AI能力的Java工程师比纯Java岗要吃香的多。即使现在裁员、降薪、团队解散的比比皆是……但后续的趋势一定是AI应用落地大模型方向才是实现职业升级、提升薪资待遇的绝佳机遇这绝非空谈。数据说话2025年的最后一个月脉脉高聘发布了《2025年度人才迁徙报告》披露了2025年前10个月的招聘市场现状。AI领域的人才需求呈现出极为迫切的“井喷”态势2025年前10个月新发AI岗位量同比增长543%9月单月同比增幅超11倍。同时在薪资方面AI领域也显著领先。其中月薪排名前20的高薪岗位平均月薪均超过6万元而这些席位大部分被AI研发岗占据。与此相对应市场为AI人才支付了显著的溢价算法工程师中专攻AIGC方向的岗位平均薪资较普通算法工程师高出近18%产品经理岗位中AI方向的产品经理薪资也领先约20%。当你意识到“技术AI”是个人突围的最佳路径时整个就业市场的数据也印证了同一个事实AI大模型正成为高薪机会的最大源头。最后我在一线科技企业深耕十二载见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我整理出这套 AI 大模型突围资料包【允许白嫖】✅从入门到精通的全套视频教程✅AI大模型学习路线图0基础到项目实战仅需90天✅大模型书籍与技术文档PDF✅各大厂大模型面试题目详解✅640套AI大模型报告合集✅大模型入门实战训练这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】①从入门到精通的全套视频教程包含提示词工程、RAG、Agent等技术点② AI大模型学习路线图0基础到项目实战仅需90天全过程AI大模型学习路线③学习电子书籍和技术文档市面上的大模型书籍确实太多了这些是我精选出来的④各大厂大模型面试题目详解⑤640套AI大模型报告合集⑥大模型入门实战训练获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】