AI的七层关系，你搞懂了几层？-尧图网站设计

你真的懂AI是怎么工作的吗前几天和一个做产品的朋友聊天他说他们团队在用AI写文案、做总结、跑数据分析但没人说得清AI内部是怎么运作的。“就知道往里面填提示词出来的结果有时候好有时候差跟开盲盒一样。”这不是个例。随着Claude、GPT、千问、DeepSeek一轮轮上新大家都在用AI但真正理解它怎么工作的人其实不多。今天这篇文章我用「管家」的类比把AI的工作原理拆成七层关系。不需要技术背景看完你就能跟别人讲清楚AI到底是怎么把一句话变成一篇稿子的。一张图看懂AI的七层关系整个AI系统可以想象成一家「智能管家事务所」。你用户说出需求 → 管家Agent接收任务 → 调动技能Skills→ 联络外部资源MCP→ 按家规办事Harness→ 记住聊天历史上下文→ 把你说的话拆成文字颗粒Token。这七层从外到内从用户到模型环环相扣。下面逐一拆解。第一层Token文字的最小颗粒类比文字米粒你发给AI的每一句话AI回复的每一个字在底层都会被拆成一粒粒「Token」。Token是大模型处理文字的最小单位。英文通常是一个单词或一个子词为一个Token中文通常是一个字或一个词为一个Token。为什么要拆因为大模型不直接「读懂」文字它读的是数字。每一个Token对应一个数字编号模型靠这些编号来做推理。一个直观的例子你输入「帮我写一份季度总结」这句话会被拆成大概 8~12 个 Token取决于具体模型的分词方式然后依次送入模型。干货Token数量直接决定了两件事你花了多少钱API按Token计费模型能「记住」多少内容上下文窗口有限这也是为什么你粘贴一份几十页的PDF进去模型聊到后面会「忘记」前面的内容因为上下文窗口就是下面要讲的第三层装不下了。第二层提示词你的口头吩咐提示词Prompt是你和AI交互的入口。你描述得越清楚AI干得越准。一个反例提示词「写一篇文章」AI写什么给谁看多少字什么风格一个正例提示词「帮我写一篇给职场新人的公众号文章主题是’如何高效使用AI工具’1500字左右语气亲切、有具体案例结尾有行动建议。」AI收到马上安排。干货提示词工程Prompt Engineering已经成为一门单独的技能。好的提示词通常有四个要素角色让AI扮演什么身份如「你是一位有10年经验的产品经理」任务具体要做什么约束格式、长度、风格、不能说什么范例给1~3个参考示例Few-shot不需要背模板但需要养成「把需求说清楚」的习惯。第三层上下文聊天全程备忘录类比管家的工作笔记本你和AI的每一轮对话都会被放进「上下文窗口」里作为后续回答的参考。这也是为什么你在对话里前面说了「我叫小王」后面再问「我是谁」AI能答上来。但上下文有三个限制容量有限目前主流模型的上下文窗口在 8K~128K Token 不等约几千到几万个汉字。超出后最早的内容会被「挤出去」。不是长期记忆关掉对话再开上下文就清空了除非产品层做了长期记忆功能。会「忘事」当上下文很满时模型对早期内容的注意力会下降可能出现前后矛盾。干货如果你在用AI处理长文档比如几百页的PDF与其全部塞进上下文更好的做法是用RAG检索增强生成见之前文章的介绍或者把文档拆成章节逐段处理别让管家的笔记本太满满了就容易出错。第四层Agent全能自主大管家一个具体场景你给Agent下指令「帮我调研一下市面上3款主流AI写作工具做一份对比表。」如果是传统对话框你需要分步问先问「有哪些AI写作工具」再问「Notion AI怎么样」再问「和Jasper比呢」…每一步都要你手动引导。如果是Agent它会自主规划我需要先搜索再对比最后整理成表调用工具用搜索工具查资料用爬虫读取评测分步执行按规划一步步来交付结果直接给你一份对比表干货Agent 大模型工具调用规划能力记忆目前主流的Agent框架LangChain、AutoGen、CrewAI等在之前文章里介绍过本质上都是在解决一个问题怎么让模型更靠谱地做规划、调工具、不出错。第五层Harness家规和管理制度类比管家事务所的规章制度Harness这个词在AI工程里指的是「对模型行为的约束和管理机制」。为什么需要约束因为Agent太自主了也会有风险可能调用不该调用的工具可能在没有确认的情况下执行敏感操作可能对不了模型的「幻觉」输出直接交给用户Harness通常做这几件事权限控制Agent能调哪些工具不能调哪些输出审查Agent的输出要经过一层过滤比如检查是否有敏感内容流程规范规定Agent在什么情况下需要「请示用户」什么情况下可以自主决策错误处理Agent失败了怎么重试、怎么回滚干货如果你在搭建自己的Agent系统Harness层的设计直接决定了系统的可靠性。一个经验法则凡是涉及「发送邮件」「删除文件」「对外发布内容」的操作一定要加人工确认环节。让Agent自主「写草稿」可以但「点发送」必须人来控制。第六层MCP内部联络总交换机类比管家事务所的内部通讯系统MCPModel Context Protocol是AnthropicClaude的公司2024年底推出的一个开放协议目的是解决一个问题让AI模型能够统一、安全地连接各种外部工具和数据源。在MCP出现之前每个AI应用都要自己写一套「连接外部工具」的代码重复劳动而且不互通。MCP相当于给AI模型提供了一个「标准化插座」。只要工具方按照MCP协议提供了接口任何支持MCP的AI都能直接连上用。目前已经支持MCP的工具包括文件系统读写本地文件数据库PostgreSQL、SQLite等浏览器自动化GitHub、GitLabSlack、Notion…以及越来越多第三方工具。干货MCP的价值在于「标准化」。就像USB接口统一了设备连接一样MCP有望统一AI和外部工具的连接方式。如果你是一名开发者现在学习MCP协议的性价比很高因为它是趋势而且目前懂的人还不多。第七层Skills管家的各项手艺类比管家会的具体技能包Skills就是Agent能调用的具体能力搜索、读文件、写代码、画图表、发邮件、做PPT…一个关键认知模型本身是「通用智能」它懂很多但不一定擅长具体任务。Skills是把「通用能力」变成「专业能力」的桥梁。举个例子Claude本身会写代码但如果给它配上「运行代码」的Skill它就能真的把代码跑起来、看到运行结果、然后基于结果来调试这就从「会写」变成了「会做」。目前最常见的Skills包括搜索类联网搜索、学术搜索文件类读PDF、读Word、读Excel代码类运行Python、执行SQL创作类生成图片、生成图表集成类发邮件、发企业微信、创建日历事件干货如果你在用Claude、GPTs、Coze这类平台可以主动去「Skill市场」里看看有哪些能力可以开启。很多时候你以为AI做不到的事其实只是一个Skill没打开而已。七层关系一张表总结学完有什么用理解这七层关系有三个实际好处第一用AI更高效。你知道提示词怎么写更清楚知道上下文有什么限制知道为什么有时候AI会「失忆」。第二选工具更明白。看到一个新AI产品你能大致判断它强在哪一层弱在哪一层适不适合自己的需求。第三如果要做AI应用知道从哪入手。想做Agent先搞清楚Harness怎么设计。想接外部工具去看看MCP协议。想让AI更专业去配Skills。写在最后AI没那么神秘也没那么简单。说它不神秘是因为它的核心工作原理用「管家事务所」的类比就能讲清楚。说它不简单是因为每一层都有很深的技术细节真正要做稳定、可靠、安全的AI系统需要大量的工程实践。这篇文章的目的是帮你建立一个「认知框架」。有了框架后面学什么都快。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

AI的七层关系，你搞懂了几层？

相关新闻

FPGA上G-AETCAM架构：门级实现TCAM，面积优化25倍

AI 自动化编程 trae 从idea转过来版本控制

动态相量模型与FPGA并行计算在混合MMC实时仿真中的应用

2026学生降AI率平台盘点：省时省力+高分适配哪家强？

计算机视觉驱动的鸭蛋双黄与裂纹与新鲜度无损检测【附代码】

我用3天做了一款旅行规划APP，上线第一天爆了！当天就有11个全5星好评！

Canopy：基于Electron的AI编程代理管理桌面应用，重塑多分支开发工作流

规范驱动开发实践：ZeeSpec工具在Greenfield与Brownfield项目中的应用

经验回放实战：从DQN到优先经验回放的演进与调优

内容创作团队整合大模型API为不同环节匹配最佳模型的实践

迪文T5L1芯片串口屏开发笔记：DMG80480C070_03WTC的RAM与Flash空间到底怎么分？

树莓派Pico的SPI和I2C到底怎么选？一个实际项目带你搞懂区别与选型

让 AI 做代码 Review（CR）：测试如何提前在代码提交阶段发现 Bug？

问题不是要不要审，而是审查放在哪条路径

水纹真实度提升300%的关键技巧，深度拆解--style raw、--chaos 45与自定义tile texture协同机制

别再手动点关了！用PowerShell永久关闭Windows Defender的保姆级教程（含Server 2016/2019）

别再只换芯片了！BP2832A替换CL1502，你的电感参数算对了吗？

全平台智能资源下载工具：res-downloader 完整使用教程