
你先知道一件事如果你用过一些聊天型 AI 产品应该很容易发现一个问题前面刚说过的事过几轮它就像忘了。为什么这一步重要这并不一定是模型真的“失忆”更可能是系统没有做好短期记忆管理。在 AI 工程里短期记忆通常指的是当前对话或当前任务过程中的上下文信息。比如用户刚才问过什么、模型已经回答了什么、上一轮工具返回了什么结果。但短期记忆也不是把所有内容无脑塞回去。那样只会让上下文越来越长成本越来越高效果还可能变差。所以今天你要建立的是一种很实用的判断哪些信息值得带到下一轮哪些可以丢掉。比如用户的上一轮问题、任务目标、关键限制条件通常值得保留。可一些寒暄、重复表述、已经完成的中间过程就不一定要一直带着。对零基础来说短期记忆最简单的实现方式就是在程序里保存最近几轮对话然后在下一次调用模型时一起传入。哪怕只是手动保存最近三轮也已经足够让你理解很多事情。你会直观看到有记忆和没有记忆的体验差别非常大。当然这一步也会让你接触到更现实的问题上下文越长成本越高保留太多噪音模型反而更容易偏保留太少连贯性又不够。这正是 AI 工程的典型状态。不是找一个永远正确的答案而是在效果、成本和复杂度之间找平衡。今天的最低产出常见误区为什么这件事重要因为很多 AI 应用并不是一次性问答。用户会连续追问任务会多步推进系统如果完全不保留上下文很快就会显得前后不连贯。今天要做的 3 件事把今天的核心概念先讲清楚。做一个最小练习确保不是只停留在理解层面。留下可复用的笔记、脚本或实验记录。让你的程序支持保留最简单的多轮上下文哪怕只保留最近两三轮对话也可以。一句提醒只要你做过这一步就会明白所谓“会聊天”和“会连续完成任务”之间差的往往就是记忆管理这一层。