
一、前言传统大模型 Agent 记忆普遍采用上下文窗口Context Window短记忆 长短记忆二分法模式短时对话全塞进 Prompt长时记忆仅做整体摘要归档存在三大典型痛点(1) 上下文无限堆砌Token 冗余严重触发窗口截断后关键信息随机丢失(2) 长记忆笼统汇总无法区分固定事实、阶段性行为、临时状态检索精度极低(3) 记忆更新策略一刀切高频信息、低频沉淀信息、永久事实共用一套更新逻辑要么频繁无效重写要么关键信息长期不迭代失效。DeerFlow 使用User 活跃短期记忆 History 时序中长期记忆 Facts 结构化事实永久记忆三级记忆全景架构DeerFlow 跳出传统 “短时 / 长时二元划分” 思维以信息更新频率、信息粒度、生命周期时效三个核心维度完成记忆切分系统性解决上下文冗余、信息丢失、记忆管理粗放问题。本文围绕架构设计原理、长期记忆拆分必要性、记忆爆炸防控机制三大核心问题展开完整拆解。二、DeerFlow 长短期记忆整体设计方案一三级记忆定位、更新节奏、生命周期与核心职能总览记忆层级层级定位更新频率生命周期核心作用User 用户上下文活跃短期记忆每轮对话实时刷新小时天级新内容覆盖旧内容捕捉用户当下瞬时状态、即时关注点、当前工作会话上下文支撑本轮对话即时应答是每一轮 LLM 推理的核心输入上下文History 历史分层时序中长期记忆按月 / 季度低频聚合更新月年级增量迭代、非全覆盖重写沉淀用户阶段性行为轨迹、工作节奏、时间线事件、阶段性目标变化还原用户完整行为演变脉络Facts 事实列表结构化永久记忆极低频校验更新永久 / 半永久存储可修正、可淘汰存储离散、可复用、具备置信度的确定性知识点、偏好、行为习惯、长期目标支持精准检索、条件过滤调用二各层级数据模型与存储内容明细1. User 短期活跃记忆本轮对话即时记忆对应结构体user: { workContext: {summary: , updatedAt: }, personalContext: {summary: , updatedAt: }, topOfMind: {summary: , updatedAt: }}workContext当前正在进行的项目、任务、技术需求、待解决问题、会话中途临时约定personalContext本轮对话生效的输出风格、行文偏好、排版要求、沟通习惯topOfMind用户当下最核心诉求、临时关注点、未收尾疑问。设计逻辑该层级是对话 “临场缓存”不需要留存过往多轮冗余细节每轮对话结束后基于本轮交互总结重写旧状态直接被覆盖生命周期较短超过 1~3 天未复用可主动清空避免无效短时信息挤占存储与上下文空间保证每轮推理输入轻量化。2. History 中长期时序记忆动态长期记忆主体对应结构体history: { recentMonths: {summary: , updatedAt: }, earlierContext: {summary: , updatedAt: }, longTermBackground: {summary: , updatedAt: }}存储内容recentMonths近数月阶段性行为、项目迭代历程、阶段性学习计划、诉求变化轨迹earlierContext半年以上过往项目、过往诉求、阶段性经历longTermBackground人生 / 职业里程碑、长期发展路线、重大背景基线。设计逻辑不以单条零散事实存储而是时序化摘要聚合记录 “变化过程”体现用户动态演变属于动态长期记忆。3. Facts 结构化事实记忆静态长期记忆主体单 Fact 标准结构{ id: fact-{uuid8}, content: Uses VS Code as primary editor, category: preference, confidence: 0.9, createdAt: ..., source: thread-abc123}分类维度preference偏好、knowledge固有知识、context基础背景、behavior固定行为、goal长期目标。存储内容用户不会频繁变动、具备确定性的离散单点信息例如固定编辑器、技术栈、固定作息、固有认知、长期规划、固定沟通偏好等。每条事实附带置信度打分机制0.5无效推断自动丢弃0.5~0.7弱推导结论标记待复核0.7~0.9强逻辑推导结论0.9~1.0用户明确口述明示事实可信度最高。该层级内容稳定性极强极少发生变更属于静态长期记忆。三回答问题 1长期记忆怎么设计的DeerFlow 体系下长期记忆 History 时序动态长期记忆 Facts 结构化静态长期记忆二者存储内容边界清晰【1】History动态长期记忆存储时序化过程、行为演变、阶段性轨迹聚焦 “变化”记录用户随时间推移产生的行为、项目、目标迭代过程是连续叙事型总结例如近半年从传统后端开发转向大模型应用落地、先后做过 RAG 知识库、Agent 架构设计、量化交易模型迭代等阶段性历程。【2】Facts静态长期记忆存储离散、稳定、可复用确定性单点事实聚焦 “不变”剥离时间波动沉淀固化属性信息可单独检索调用例如固定使用 Java 技术栈、偏好 Markdown 结构化文档、常年研究 AI Agent 工程化等稳定特征。四长短记忆整体流转逻辑每一轮对话执行链路【1】读取 User 短时记忆 匹配检索相关 Facts 静态事实注入本轮 Prompt支撑实时应答【2】对话结束后置流程更新覆盖 User 短时记忆【3】定时批量聚合按月 / 季度汇总对话信息增量更新 History 中长期时序总结【4】事实抽取校验异步抽取本轮有效信息判断是否新增、修改、淘汰 Facts 事实条目。三、回答问题 2为什么要将长期记忆拆分为静态长期记忆Facts 动态长期记忆History传统方案把所有长期内容揉成一段总摘要会出现信息混杂、检索低效、更新混乱三大问题拆分两类长期记忆是基于信息本质差异做精细化治理核心五点必要性1. 信息属性本质不同一个是 “过程”一个是 “结论”History 记录动态变化过程用户想法、项目、工作重心会持续迭代核心价值是还原时间线脉络适合段落式时序摘要Facts 记录静态固化结论个人偏好、基础背景、固有技能具备稳定性核心价值是单点精准复用适合结构化条目存储。若混为一体查询 “用户常用编辑器” 这类单点信息时需要遍历大段历史摘要做冗余匹配效率极低。2. 更新频率与变更逻辑完全不同History 仅按月、季度低频增量汇总只新增阶段性总结不会推翻过往整体基线迭代节奏慢、整体改动幅度小Facts 极慢迭代只有用户明确修正原有认知、更换固有习惯时才修改或删除条目绝大多数事实长期无需改动。统一存储会出现为了少量事实修改频繁重写整段长篇历史摘要产生大量无效存储开销。3. 调用场景与检索模式差异化Facts 支持向量检索、分类过滤、置信度筛选按需抽取少量关键事实注入上下文轻量化、精准化History 多用于全景复盘、长周期背景溯源一般不会全量塞进单次对话 Prompt仅在需要完整了解用户过往脉络时按需引用片段摘要。不分层会造成要么长记忆全部塞进上下文超限要么为了压缩丢失关键单点信息。4. 信息容错与置信度管理需要隔离Facts 自带置信度、来源溯源、分类标签可自动剔除臆测性弱推断内容管控事实准确性History 是概括性叙事总结允许适度归纳整合无需逐条置信校验。合并后无法区分 “确凿事实” 和 “归纳推测内容”极易产生记忆幻觉、错误认知沉淀。5. 生命周期淘汰策略可独立配置静态事实可设置过期复核机制多年未使用事实降级、归档动态时序记忆按时间分段归档早期久远历史可压缩精简二者可配置独立回收规则统一长期存储无法精细化做生命周期治理。四、追问每一轮对话都触发长期记忆存储会不会引发记忆爆炸每一轮对话都触发长期记忆存储会不会引发记忆爆炸 配套治理方案是什么一结论先行DeerFlow并不会每一轮对话都直接写入长期记忆架构本身内置分层写入阈值、异步聚合机制、限流策略天然规避逐轮写入导致的记忆膨胀即便存在长期累积增量体系配套完整的写入限流、增量聚合、压缩归档、淘汰清理、检索裁剪五层治理方案从源头、增量、存量全链路防控记忆爆炸。二源头防控从写入规则杜绝逐轮冗余落库【1】User 短时记忆覆盖式更新天然不膨胀短时记忆采用覆写逻辑始终只保留当前一轮会话总结不会累加历史内容存储体量固定不存在无限膨胀问题。【2】History 中长期记忆拒绝逐轮写入定时批量增量聚合架构设计约束History 不随单轮对话触发修改设置固定聚合窗口月度 / 季度周期内汇总全部对话摘要增量补充、整体精简合并不会把每一轮聊天逐条追加进历史。举例一个月数百轮对话最终仅浓缩一小段月度总结写入recentMonths单周期仅产生一条增量数据写入频次极低从根源避免海量条目堆积。【3】Facts 事实列表抽取校验前置过滤无效写入单轮对话后不会无脑抽取所有内容生成 Fact设置多层过滤规则临时情绪、单次随口提问、瞬时临时诉求判定为短时信息直接舍弃不进入事实库抽取内容先做相似度匹配库内已有高度近似事实则跳过新增仅在内容冲突时触发修正审核弱置信推断confidence0.7默认不入库仅高置信、有明确来源的确定性信息才允许新增 Fact配置单轮最大新增 Fact 条数上限防止单次交互批量生成冗余事实。三存量治理五层长效防爆炸机制1. 事实生命周期分级归档与淘汰冷事实判定超过设定年限从未被检索调用的 Fact标记归档默认不再参与常规检索冲突事实处理同一维度多条矛盾事实按置信度、创建时间、消息来源优先级自动取舍删除过时旧事实过期修正机制定期批量巡检 Fact 库用户明确推翻的旧偏好、旧认知主动标记失效、软删除。2. 历史时序分层压缩精简History 三段式结构天然具备压缩能力近期内容保留相对详细摘要更早阶段内容逐年精简合并多条旧时段摘要浓缩为极简概述超远期里程碑统一收拢至longTermBackground不再保留细碎阶段性细节控制整体文本体量。3. 上下文注入裁剪机制解决 “存储多、调用撑 Prompt” 衍生爆炸即便记忆存量较多每次调用时不会全量加载基于当前对话主题做相关性向量匹配只召回 Top-N 高关联 Facts 与历史片段设置单次注入 Token 上限超限自动二次摘要压缩避免上下文窗口溢出。4. 存储分库隔离冷热数据分离热数据当前周期 User、近期 History、高频调用 Fact内存 在线数据库快速读写冷数据归档历史、低频陈旧 Fact迁移至低成本归档存储常规对话不加载仅溯源场景按需调取降低在线存储压力。5. 记忆写入限流与异步队列削峰所有长期记忆写入动作放入异步消息队列设置单位时间最大入库频次避免短时间大量批量抽取、批量更新击穿存储同时增加人工复核开关关键事实修改、大批量记忆变更可开启人工校验防止 LLM 幻觉批量生成无效脏数据造成虚假膨胀。四补充误区澄清很多 Agent 方案的记忆爆炸根源是长短记忆边界模糊、逐条追加式存储、无过滤无脑落库而 DeerFlow 三级架构通过按更新频率分层 写入节流 增量聚合 存量清理 调用裁剪形成闭环管控长期运行下记忆体量可控、增速平缓既不会丢失关键信息也不会无限膨胀。五、总结(1) DeerFlow 摒弃传统长短记忆二元划分以更新频率、信息粒度、生命周期构建 User短时覆盖缓存、History动态时序长期记忆、Facts静态结构化长期记忆三级体系短期记忆服务即时对话两类长期记忆分别承载行为演变过程与固化单点事实。(2) 长期记忆拆分为静态 Facts、动态 History是匹配两类信息在内容属性、更新节奏、检索用途、置信管控上的本质差异解决笼统长记忆检索低效、迭代混乱、幻觉泛滥的缺陷。(3) 架构本身并非逐轮落地长期记忆依靠批量聚合、抽取过滤从源头抑制增量搭配归档淘汰、摘要压缩、冷热分离、调用限流整套存量治理方案完整规避记忆无限爆炸问题实现 Agent 记忆可管控、可迭代、高精度、轻量化运行。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】