群面智伴8:从“能记住”到“会推进”:群面智能体的全局记忆、发言质量控制与评估闭环

发布时间:2026/6/1 5:37:01

群面智伴8:从“能记住”到“会推进”:群面智能体的全局记忆、发言质量控制与评估闭环 从“能记住”到“会推进”群面智能体的全局记忆、发言质量控制与评估闭环一、阶段背景上一篇文章主要记录了项目从普通智能体系统升级到“场景化 Hybrid RAG 全局结构化记忆”的过程重点是解决两个基础问题智能体缺少专业知识依据。长讨论中容易失忆、重复、只看最近几句话。本阶段没有继续重复搭 RAG 基础架构而是进一步往“真实群面智能体”方向推进让智能体不仅知道知识、记住全局还要能围绕题目推进讨论并在发言后自我检测质量。因此本阶段重点做了四件事真实群面题库与题型策略。全局记忆接入实时智能体主流程。Agent Guard 发言质量控制与高风险重生成。RAG、Memory、Guard 的统一评估闭环。这一阶段的目标不是“再加一个功能”而是让系统从“有智能体”变成“更像真实群面陪练”。二、为什么要做题型策略在群面里不同题型的讨论方式完全不同。排序题关注的是有没有先建立标准而不是一上来报答案。资源分配题关注的是有没有明确约束、比例、取舍和风险预案。危机处理题关注的是有没有优先级、止损方案、负责人和时间线。如果智能体不懂题型就容易出现这种问题排序题里反复报结果但没有排序标准。资源分配题里只说“都很重要”没有比例。危机处理题里只说“尽快处理”没有时间线和责任分工。因此本阶段新增了题型策略解析能力。三、真实群面题库补充原来的题目偏技术专项例如系统设计、高并发、电商搜索优化等。它们可以继续用于技术岗训练但不够贴近通用无领导小组讨论。本阶段新增了更真实的群面题目包括校园招聘渠道优先级排序在线学习 App 日活下降治理新产品冷启动预算分配产品上线投诉危机处理电商平台复购率提升AI 工具普及后的招聘标准新城市市场进入策略远程办公是否应成为常态这些题目被补到了两处backend/src/main/resources/rag/cases/group_discussion_cases.md docs/init.sql同时新增了启动种子器QuestionSeedConfig.java它会在后端启动时检查数据库中是否已有这些题目不存在则自动插入避免前端选题列表看不到新题。数据库结构没有改因为现有tb_question已经足够承载真实题目title content ability_dimension suggested_duration standard_answer common_pitfalls tags四、QuestionStrategyService让系统真正“懂题”新增模块backend/src/main/java/com/interview/question/ controller/ model/ service/核心类QuestionStrategyService QuestionStrategyDTO QuestionStrategyController策略解析接口GET /api/question-strategy/{questionId}系统会根据题目的titlecontenttypetags自动判断题型RANKING 排序题 RESOURCE_ALLOCATION 资源分配题 CRISIS 危机处理题 PRODUCT_OPERATION 产品运营题 OPEN_DISCUSSION 开放讨论题 GENERAL 通用题返回内容包括evaluationFocus 评价重点 commonRisks 常见风险 agentSpeakingGuidance 智能体发言指引 memoryFocus 记忆关注点 guardFocus Guard 检查重点例如排序题会得到先明确目标 建立评价维度 对选项分组 比较关键差异 形成排序这样智能体就不只是“读题”而是知道这类题应该怎么讨论。五、题型策略接入实时智能体题型策略没有停留在 Debug 接口而是接入了实时发言流程。接入位置AgentEngine.java实时发言前系统会执行读取房间 questionId - 查询 Question - QuestionStrategyService 解析题型 - 生成题型策略 prompt - 追加到智能体 memoryPrompt - 候选人根据题型策略发言如果房间没有 questionId也会使用当前题目文本兜底解析。最终实时智能体拿到的上下文变成题目 题型策略 全局结构化记忆 角色记忆 事件链 Guard 风险约束这一步非常关键因为它把“题库”从静态数据变成了智能体的行为策略。六、全局记忆进入实时主流程上一篇文章里全局记忆已经完成了基础结构ProcessedEventDTOParticipantMemoryDTOTopicStateDTOConsensusDTOConflictDTOMemoryQualityDTO本阶段进一步把它接入实时智能体发言。新增AgentMemoryPromptAssembler.java它的作用不是把完整 Memory 一股脑塞给模型而是做实时场景下的压缩和筛选。优先保留当前议题状态已解决点未解决分歧当前角色自己的主张、反对点和风险共识列表开放冲突他人立场画像高置信度关键事件MemoryQuality 信息主动过滤低置信度事件普通 COMMENT 事件重复 claim超出字符预算的内容提供调试接口POST /api/memory/agent-prompt?agentIdxxxcorrectfalsemaxChars3500这让我们可以直接看到实时智能体最终会拿到什么样的记忆上下文。七、Memory 运行时配置把 Memory 接入实时主流程后必须加安全开关否则一旦质量不稳或延迟过高会影响群面体验。新增MemoryProperties.java配置memory:realtime-enabled:truerealtime-max-chars:2800realtime-correct-enabled:false含义realtime-enabled是否给实时智能体注入全局记忆。realtime-max-chars实时记忆 prompt 最大字符数。realtime-correct-enabled是否在实时发言前做 LLM 低置信度校正。默认不启用实时 LLM 校正避免额外延迟。这一步体现了工程上的稳定性考虑AI 能力要可开关、可降级、可调参。八、Agent Guard发言后的质量控制生成前有 Memory 和题型策略还不够因为模型仍然可能生成空泛附和重复历史观点过短发言过长发言没有推进动作的发言因此新增了发言后的质量防护层AgentResponseGuard.java AgentResponseGuardResult.java检查项包括repeatRisk 重复风险 lacksProgressAction 是否缺少推进动作 riskLevel LOW / MEDIUM / HIGH suggestions 风险建议它被接入到AgentEngine.executeAgentSpeech(...)即智能体生成发言 - AgentResponseGuard 评估 - 记录风险或触发策略 - 广播最终发言第一版只做观察后续进一步实现了策略化。九、Agent Guard 配置化为了方便调参新增AgentGuardProperties.java配置agent-guard:enabled:truestrategy:LOG_ONLYrepeat-risk-threshold:0.55generic-risk-threshold:0.55high-risk-threshold:0.65medium-risk-threshold:0.35min-chars:18max-chars:180max-regenerate-times:1预留策略LOG_ONLY REGENERATE FALLBACK_REWRITE BLOCK当前已实现LOG_ONLYREGENERATE配置化的好处是可以线上一键关闭 Guard。可以调整重复/空泛阈值。可以从观察模式平滑升级到重生成模式。十、REGENERATE高风险发言重生成当策略设置为agent-guard:strategy:REGENERATEmax-regenerate-times:1且 Guard 判断发言为HIGH风险时会自动重生成一次。重生成时会把 Guard 反馈追加进 prompt上一版发言风险等级HIGH重复风险...空泛风险... 请重新生成一次发言不要重复历史观点不要空泛附和必须给出明确推进动作、补充证据或收敛建议。安全兜底重生成失败使用原回复。重生成后仍高风险使用最后一次生成结果。默认策略仍是LOG_ONLY。这使系统形成了一个完整闭环生成前Memory QuestionStrategy 生成后Guard 检查 高风险可配置重生成十一、Agent Guard Debug API为了单独测试一段发言是否有问题新增POST /api/agent-guard/evaluate请求示例{agentId:leader-xxx,response:我同意大家的观点我们继续推进吧。,stream:{sessionId:room-1,events:[]}}返回示例{riskLevel:MEDIUM,repeatRisk:0.42,genericRisk:0.55,tooShort:false,tooLong:false,lacksProgressAction:true,suggestions:[发言可能偏空泛,缺少明确推进动作]}这个接口方便后续调阈值、做前端调试面板或构建评估集。十二、Memory 低置信度校正接入Memory 第一版是规则抽取难免会有低置信度事件。本阶段新增MemoryCorrectionService.java它会把低置信度事件交给 LLM 校正speechAct claim target evidence impact status confidence新增接口POST /api/memory/correct同时/think支持{query:我当时为什么这么说,correctMemory:true}这样深度复盘可以选择使用校正后的全局记忆。十三、统一评估接口做了这么多能力之后必须能评估效果。因此新增统一评估接口POST /api/evaluation/memory-agent它会串起Memory build - 可选 LLM correction - Memory evaluate - Agent prompt assemble - Guard evaluate - overallScore请求示例{stream:{},agentId:leader-xxx,sampleResponse:我同意大家的观点我们继续推进吧。,correctMemory:true,maxPromptChars:2800}返回内容包括memoryQuality memoryEvaluation guardResult agentPromptChars overallScore suggestions这让系统具备了可重复验证能力而不是只凭主观感觉判断效果。十四、RAG 评估接口与知识库扩充本阶段还进一步补充了 RAG 知识库scoring/dimension_rubrics.md behavior/speech_act_examples.md argument/argument_relation_examples.md roles/role_strategy_examples.md report/improvement_suggestions.md question_types/ranking_question_strategy.md cases/group_discussion_cases.md并新增POST /api/rag/evaluate用于检查query 是否命中预期 source是否命中预期 tagstopK 是否合理rewrittenQuery 是什么召回结果是否符合预期这一步让 RAG 从“能查”进一步走向“能评估”。十五、当前整体链路现在实时群面智能体链路已经变成题目选择 - QuestionStrategyService 解析题型 - EventStreamDTO 构建全局事件流 - SessionMemoryService 构建全局结构化记忆 - AgentMemoryPromptAssembler 压缩实时记忆 - 候选人智能体生成发言 - AgentResponseGuard 评估发言 - 可选 REGENERATE - 广播最终发言同时还有评估链路RAG Evaluate Memory Evaluate Agent Guard Evaluate Memory-Agent Unified Evaluation这个阶段的核心价值是不仅让智能体“知道更多”还让它“更会讨论”并且能评估自己讨论得好不好。十六、技术亮点总结本阶段可以总结成 5 个技术亮点1. 题型驱动的智能体策略通过QuestionStrategyService不同题型会影响智能体的发言策略、Memory 关注点和 Guard 检查重点。2. 实时全局记忆注入通过AgentMemoryPromptAssembler把完整事件流加工成适合实时发言的压缩记忆而不是简单塞最近几句话。3. 发言后质量控制通过AgentResponseGuard对重复、空泛、过短、过长、无推进动作进行检测。4. 高风险发言自动重生成通过REGENERATE策略让高风险发言最多重写一次提升讨论质量。5. 评估闭环通过 RAG、Memory、Guard、Unified Evaluation 多个接口让系统具备可观测和可验证能力。十七、简历表述建议这一阶段可以写成设计并实现群面智能体的全局记忆驱动与发言质量控制系统基于完整事件流构建结构化会话记忆结合题型策略解析动态调整智能体讨论行为并通过 Agent Guard 检测重复、空泛和缺少推进动作的发言支持高风险回复重生成及统一评估接口提升群面模拟的上下文一致性、讨论推进能力和可观测性。也可以拆成实现QuestionStrategyService根据题目自动解析排序题、资源分配题、危机处理题等讨论策略。实现AgentMemoryPromptAssembler将全量结构化记忆压缩为实时智能体可用上下文。实现AgentResponseGuard检测重复发言、空泛表达和缺少推进动作并支持高风险重生成。构建Memory-Agent Evaluation统一评估接口用于衡量记忆质量、发言风险和整体效果。十八、后续方向后续可以继续增强前端可视化调试面板。固定评估集与回归测试。Guard 重生成前后效果统计。更细粒度题型策略例如排序题、选择题、辩论题、商业案例题。Memory 持久化与增量更新。但从当前阶段看系统已经形成了一个较完整的后端闭环RAG 提供知识 Memory 提供全局事实 QuestionStrategy 提供题型策略 AgentGuard 提供发言质量控制 Evaluation 提供效果验证这已经具备比较强的工程完整性和技术展示价值。

相关新闻