准确率狂飙34%！谷歌全新Agentic RAG来了：揪出缺失盲点，AI不搜出真相绝不停手-尧图网站设计

现有的 RAG 系统有个老毛病搜一次生成一次就算信息找不全也就这样了。比如你问「X 项目用的服务器配置是什么」系统能找到 X 项目的文档但文档里只写了一个服务器 ID。它不会拿着这个 ID 再去另一个数据库搜配置。最终的结果要么是半截答案要么直接告诉你「没找到」。问题不是信息不存在是系统没有继续找的能力。谷歌研究院和 Google Cloud 联合发布了一套新的 Agentic RAG 框架核心改进系统能判断自己是否拿到了足够的信息如果没有就继续搜直到信息完整为止。相比标准 RAG这套框架在事实性数据集上的准确率提升最高达 34%。多智能体框架把一个问题拆给一组专家要理解这套框架怎么运作可以把它类比成一个研究部门而不是一个搜索引擎。传统的「Vanilla RAG」只有一个动作拿着你的问题找相似文档然后让大模型生成答案。多智能体框架把这件事拆成了几个专门的角色编排器收到复杂请求后判断这不是一步能完成的任务把工作分配给各个子智能体。规划智能体规划信息的获取路径。比如你问某个项目的预算和时间线它会决定先查财务数据库再查项目管理日志。查询改写器把你的原始问题拆成多个可检索的具体查询。比如把「X 项目怎么样了」改写成「X 项目 Q3 状态报告」和「X 项目团队关键阻塞点」。搜索扇出智能体把改写后的查询同时发送给多个数据源收集信息片段。大模型LLM汇总所有上下文生成最终答案。标准 Agentic RAG 系统演示包含多个智能体但不含迭代检索和跨语料库支持。谷歌的新东西「已拿到的信息够不够用」上面那套多智能体框架其实业界已经有不少类似实现。谷歌这套的关键区别在于系统知道自己什么时候信息不够并且会继续找而不是将就着回答或者直接说「找不到」。用一个具体场景说明。医生查询一个病人的出院情况「小李做完膝关节手术后的出院药物和饮食限制是什么住院期间有没有过敏反应除了肝素静脉滴注或 Tenecteplase 之外不要包含仅在住院或急诊期间使用的药物。」这个问题涉及三个不同的信息来源药房、营养、临床记录。以下是这套框架处理这个问题的完整过程。多智能体 RAG 解决方案演示包含充分上下文智能体以及在回答前迭代检索更多信息的能力。第一阶段编排根智能体解析医生的请求把任务分配给子智能体。规划智能体确定需要检索三个方向药房、营养、临床记录。查询改写器把这个复杂请求拆成多个简单的、可检索的子问题。第二阶段搜索RAG 智能体同时对所有子查询进行检索。找到了药物清单和饮食信息但在最明显的文件里没有找到过敏相关的记录。标准 RAG 到这里就会停下来给出一个不完整的答案。第三阶段充分上下文智能体核心创新这是谷歌这套框架最关键的部分相当于流水线末端的质检员。它做三件事第一审查 RAG 智能体从数据库拉回来的实际文本片段看里面有没有回答问题所需的内容。第二系统会先生成一个草稿答案。充分上下文智能体会对比原始问题、草稿答案和检索到的片段判断模型是否有足够的信息给出全面且可溯源的回答。问题问了三件事药物、饮食、过敏但片段里只有两件事的信息就会被标记为「上下文不充分」。第三也是最关键的一步它会精确指出缺少什么。不只是输出「信息不够」而是生成具体的原因和反馈日志比如已找到药物清单和低钠饮食说明。缺失关于住院期间过敏反应或不良事件的内容。然后它发出「上下文不充分」的信号并给出具体的改进指令已找到药物和饮食但缺少过敏信息请专门搜索「皮疹」或「不良事件」。第四阶段迭代根据充分上下文智能体的反馈查询改写器生成新的搜索词「皮疹」RAG 智能体重新检索之前忽略的文件找到了缺失的信息。第五阶段最终合成充分上下文智能体再次检查确认药物、饮食、过敏三项信息都已齐全判定可以停止搜索。合成智能体生成一份完整、准确的总结交给医生。实验结果跨库检索准确率达 90.1%谷歌用 FramesQA 对这套框架进行了评测这个数据集基于 FRAMES 论文专门测试多跳推理能力。典型问题长这样在收视最高的两个电视季终集中截至 2024 年 6 月哪个终集播出时间更长长了多少回答这个问题需要好几步先找出收视最高的两个终集M*A*S*H 和 Cheers再分别查它们的时长最后计算差值。在很多 RAG 系统中得到的答案会是虽然多次搜索但没有找到 M*A*S*H 或 Cheers 的明确播出时长文档只提供了收视数据没有分钟或小时数。这没有回答问题。谷歌这套框架的答案是M*A*S*H 终集时长 150 分钟是两者中最长的比 Cheers 终集约 98 分钟多 52 分钟。实验规模FramesQA 共 824 个查询语料库包含 2676 份 PDF 文档。谷歌对比了三个设置Vanilla RAG使用谷歌自家的 RAG Engine含先进检索引擎、LLM 解析器和重排序器。单语料库 Agentic RAG只在 FramesQA 文档中检索。跨语料库 Agentic RAG在 FramesQA 文档加上三个无关干扰数据集中检索规划智能体需要自己判断去哪个库里找。跨语料库检索与单语料库及 Vanilla RAG 在 FramesQA 上的准确率对比。结果跨语料库设置下系统准确率接近单语料库在四个数据库中正确路由并回答了 90.1% 的问题。单库和跨库两个版本的延迟相差不超过 3%说明加入跨库路由几乎没有带来额外的时间成本。总结这套框架的核心逻辑其实并不复杂在生成答案之前先判断手里的信息够不够不够的话明确说出缺什么然后再去找。这个「充分上下文」的检验步骤让系统的答案变得可审计、可溯源而不是靠模型猜测填补空白。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

准确率狂飙34%！谷歌全新Agentic RAG来了：揪出缺失盲点，AI不搜出真相绝不停手

相关新闻

性能测试方法详解

告别Keil，用ST-LINK Utility给STM32烧录程序，附量产配置与读写保护设置

淘宝商品详情 API 技术简析（简易版 + JSON 参考）

每日一个开源项目（第125篇）：taste-skill - 给 AI 装上审美，让前端不再千篇一律

【2027最新】基于SpringBoot+Vue的酒店管理系统管理系统源码+MyBatis+MySQL

告别裸机：在STM32CubeIDE中为STM32H7集成SOEM主站库的完整流程

AI 太阳能电动自行车高效智能功率 MOSFET 完整选型方案

告别Demo：如何将钉钉官方示例代码改造成你的第一个企业级应用（SpringBoot + React实战）

别再手动调epoch了！用Keras的EarlyStopping自动找到最佳训练轮数（附实战代码）

洛雪音乐音源配置终极指南：打造专业级免费音乐库

SpringBoot+Vue游戏赛事平台源码+论文

小区物业智能卡管理的设计与实现毕设源码

从放大器选型反推：为什么你的无线模块用OQPSK而不用QPSK？一个硬件工程师的避坑指南

实战指南：基于快马平台生成可集成的流程图组件，告别单纯安装教程

Qwerty Learner：程序员如何在VSCode中边写代码边记单词的终极指南

Harness 中的响应合并：将多个片段组装为完整输出

Windows Cleaner终极教程：5分钟彻底解决C盘爆红问题，让系统重获新生！

别再只会用ifconfig了！在Ubuntu 22.04/20.04上，教你用ip命令并顺带配置好国内镜像源