Meta:单次专家级检索框架SIRA

发布时间:2026/5/22 16:41:56

Meta:单次专家级检索框架SIRA 标题Superintelligent Retrieval Agent: The Next Frontier of Information Retrieval来源arXiv, 2605.06647v1️文章简介研究问题如何让检索智能体像领域专家一样在不依赖多轮试错和累积上下文的情况下仅通过单次查询就能精准区分目标证据与语料库中的干扰项主要贡献论文提出了 SIRA 框架将大语言模型的推理能力与轻量级语料统计相结合把多轮探索性搜索压缩为一次具有语料区分度的加权 BM25 检索动作。重点思路定义检索超智能将其界定为将多轮探索性搜索压缩为单次语料区分性检索动作的能力即预测哪些术语能将期望证据与语料级混淆项分离开来。离线语料侧增强利用冻结的大语言模型预先阅读文档预测用户可能使用但原文缺失的搜索词汇如同义词、缩写并通过文档频率过滤器剔除过于常见的术语将有效词汇注入索引。在线查询侧增强针对用户查询生成“预期响应草图”预测相关文档中可能出现但查询中缺失的证据词汇同样利用文档频率工具调用验证这些术语是否存在于索引中且具有区分度。构建检索程序将原始查询与经过统计验证的扩展术语结合编译成包含加权关键词和可选排除约束的单次加权 BM25 查询直接执行检索而无需读取中间返回片段。分析总结在十个 BEIR 基准测试中SIRA 在无需任何监督训练、微调或构建向量索引的情况下平均 Recall10 和 NDCG10 指标均显著优于 E5、SPLADE 等最先进的稠密检索器和多轮智能体基线。实验表明通用大语言模型搜索智能体表现不佳的原因在于缺乏对检索原语的直接控制而 SIRA 通过将模型提议 grounded 于语料统计信息成功将推理转化为原生检索排序能力。在下游问答任务中SIRA 仅凭单次检索得到的证据覆盖率就超过了多个经过强化学习训练的多轮端到端问答智能体的最终答案准确率证明提升检索质量比增加搜索轮数更关键。该方法在查询与文档词汇存在巨大差异的任务如科学文献引用预测、重复问题检测中提升最为显著证实了基于大模型认知和语料统计的词汇增强能有效填补语义鸿沟。个人观点论文没有盲目依赖大模型的生成能力去反复试探而是巧妙地将大模型作为“编译器”利用其参数化知识预测高区分度词汇并创造性地引入文档频率等轻量级统计量作为“校验器”确保生成的查询在特定语料库中具有实际的判别力。

相关新闻