23 RAG 为什么答不准:召回、分块、排序的常见坑

发布时间:2026/6/30 16:35:51

23 RAG 为什么答不准:召回、分块、排序的常见坑 专栏:大模型应用开发:从原理到生产篇号:23内容标签:RAG、检索召回、文本分块、Rerank、AI应用开发上一篇我们写了一个最小可用 RAG 系统。它能跑通文档加载、分块、Embedding、向量入库、Top-K 检索和基于资料回答。到这里,很多人会有一个期待:既然已经把资料接进来了,模型应该就能答准了吧?现实通常没这么顺。你会很快遇到一些让人抓头发的问题:文档里明明有答案,系统就是找不到。检索结果看起来相关,但回答还是偏了。正确资料召回了,却排在很后面。模型拿到了资料,却没有用关键那句。回答看起来很流畅,但里面有资料没有写过的内容。同一个问题,有时答对,有时答错。这时最危险的反应,是直接去怪模型。“是不是模型不够强?”“是不是 Prompt 写得不够好?”“是不是该换一个向量库?”这些都有可能。但在动手改之前,你要先定位问题。RAG 的失败不是一种问题。它是一条链路上不同环节的症状。这篇就专门讲:RAG 为什么答不准,以及怎么把问题拆开查。

相关新闻