混合检索（向量 + 关键词 BM25）解决了什么问题？

Question 1

Accepted Answer

单一检索的短板 - 稠密检索（向量 / Embedding）：擅长捕捉语义相似（同义词、改写），但对精确的专有名词、产品型号、数字、罕见缩写不敏感——这些词的语义信号弱，容易被漏召回。 - 稀疏检索（BM25 / TF-IDF）：基于词频做精确关键词匹配，对专有名词、代码、精确术语很强，但完全不懂同义和语义，换个说法就召回不到。 混合检索的价值：同时跑稠密和稀疏两路检索，再融合结果，让二者优势互补——既不漏精确关键词，又能覆盖语义改写。 融合方法：最常用 RRF（Reciprocal Rank Fusion，倒数排名融合），只依赖各路结果的排名而非分数，无需对不同量纲的分数做归一化，简单稳健。也可用加权分数融合。 混合检索是生产级 RAG 提升召回率的标准做法，尤其适合含大量术语、型号的企业知识库。参考 向量数据库原理。

Question 2

RRF 相比加权分数融合有什么优势？

Accepted Answer

RRF 只用每路结果中文档的排名（1/(k+rank)）求和，不依赖原始分数，因此天然规避了向量相似度与 BM25 分数量纲不一致、难以归一化的问题，调参少、鲁棒性好。

Question 3

什么时候稠密检索明显不如 BM25？

Accepted Answer

查询包含精确专有名词、错误码、SKU 型号、人名、代码片段等「字面即语义」的内容时，BM25 精确匹配优势明显，而向量检索可能因语义泛化而召回偏题结果。

Question 4

混合检索后还要 rerank 吗？

Accepted Answer

通常仍要。混合检索提升的是召回（覆盖面），rerank 用 cross-encoder 提升的是精度（排序）。两者作用不同，生产链路常是「混合召回 Top-N → rerank 精排 Top-K」。

混合检索（向量 + 关键词 BM25）解决了什么问题？

核心要点

标准回答

常见误区

追问

延伸学习