有多个知识库时，如何兼顾查询效率与准确性并尽量减少幻觉？

Question 1

Accepted Answer

多知识库场景的核心矛盾是：库越多，盲目全检索越慢、噪声越大，但漏检又会降低准确性。整体思路是「先路由、再并行检索、后融合校验」。

第一步：查询路由（Routing）
不要对每个 query 都扫描所有库。先做一次轻量路由判断它该去哪些库：

第二步：并行检索与融合
对命中的多个库并行发起检索，各库可设不同的相似度阈值与召回权重（高质量库权重更高）。再把多路结果做融合，常用 Reciprocal Rank Fusion（RRF）按排名加权合并，得到统一候选集。

第三步：精排与准确性保障

第四步：减少幻觉

权衡：路由错误会漏掉正确的库导致答非所问，因此要加兜底——路由置信度低时退化为更宽的多库检索，用一点效率换召回安全。

Question 2

路由判断错了、把 query 发到了错误的库怎么办？

Accepted Answer

给路由加置信度与兜底：当路由置信度低于阈值时，退化为对 Top-N 个候选库做并行检索，用效率换召回安全；同时对最终答案做「是否有检索片段支撑」校验，没有支撑就触发拒答或重路由，避免错误库导致答非所问。

Question 3

不同知识库的相似度分数不可比，融合时如何统一？

Accepted Answer

不要直接比较各库的原始相似度分数（不同库的 embedding 分布与量纲不同）。推荐用基于排名的 RRF 融合，只看每路结果内的相对排名而非绝对分数；或先对每路分数做归一化再加权。最后统一用一个 rerank 模型重排，得到真正可比的全局序。

Question 4

如何量化评估这套多库 RAG 是否真的减少了幻觉？

Accepted Answer

在固定验证集上分层评估：检索层看 Context Recall / Precision 和路由命中率；生成层看 Faithfulness（答案是否被引用片段支撑）与拒答正确率（无依据问题是否如实拒答）。对比上线前后这些指标的变化，并抽样人工核对引用与结论一致性。

核心要点