Hybrid Search(混合检索)

关键词加向量一起搜

亦作、亦称:混合检索 · Hybrid Retrieval

结合 BM25 等稀疏检索与向量语义检索,兼顾精确匹配与语义召回,是 RAG 系统的常见增强方案。 混合检索用稀疏检索补精确匹配、向量检索补语义召回,常配合 RRF 等融合策略。

工作原理

结合 BM25 等稀疏检索与向量语义检索,兼顾精确匹配与语义召回,是 RAG 系统的常见增强方案。 混合检索用稀疏检索补精确匹配、向量检索补语义召回,常配合 RRF 等融合策略。

应用场景

Hybrid Search常见于:对话助手、代码生成、知识问答、内容创作与 Agent 推理底座。实际选型需结合业务指标、数据规模与部署约束评估适用性。

局限与误区

围绕 Hybrid Search 的口语化说法(见「常见误解」)常过度简化。效果依赖数据质量、任务匹配与系统整体设计;生产环境应配合评测、监控与人工复核。

背景与发展

Hybrid Search随 AI 研究与工程实践持续演进,定义边界与最佳实践仍在更新。建议结合原始论文、官方文档与本站延伸阅读建立准确认知。

常见误解

日常交流中容易听到的简化说法,未必准确,但能帮助理解误解从何而来。

  • 「关键词加向量一起搜」
  • 「BM25 加 Embedding」
  • 「RAG 召回更稳」

相关术语

和本术语关联紧密的其他词条,便于串联理解。

延伸阅读

从知识库精选 3 篇文章,帮助深入理解该术语。

  1. 1

    Agent 记忆系统(四):向量数据库、知识图谱与记忆检索全景指南

    AI Agent 的记忆系统是决定其智能水平的核心组件。本文系统讲解 Agent 记忆体系的完整架构:从短期工作记忆到长期语义记忆,从向量数据库的嵌入检索到知识图谱的关系推理,从记忆压缩策略到遗忘机制,帮助你在构建 Agent 时设计正确的记忆方案。

  2. 2

    RAG 检索增强生成架构指南

    如何结合外部知识库增强 LLM 的准确性和时效性

  3. 3

    Agent 记忆与知识库系统设计:从短期上下文到长期记忆架构

    AI Agent 的核心能力之一是记忆——能够在多次交互中保持连贯性、积累经验、并在需要时检索相关信息。本文系统讲解 Agent 记忆架构的设计原理,涵盖短期记忆(上下文窗口管理)、中期记忆(对话历史压缩)、长期记忆(向量存储与知识图谱)、知识库构建(RAG 架构)、记忆检索策略、记忆遗忘机制,以及生产环境中的最佳实践和常见陷阱。