核心要点

  • 能讲清定义:由 LLM Agent 自主决策「是否检索、检索什么、查哪个源、是否再查一次」,而非固定单次检索

  • 能说出关键能力:支持多步推理、查询分解、多数据源路由、检索后自我评估并按需重新检索

  • 能对比传统 RAG:传统 RAG 是「一次检索 + 一次生成」的固定流水线,难处理多跳和模糊查询

  • 能指出代价:多轮调用带来更高延迟Token 成本,需要循环上限与可观测性兜底

标准回答

定义(独占一行)

Agentic RAG 是把检索环节交给一个具备决策能力的 LLM Agent:模型自主判断当前问题是否需要检索、应该检索什么、查询哪个数据源,并在拿到结果后评估是否充分、是否需要改写查询再检索一次。

与传统 RAG 的区别

传统 RAG 是固定流水线——把用户问题 embedding,做一次向量检索,把片段拼进上下文再生成。一旦检索召回不准,就无从纠正。Agentic RAG 引入 ReAct 式的「推理-行动」循环,可对复杂问题做查询分解、多源路由、检索后反思与多轮重检索。

优势场景

多跳问答、需要跨多个知识库综合、问题表述模糊或需先澄清的任务,Agentic RAG 的准确率明显更高,且检索过程可解释、可纠错。代价是多轮调用带来的延迟与成本上升。

常见误区

⚠️ 常见踩坑

别把「加了 rerank 的 RAG」当成 Agentic RAG——核心区别在于是否由模型自主决策检索动作并能多轮迭代,而非只在固定流水线里多一个排序步骤。

追问

追问 1Agentic RAG 如何避免无限循环或检索过多?

设置最大迭代轮次与工具调用次数上限;每轮要求模型显式给出「是否已足够回答」的判断;对重复或低收益的检索做去重与提前终止,并记录 trace 便于调参。

追问 2它如何决定查询哪个数据源?

通过路由(Router)实现:把各数据源以工具或带描述的索引形式暴露给模型,由模型按问题语义选择;也可先用分类器或元数据过滤缩小范围,再让 Agent 在候选源上检索。

追问 3Agentic RAG 的延迟更高,如何优化?

并行化可独立的子查询;对常见问题缓存检索结果与最终答案;用更小的模型做路由与判断、大模型只做最终合成;限制循环轮次并流式输出中间进展。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。

🛠️ AI 工具

  • LangGraph

    基于图的 AI Agent 编排框架,29,857+ stars。LangChain 团队出品,用有向图定义 Agent 工作流,支持循环、条件分支、多 Agent 协作。是构建复杂 Agent 系统的标准工具。

  • LlamaIndex

    文档 Agent 和 OCR 平台,48,716+ stars。领先的 RAG 框架,提供文档索引、数据检索、Agent 编排等完整能力,支持多模态文档理解和智能问答