标准回答
定义(独占一行)
Agentic RAG 是把检索环节交给一个具备决策能力的 LLM Agent:模型自主判断当前问题是否需要检索、应该检索什么、查询哪个数据源,并在拿到结果后评估是否充分、是否需要改写查询再检索一次。
与传统 RAG 的区别
传统 RAG 是固定流水线——把用户问题 embedding,做一次向量检索,把片段拼进上下文再生成。一旦检索召回不准,就无从纠正。Agentic RAG 引入 ReAct 式的「推理-行动」循环,可对复杂问题做查询分解、多源路由、检索后反思与多轮重检索。
优势场景
多跳问答、需要跨多个知识库综合、问题表述模糊或需先澄清的任务,Agentic RAG 的准确率明显更高,且检索过程可解释、可纠错。代价是多轮调用带来的延迟与成本上升。
常见误区
⚠️ 常见踩坑
别把「加了 rerank 的 RAG」当成 Agentic RAG——核心区别在于是否由模型自主决策检索动作并能多轮迭代,而非只在固定流水线里多一个排序步骤。
追问
追问 1:Agentic RAG 如何避免无限循环或检索过多?
设置最大迭代轮次与工具调用次数上限;每轮要求模型显式给出「是否已足够回答」的判断;对重复或低收益的检索做去重与提前终止,并记录 trace 便于调参。
追问 2:它如何决定查询哪个数据源?
通过路由(Router)实现:把各数据源以工具或带描述的索引形式暴露给模型,由模型按问题语义选择;也可先用分类器或元数据过滤缩小范围,再让 Agent 在候选源上检索。
追问 3:Agentic RAG 的延迟更高,如何优化?
并行化可独立的子查询;对常见问题缓存检索结果与最终答案;用更小的模型做路由与判断、大模型只做最终合成;限制循环轮次并流式输出中间进展。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。
🛠️ AI 工具
- LangGraph
基于图的 AI Agent 编排框架,29,857+ stars。LangChain 团队出品,用有向图定义 Agent 工作流,支持循环、条件分支、多 Agent 协作。是构建复杂 Agent 系统的标准工具。
- LlamaIndex
文档 Agent 和 OCR 平台,48,716+ stars。领先的 RAG 框架,提供文档索引、数据检索、Agent 编排等完整能力,支持多模态文档理解和智能问答