GraphRAG 与向量 RAG 有何不同？适合什么场景？

Question 1

Accepted Answer

GraphRAG 的机制（独占一行） GraphRAG 在索引阶段用 LLM 从文档中抽取实体（节点）和关系（边），构建一张知识图谱，并对图中聚成的社区生成层级化摘要。查询时按实体邻接做图遍历，或用社区摘要回答覆盖全库的概览性问题。 与向量 RAG 的区别 向量 RAG 把文档切块、embedding，按语义相似度召回 Top-K 离散片段，再交给 LLM 生成。它擅长「答案集中在某几段」的事实型问题，但片段之间相互孤立，难以跨多文档串联关系，也回答不了「整个语料的主要主题是什么」这类全局问题。GraphRAG 用显式的 知识图谱 结构补上了这种关联与全局视角。 适用场景 需要多跳推理（A 关联 B、B 关联 C）、综合多个实体关系、或对整库做主题归纳/总结的场景，GraphRAG 优势明显。 代价 建图依赖大量 LLM 抽取调用，索引成本和时延高；图质量受抽取准确率影响；语料更新时图谱维护复杂。实践中常与向量 RAG 混合：向量检索做局部精确召回，图结构补全局与多跳。

Question 2

GraphRAG 的实体关系抽取出错会怎样？如何缓解？

Accepted Answer

错误的节点或边会沿图传播，导致答案串错关系。缓解手段：用更强模型或带 schema 约束做抽取、对实体做消歧与归并、加入人工审校或置信度过滤，并保留原文引用以便核验。

Question 3

什么是社区摘要（community summary），有什么用？

Accepted Answer

用图聚类算法把图划成若干社区，对每个社区让 LLM 生成层级摘要。回答「全局型」问题时直接聚合相关社区摘要，而非检索海量片段，从而高效覆盖整库主题。

Question 4

GraphRAG 与向量 RAG 如何混合使用？

Accepted Answer

常见做法是向量检索做局部精确召回拿到相关片段，图遍历补充实体间的多跳关联与上下文，两路结果合并后再 rerank 交给 LLM；按问题类型路由到不同策略。

GraphRAG 与向量 RAG 有何不同？适合什么场景？

核心要点

标准回答

常见误区

追问

延伸学习