核心要点
块大小决定召回粒度:太大噪声多、太小丢上下文
重叠(overlap)防止语义在边界被切断
语义切分 / 父子块优于固定长度切分
常见误区
⚠️ 常见踩坑
认为存在「最优固定块大小」。实际块大小高度依赖文档类型、嵌入模型和问题粒度,必须通过检索指标实测调优。
追问
追问 1:重叠(overlap)设多大合适?
通常取块大小的 10–20%。重叠太小仍可能在边界丢失上下文,太大则增加冗余存储与召回重复。需结合文档连贯性实测。
追问 2:父子块(small-to-big)如何解决「精度 vs 上下文」矛盾?
用细粒度小块做向量匹配以提高召回精度,命中后不直接返回小块,而是返回其所属的父块(更大段落)供 LLM 阅读,从而同时获得精确定位和完整上下文。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。
🛠️ AI 工具
- LangChain
最流行的 LLM 应用开发框架,137K+ stars。提供链式编排、RAG 检索增强生成、Agent 构建等核心能力,覆盖 Python 和 JavaScript 双语言生态,是构建 LLM 应用的基础设施
- LlamaIndex
文档 Agent 和 OCR 平台,48,716+ stars。领先的 RAG 框架,提供文档索引、数据检索、Agent 编排等完整能力,支持多模态文档理解和智能问答