Grounding（接地）

输出要有据可查

亦作、亦称：接地 · Grounded Generation

Grounding（接地）是让语言模型或多模态模型的输出锚定在外部可验证来源上的技术目标，核心在于将生成内容与检索文档、工具返回值或传感器数据挂钩，从而系统性地降低幻觉（hallucination）并提升可溯源性。它是 RAG 系统和多模态对齐的关键质量准则，也是通往可信 AI 的必要条件。

概述

大型语言模型记住的是训练数据的统计规律，回答具体问题时可能生成听起来合理却实际有误的内容（幻觉）。Grounding 通过外部锚点约束生成范围。

核心目标：每条输出声明都能追溯到某个外部依据——检索文档、数据库记录或工具返回值。
三大评估指标：忠实度（faithfulness，输出是否与给定来源一致）、归因准确率（attribution accuracy）、引用精度（citation precision）。
适用范围：涵盖文本生成（RAG）、多模态（视觉接地）、具身智能（感知-语言绑定）等多个场景。
与幻觉的关系：幻觉是问题现象，grounding 是缓解手段；二者角度不同，常被对立讨论，但并非等价关系。

发展脉络

Grounding 概念跨越认知科学与 AI 工程两条脉络，逐步演化至今。

1990：Stevan Harnad 在 Physica D 发表《The Symbol Grounding Problem》，提出符号系统必须通过感知经验锚定现实，否则语义空悬——这是 AI grounding 思想的哲学源头。
2005 年前后：视觉-语言研究开始用「visual grounding」指代将名词短语定位到图像区域的任务，成为 VQA 的前身。
2020：RAG 框架由 Lewis 等人（Meta AI）正式提出，将检索结果嵌入上下文成为主流接地方案，奠定工程范式。
2022-2023：ChatGPT 等大模型普及后幻觉问题凸显，「grounding」在工业界成为企业级 AI 产品的核心质量指标。
2025：Google DeepMind 发布 FACTS Grounding Leaderboard，系统评估主流 LLM 在长文档接地任务上的忠实度，成为业界重要基准。

工作原理

Grounding 在推理时引入外部证据，约束模型的生成范围，主要有以下实现路径。

检索增强生成（RAG）：先通过向量检索或关键词检索从语料库取出 top-k 段落，拼入上下文窗口，模型据此作答，是目前最主流的实现方式。
工具调用（function calling）：模型发出函数调用，系统执行后将结果返回，输出被约束在工具返回值范围内，适合实时数据场景。
事后归因验证：先生成草稿，再由独立模块逐条核查声明是否有文档支撑，可与前两种方案叠加使用。
多模态接地：将文本短语对应到图像区域（visual grounding），或将语言指令对应到机器人传感器读数，是 VQA 和具身智能的基础能力。

类型与变体

按来源类型，grounding 可分为以下主要变体。

文档接地：RAG 框架下依赖检索文本段落，是企业知识库问答的标准形式，以 faithfulness 和 citation 为核心评估维度。
知识图谱接地（KG grounding）：将实体和关系映射到结构化知识库（如 Wikidata），适合需要精确实体信息的场景。
工具接地（tool grounding）：通过函数调用获取实时数据——代码执行、数据库查询、计算器调用等均属此类。
感知接地（perceptual grounding）：将自然语言短语对应到图像中的具体区域，VQA 和 VLA（视觉-语言-动作模型）均依赖这一能力。
引用标注机制：部分系统要求模型在输出中显式注明来源编号，便于用户核查，Perplexity、必应 Copilot 是典型代表。

局限与误区

Grounding 并不等于「百分之百消除幻觉」，存在若干常被忽视的局限。

检索是瓶颈：若向量检索未能召回相关段落，后续生成再准确也无济于事；召回率和排序质量直接决定接地效果上限。
忠实度失败（faithfulness failure）：即使来源正确，模型仍可能生成不在文档中的内容，「有来源」不等于「忠实于来源」——二者是独立可失败的维度。
引用不等于正确：引用可能断章取义，引用的文档本身也可能有误；用户不应因有引用标注而放弃自行核查。
长上下文不自动解决问题：更大的上下文窗口能放入更多文档，但不自动提升忠实度；文档截断与排序策略仍是工程难题。
来源冲突处理：当检索到多份相互矛盾的文档时，模型如何取舍目前缺乏标准方案，是 grounding 研究的开放问题之一。

常见误解

日常交流中容易听到的简化说法，未必准确，但能帮助理解误解从何而来。

「输出要有据可查」
「别瞎编要有出处」
「RAG 就是为了 grounding」

延伸阅读

从知识库精选 3 篇文章，帮助深入理解该术语。

外部参考

维基百科：查看「Grounding」词条

本页内容为本站原创撰写；维基百科链接仅作延伸参考。

Grounding（接地）

概述

发展脉络

工作原理

类型与变体

局限与误区

常见误解

相关术语

延伸阅读

RAG 检索增强生成架构指南

Agent 记忆系统（四）：向量数据库、知识图谱与记忆检索全景指南

大语言模型训练全流程

外部参考

觉得内容有帮助？请站长喝杯咖啡 ☕

概述

发展脉络

工作原理

类型与变体

与相邻概念的区别

局限与误区

常见误解

相关术语

延伸阅读

RAG 检索增强生成架构指南

Agent 记忆系统（四）：向量数据库、知识图谱与记忆检索全景指南

大语言模型训练全流程

外部参考