Grounding(接地)

「输出要有据可查」

亦作、亦称:接地 · Grounded Generation

让模型生成内容锚定在检索证据、传感器数据或知识图谱上,减少幻觉,多模态与 RAG 系统的关键目标。 Grounding 要求模型输出锚定在可验证证据上,是降低幻觉、建设可信 AI 的核心工程目标。

工作原理

手段包括:RAG 注入检索片段、强制引用格式、工具/API 返回作为唯一事实源、多模态对齐(框选区域)、知识图谱约束。评测关注答案是否被证据支持(faithfulness)与引用是否正确。

应用场景

企业知识库、法律/医疗辅助、客服溯源、新闻事实核查、视觉问答「指着图说」。监管与审计场景尤其需要可追溯输出。

局限与误区

检索失败时模型仍会编造看似有引用的答案。仅加「请引用来源」指令不够,需检索质量、拒答策略与事后校验闭环。

发展脉络

NLP 时代即有 grounded generation 研究;LLM 时代与 RAG、Agent 工具调用融合;多模态 grounding 随 GPT-4V、Gemini 等视觉模型普及。

人们怎么说

日常交流里常听到的说法——未必准确,但有助于理解误解从哪来。

  • 「输出要有据可查」
  • 「别瞎编要有出处」
  • 「RAG 就是为了 grounding」

参见

延伸阅读

从知识库精选 3 篇文章,帮助深入理解该术语。

  1. 1

    RAG 检索增强生成架构指南

    如何结合外部知识库增强 LLM 的准确性和时效性

  2. 2

    Agent 记忆系统(四):向量数据库、知识图谱与记忆检索全景指南

    AI Agent 的记忆系统是决定其智能水平的核心组件。本文系统讲解 Agent 记忆体系的完整架构:从短期工作记忆到长期语义记忆,从向量数据库的嵌入检索到知识图谱的关系推理,从记忆压缩策略到遗忘机制,帮助你在构建 Agent 时设计正确的记忆方案。

  3. 3

    大语言模型训练全流程

    从数据采集到预训练、指令微调到人类反馈强化学习的完整管线