Knowledge Graph(知识图谱)

知识图谱就是把现实世界的事物和它们的关系,用一张大网连起来存储,让机器能像人一样查『谁认识谁』、『什么属于什么』。

亦作、亦称:知识图谱 · KG · knowledge base graph · 知识库图谱 · 语义知识图

知识图谱以三元组形式结构化存储实体与关系,赋予 AI 系统精准的符号推理能力。在大语言模型时代,它已成为 Agent 记忆与 GraphRAG 管道的核心组件之一。

概述

知识图谱(Knowledge Graph,KG)以三元组「主体—关系—客体」为基本单元组织知识。

  • 实体(Entity):现实世界中可区分的对象,如人物、地点、概念
  • 关系(Relation):描述实体间的语义连接,如『出生于』、『属于』
  • 属性(Attribute):实体的特征值,如生日、别名
  • 整体构成有向标注图,支持 SPARQL、Cypher 等图查询语言进行多跳推理
  • 与纯文本相比,KG 存储的是结构化事实,具备更强的可解释性与精确性

工作原理

知识图谱的构建与运作分为四个核心环节。

  • 实体识别(NER):从非结构化文本中识别出人名、地名、组织等实体
  • 关系抽取(RE):判断两个实体之间是否存在预定义关系,并标注关系类型
  • 实体对齐:将来自不同数据源的同一实体合并为统一节点,消除歧义
  • 本体设计(Ontology):定义实体类别层级和合法关系类型,构成 KG 的模式层
  • 查询时通过图遍历、路径搜索或嵌入相似度计算,快速检索相关子图

类型与主流系统

按覆盖范围和构建方式,知识图谱可分为通用型和领域型两类。

  • 通用知识图谱:Freebase(2008)、DBpedia(2007)、Wikidata(2012)、Google Knowledge Graph(2012)、YAGO
  • 领域知识图谱:医疗(SNOMED CT、DrugBank)、金融、法律等垂直领域图谱
  • 企业知识图谱:阿里巴巴商品图谱、微软 Satori、亚马逊 Product Graph
  • 开放 vs 私有:Wikidata 是目前规模最大的开放多语言知识图谱,维基百科社区协作维护
  • 静态 vs 动态:部分图谱支持时态三元组,记录关系的有效时间段

应用场景

知识图谱在多个 AI 核心场景中发挥关键作用。

  • 搜索增强:Google 搜索知识面板、百度知心等直接调用 KG 呈现实体摘要
  • 问答系统(KGQA):将自然语言问题转化为图查询,返回精确答案
  • 推荐系统:利用用户与商品实体间的多跳关系实现可解释推荐
  • GraphRAG:以 KG 子图替代平铺文本块作为 LLM 上下文,提升事实准确性
  • Agent 记忆:在长期记忆模块中用 KG 结构化存储对话历史与用户偏好

局限与误区

知识图谱并非万能,在实际落地中存在若干挑战与常见误区。

  • 构建成本高:高质量 KG 需要大量人工标注或精细的自动抽取管道
  • 覆盖不完整:任何 KG 都存在缺失三元组,称为开放世界假设(Open World Assumption)问题
  • 更新滞后:动态世界中的事实变化难以及时同步到图中
  • 误区:KG 可完全替代 LLM——KG 缺乏语言生成能力,两者应协同而非对立
  • 误区:小型项目直接用 KG——对数据量有限、关系简单的场景,关系数据库或向量库成本更低

发展脉络

知识图谱的演进跨越半个多世纪,与 AI 整体发展紧密交织。

  • 1960s:语义网络(Semantic Network)提出,用图表示概念关系
  • 1970s:Minsky 提出框架(Frame)表示法,结构化描述实体属性
  • 1998:Tim Berners-Lee 提出语义网(Semantic Web)愿景,催生 RDF、OWL 等标准
  • 2007:DBpedia 上线,将维基百科半结构化数据转为 RDF 三元组
  • 2008:Freebase 发布(SIGMOD),成为首个大规模协作知识图谱
  • 2012:Google 正式发布 Google Knowledge Graph,将 KG 带入主流视野
  • 2014:Wikidata 由维基媒体基金会正式运营,成为最大开放多语言 KG
  • 2023—2024:微软提出 GraphRAG,KG 与 LLM 深度融合进入爆发阶段

常见误解

日常交流中容易听到的简化说法,未必准确,但能帮助理解误解从何而来。

  • 「知识图谱就是把现实世界的事物和它们的关系,用一张大网连起来存储,让机器能像人一样查『谁认识谁』、『什么属于什么』。」
  • 「有人以为知识图谱只是搜索引擎的专利,其实它现在已经跑进 AI Agent 的记忆系统和 RAG 管道里了。」
  • 「知识图谱和向量数据库不是对立的,前者存结构化关系、后者存语义相似度,组合起来才能做最强的知识检索。」

相关术语

和本术语关联紧密的其他词条,便于串联理解。

延伸阅读

从知识库精选 3 篇文章,帮助深入理解该术语。

  1. 1

    神经符号 AI:结合深度学习与逻辑推理的下一代架构

    深度解析神经符号 AI 如何融合神经网络的感知能力与符号系统的推理能力,打造可解释、可信赖、可推理的下一代 AI 系统

  2. 2

    Agent 记忆系统(四):向量数据库、知识图谱与记忆检索全景指南

    AI Agent 的记忆系统是决定其智能水平的核心组件。本文系统讲解 Agent 记忆体系的完整架构:从短期工作记忆到长期语义记忆,从向量数据库的嵌入检索到知识图谱的关系推理,从记忆压缩策略到遗忘机制,帮助你在构建 Agent 时设计正确的记忆方案。

  3. 3

    Agent 记忆系统(三):向量数据库、知识图谱与分层记忆架构

    从工作记忆到长期记忆,理解 AI Agent 如何实现知识的存储、检索、遗忘与更新。涵盖向量数据库、知识图谱、分层记忆架构的设计原则与实战实现。

外部参考

维基百科:查看「Knowledge Graph」词条

本页内容为本站原创撰写;维基百科链接仅作延伸参考。