标准回答
任务
知识图谱推理是基于已有三元组推断缺失或隐含的知识,典型任务是链接预测(预测缺失的头/尾实体或关系)和知识补全。
规则 / 路径方法
利用逻辑规则或关系路径推理,例如「父亲(x,y) ∧ 父亲(y,z) → 祖父(x,z)」,或用 PRA(Path Ranking Algorithm)以实体间的关系路径作为特征预测新关系。优点是可解释、可注入先验,缺点是规则获取成本高、覆盖有限。
嵌入方法
用知识图谱表示学习(如 TransE、RotatE)把实体关系嵌入向量,对候选缺失三元组用打分函数排序,得分高者作为补全结果。可扩展性好,但可解释性弱。
GNN 方法
用图神经网络(如 R-GCN、CompGCN)沿图聚合多跳邻居信息,编码出富含结构的实体/关系表示,再做端到端的链接预测,能更好利用图拓扑。
实践中常将三类方法融合,并与 LLM/GraphRAG 结合做多跳与全局推理。
常见误区
⚠️ 常见踩坑
别把嵌入打分得到的高分三元组当作确定事实:KGE 推理是概率性排序补全,可能产生噪声,需阈值或人工/规则校验,重要场景应保留可解释性。
追问
追问 1:链接预测一般用什么指标评估?
常用排序指标:MRR(平均倒数排名)和 Hits@K(正确实体排进前 K 的比例,如 Hits@1/3/10)。评估时对每个测试三元组替换头或尾实体构造候选并排名,且常用 filtered 设置剔除已知正样本干扰。
追问 2:为什么要把 GNN 引入知识图谱推理?
传统 KGE 多以单个三元组为单位打分,难显式利用多跳邻域结构。GNN 通过消息传递聚合邻居,使实体表示编码局部子图拓扑,对关系组合、稀疏实体的推理更鲁棒,常作为 KGE 的结构增强。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。