核心要点

  • 表示学习把实体和关系嵌入低维连续向量,捕获语义与结构

  • TransE:把关系建模为平移,目标 h + r ≈ t,简单高效

  • TransR:实体与关系在不同空间,先用关系矩阵投影实体再做平移,处理复杂关系

  • RotatE:复数空间用旋转建模关系,可表达对称/反对称/逆等关系模式

  • 用途:链接预测、知识补全、推理

标准回答

目标

知识图谱表示学习(KGE)把实体和关系映射为低维向量,使图的语义和结构能用向量运算度量,从而支持链接预测与知识补全。

TransE

把关系看作头实体到尾实体的平移向量,对成立的三元组让 h + r ≈ t,打分函数为 -‖h + r - t‖。优点是简单高效,但难以建模一对多、多对一、多对多关系(同一 r 下多个 t 会被挤到一起)。

TransR

针对 TransE 的不足,让实体空间与关系空间分离:每个关系有投影矩阵 Mr,先把 h、t 投影到关系空间得 hr、tr,再要求 hr + r ≈ tr。表达力更强但参数更多。

RotatE

在复数向量空间把关系建模为旋转(t ≈ h ∘ r,|r|=1),能自然刻画对称、反对称、求逆、组合等关系模式,是更强的几何范式。

这些嵌入训练好后,可对缺失三元组打分排序,实现知识补全和推理。

常见误区

⚠️ 常见踩坑

TransE 不能很好处理一对多/多对多关系——别声称它对所有关系都有效;这正是 TransR、RotatE 等改进的动机。

追问

追问 1KGE 训练时为什么需要负采样?

KG 只有正三元组,需构造负样本形成对比:通常随机替换头或尾实体得到不成立的三元组,用 margin-based ranking loss 让正样本得分高于负样本。负采样质量影响收敛与效果,后续有 self-adversarial 等改进。

追问 2TransE 类平移模型与 DistMult/ComplEx 类语义匹配模型有何区别?

平移模型(TransE/R)用几何距离(h+r-t 的范数)打分,几何直观;语义匹配模型(DistMult、ComplEx)用双线性内积打分,DistMult 只能建对称关系,ComplEx 引入复数可建非对称关系,二者是两类主流范式。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。