核心要点
表示学习把实体和关系嵌入低维连续向量,捕获语义与结构
TransE:把关系建模为平移,目标 h + r ≈ t,简单高效
TransR:实体与关系在不同空间,先用关系矩阵投影实体再做平移,处理复杂关系
RotatE:复数空间用旋转建模关系,可表达对称/反对称/逆等关系模式
用途:链接预测、知识补全、推理
标准回答
目标
知识图谱表示学习(KGE)把实体和关系映射为低维向量,使图的语义和结构能用向量运算度量,从而支持链接预测与知识补全。
TransE
把关系看作头实体到尾实体的平移向量,对成立的三元组让 h + r ≈ t,打分函数为 -‖h + r - t‖。优点是简单高效,但难以建模一对多、多对一、多对多关系(同一 r 下多个 t 会被挤到一起)。
TransR
针对 TransE 的不足,让实体空间与关系空间分离:每个关系有投影矩阵 Mr,先把 h、t 投影到关系空间得 hr、tr,再要求 hr + r ≈ tr。表达力更强但参数更多。
RotatE
在复数向量空间把关系建模为旋转(t ≈ h ∘ r,|r|=1),能自然刻画对称、反对称、求逆、组合等关系模式,是更强的几何范式。
这些嵌入训练好后,可对缺失三元组打分排序,实现知识补全和推理。
常见误区
⚠️ 常见踩坑
TransE 不能很好处理一对多/多对多关系——别声称它对所有关系都有效;这正是 TransR、RotatE 等改进的动机。
追问
追问 1:KGE 训练时为什么需要负采样?
KG 只有正三元组,需构造负样本形成对比:通常随机替换头或尾实体得到不成立的三元组,用 margin-based ranking loss 让正样本得分高于负样本。负采样质量影响收敛与效果,后续有 self-adversarial 等改进。
追问 2:TransE 类平移模型与 DistMult/ComplEx 类语义匹配模型有何区别?
平移模型(TransE/R)用几何距离(h+r-t 的范数)打分,几何直观;语义匹配模型(DistMult、ComplEx)用双线性内积打分,DistMult 只能建对称关系,ComplEx 引入复数可建非对称关系,二者是两类主流范式。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。