基于知识图谱的问答（KBQA）如何实现？

Question 1

Accepted Answer

任务

KBQA（Knowledge Base Question Answering）让用户用自然语言提问，系统在知识图谱上查询与推理给出答案，如「鲁迅的弟弟的职业是什么」。

语义解析（Semantic Parsing）路线

把自然语言问题解析为结构化查询（SPARQL）或逻辑形式（lambda 演算/查询图）：先做实体链接定位主题实体，识别关系路径，组装查询并在图上执行。优点是可解释、能精确多跳；难点是解析准确率与覆盖度。

信息检索 / 向量路线

不显式生成查询，而是检索与问题相关的候选实体/子图，用模型对候选答案打分排序；可结合实体嵌入与问题嵌入做相似度匹配。适合大规模、关系复杂场景。

核心难点

实体与关系存在歧义需消歧；多跳问题需沿图遍历多条边推理；自然语言与图 schema 之间存在表述鸿沟。近年常用 LLM 做语义解析或与子图检索结合（GraphRAG 思路）来缓解。

Question 2

语义解析路线和检索路线各有什么优劣？

Accepted Answer

语义解析精确、可解释、擅长多跳和聚合（计数/最值），但依赖准确解析、对未见结构泛化差；检索/向量路线鲁棒、易扩展到大图，但可解释性弱、复杂逻辑推理能力有限。实践常融合两者。

Question 3

多跳问答（multi-hop）难在哪，如何处理？

Accepted Answer

多跳需沿图遍历多条关系并组合约束，搜索空间随跳数指数增长且易引入噪声。常用方法：分步关系路径预测、子图召回后图神经网络推理、或用 LLM 分解问题为多步子查询再逐步在图上执行。

核心要点