核心要点

  • 每个词只有一个 head(支配词)和一个 deprel 关系类型,整句构成以 root 为根的依存树

  • 依存树直接连接词与词,比成分树更直接暴露主谓宾,利于关系抽取

  • 主流实现:转移式(shift/reduce + 分类器)快,图模型(最大生成树)和 biaffine 神经解析器更准

  • projective 指弧不交叉,中文「把」字前置等会产生 non-projective,需专门算法处理

简要回答

输出信息:对每个词 $w_i$ 给出 head(支配词)和 deprel(依存关系类型),构成一棵(或森林)依存树;

示例:「小明 吃 苹果」→ 吃←root,小明←nsubj(主语),苹果←dobj(宾语)

标准回答

输出信息:对每个词 $w_i$ 给出 head(支配词)和 deprel(依存关系类型),构成一棵(或森林)依存树。

示例:「小明 吃 苹果」→ 吃←root,小明←nsubj(主语),苹果←dobj(宾语)。

与成分解析区别:依存树直接连词与词,成分树先短语再组合;依存更利于关系抽取。

经典算法

  • 转移式(MaltParser):状态机 + 分类器逐步 shift/reduce
  • 图模型:Eisner 算法求最大生成树
  • 神经网络:biaffine parser(BERT 编码 + 打分弧)

projective:弧不交叉(英文常见);中文允许非 projective(把… 前置)。

下游用途

  • 关系抽取:找主谓宾路径
  • 事件抽取、问答语义匹配
  • 语法纠错、文本生成控制

工具:spaCy、Stanza、HanLP。详见 NLP 句法分析

常见误区

⚠️ 常见踩坑

混淆依存树与短语结构树;说不出具体依存关系类型;忽略非 projective 现象。

追问

追问 1依存解析准确率瓶颈在哪?

长句、口语省略、领域术语、标点错误。联合 POS+解析、用预训练上下文表示、领域自适应数据是常见改进方向。

追问 2Universal Dependencies 是什么?

跨语言统一的依存标注规范(UD v2),使多语言 parser 可共享架构与评测,促进零样本跨语言迁移研究。

追问 3LLM 还需要依存解析吗?

生成式模型内隐学了部分句法,但显式依存仍用于可解释分析、结构化抽取、低资源语言工具链,以及与符号推理结合。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。