核心要点
每个词只有一个 head(支配词)和一个 deprel 关系类型,整句构成以 root 为根的依存树
依存树直接连接词与词,比成分树更直接暴露主谓宾,利于关系抽取
主流实现:转移式(shift/reduce + 分类器)快,图模型(最大生成树)和 biaffine 神经解析器更准
projective 指弧不交叉,中文「把」字前置等会产生 non-projective,需专门算法处理
简要回答
输出信息:对每个词 $w_i$ 给出 head(支配词)和 deprel(依存关系类型),构成一棵(或森林)依存树;
示例:「小明 吃 苹果」→ 吃←root,小明←nsubj(主语),苹果←dobj(宾语)
标准回答
输出信息:对每个词 $w_i$ 给出 head(支配词)和 deprel(依存关系类型),构成一棵(或森林)依存树。
示例:「小明 吃 苹果」→ 吃←root,小明←nsubj(主语),苹果←dobj(宾语)。
与成分解析区别:依存树直接连词与词,成分树先短语再组合;依存更利于关系抽取。
经典算法
projective:弧不交叉(英文常见);中文允许非 projective(把… 前置)。
下游用途
- 关系抽取:找主谓宾路径
- 事件抽取、问答语义匹配
- 语法纠错、文本生成控制
常见误区
⚠️ 常见踩坑
混淆依存树与短语结构树;说不出具体依存关系类型;忽略非 projective 现象。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。
📖 术语表
📰 AI 资讯
🛠️ AI 工具
- spaCy
工业级 Python NLP 库,33K+ stars。提供高效的文本分词、命名实体识别、依存句法分析等能力,内置预训练模型支持 70+ 语言,是生产环境 NLP 任务的标准选择