简要回答
命名实体(Named Entity):文本中指代特定对象、事件或数量的短语,如「苹果公司」「2024 年」「北京市」;
NER 任务:给定文本,输出实体边界(span)+ 类型标签
常见误区
⚠️ 常见踩坑
把普通名词当命名实体;混淆 NER 与实体链接(EL);不提嵌套实体与领域适配。
追问
追问 1:嵌套 NER 怎么处理?
平面 BIO 无法表达「北京大学」内含「北京」。可用嵌套标签、超图、span-based 分类器(枚举候选 span 再分类),或 pipeline 先长后短。
追问 2:NER 和实体链接(EL)区别?
NER 只识别「苹果公司」这个 mention;EL 把它消歧并链接到知识库实体 Q312(Apple Inc.)。EL 需要候选生成 + 排序,解决同名歧义。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。
📖 术语表
📰 AI 资讯
🛠️ AI 工具
- spaCy
工业级 Python NLP 库,33K+ stars。提供高效的文本分词、命名实体识别、依存句法分析等能力,内置预训练模型支持 70+ 语言,是生产环境 NLP 任务的标准选择