核心要点

  • 召回从亿级库中快速取出几千候选,强调高召回率、低延迟

  • 多路并行:协同过滤、向量(双塔)、热门、规则/运营、标签/类目等

  • 各路结果统一汇总、去重,再交给精排打分

  • 多路互补可提升覆盖率与多样性,缓解单路偏置

标准回答

召回的定位:从海量物品(亿级)中快速筛出几百到几千个候选给精排,要求高召回、低延迟,单路策略很难同时覆盖兴趣的多个侧面,因此工业界普遍用多路召回

常见召回路

  • 协同过滤 / ItemCF:基于共现相似。
  • 向量召回(双塔 + ANN):语义/行为相似。
  • 热门召回:高热度物品,保底与新用户冷启。
  • 规则 / 运营召回:地域、时效、运营干预、强插。
  • 标签 / 类目召回:按用户兴趣标签或偏好类目取物品。

融合:各路并行召回后统一合并、去重,按各路配额(截断 Top-N)控制比例,再交给精排统一打分排序。融合时常做轻量调权或质量过滤,但精细排序由后续精排负责。

价值:不同路捕捉不同信号,互补提升覆盖率与多样性,避免单一模型的系统性偏置。

常见误区

⚠️ 常见踩坑

多路召回的目标是高召回与多样性,不是精确排序;不要在召回阶段做复杂精排式打分,融合时各路分数量纲不同,简单相加比较会失真,应按配额或归一化后融合。

追问

追问 1为什么不直接用一路向量召回全覆盖?

单路向量召回受限于其训练目标与样本偏置,对长尾、新内容、强时效或运营需求覆盖不足,且易陷入信息茧房。多路从不同信号补充,整体召回率与多样性更高、更鲁棒。

追问 2多路召回的配额如何确定?

通常按各路的线上贡献(带来的曝光/转化)和多样性需求分配截断数量,并通过 A/B 实验调整;新增召回路常用「保量探索」给一定配额观察增量收益。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。