推荐召回有哪些多路策略？如何融合？

Question 1

推荐召回有哪些多路策略？如何融合？

Accepted Answer

召回的定位：从海量物品（亿级）中快速筛出几百到几千个候选给精排，要求高召回、低延迟，单路策略很难同时覆盖兴趣的多个侧面，因此工业界普遍用多路召回。 常见召回路： - 协同过滤 / ItemCF：基于共现相似。 - 向量召回（双塔 + ANN）：语义/行为相似。 - 热门召回：高热度物品，保底与新用户冷启。 - 规则 / 运营召回：地域、时效、运营干预、强插。 - 标签 / 类目召回：按用户兴趣标签或偏好类目取物品。 融合：各路并行召回后统一合并、去重，按各路配额（截断 Top-N）控制比例，再交给精排统一打分排序。融合时常做轻量调权或质量过滤，但精细排序由后续精排负责。 价值：不同路捕捉不同信号，互补提升覆盖率与多样性，避免单一模型的系统性偏置。

Question 2

为什么不直接用一路向量召回全覆盖？

Accepted Answer

单路向量召回受限于其训练目标与样本偏置，对长尾、新内容、强时效或运营需求覆盖不足，且易陷入信息茧房。多路从不同信号补充，整体召回率与多样性更高、更鲁棒。

Question 3

多路召回的配额如何确定？

Accepted Answer

通常按各路的线上贡献（带来的曝光/转化）和多样性需求分配截断数量，并通过 A/B 实验调整；新增召回路常用「保量探索」给一定配额观察增量收益。

推荐召回有哪些多路策略？如何融合？

核心要点

标准回答

常见误区

追问

延伸学习