核心要点

  • 画出经典漏斗:多路召回 → 粗排 → 精排(多目标)→ 重排(多样性/打散/规则),逐层缩小候选

  • 召回要多路:协同过滤、双塔向量召回、标签/作者关注、热门兜底与冷启动专路

  • 精排是多目标:完播、点赞、评论、时长加权融合,强调实时特征与行为流回传

  • 讲清难点:探索利用平衡、反馈延迟与位置/曝光偏差纠偏、冷启动,指标看人均时长与次留

标准回答

需求与指标

明确优化目标:人均使用时长与次日/7 日留存是北极星,辅以完播率、互动率。约束:单次刷新延迟(百毫秒级)、亿级视频库与千万级 DAU、实时反馈。

整体架构

请求 → 多路召回 → 粗排 → 精排 → 重排 → 下发;行为日志经流式管道实时回传更新特征与样本。

召回

多路并行:协同过滤(i2i/u2i)、双塔 向量召回(用户/视频 embedding 经 ANN 检索,库可用 Milvus 类)、标签与关注关系召回、热门兜底,外加冷启动专路给新视频/新用户曝光机会。各路取 TopN 合并去重。

粗排与精排

粗排用轻量双塔/GBDT 把上万候选砍到数百,平衡延迟与精度。精排是 多目标 排序:用多任务模型同时预测完播、点赞、评论、有效观看时长等,再加权融合成最终分。依赖实时特征(近期行为序列)与 特征平台 保证训练/推理一致。

重排

在精排结果上做多样性与打散(同作者/同品类去重)、新鲜度提权、规则与生态调控,并引入探索(EE)给长尾与新内容曝光。

评估与去偏

线上以 A/B 实验为准,关注时长与留存;离线纠正位置/曝光偏差与反馈延迟(点赞/完播信号到达有时延),用无偏估计与延迟反馈建模避免样本偏差累积。

常见误区

⚠️ 常见踩坑

只优化点击/完播单目标会导致标题党与体验下降;忽略探索与冷启动会让新内容无法起量;不处理位置偏差与反馈延迟会让模型自我强化、推荐越来越窄。

追问

追问 1精排多目标如何融合?权重怎么定?

用多任务模型共享底层、分塔输出各目标概率,再用加权公式(如 score = 完播^a × 时长^b × (1+互动)^c)融合。权重不靠拍脑袋:先用线上 A/B 网格/贝叶斯搜索,或用帕累托/进化算法在留存与互动间寻优;也可上多目标融合模型(如 MMoE/PLE)让网络自学任务关系,长期目标用强化学习或长期价值建模校正。

追问 2冷启动(新视频、新用户)怎么解决?

新视频:用内容侧特征(标题/标签/封面/作者画像 + 多模态 embedding)做内容召回,给探索流量快速收集反馈,用 Thompson Sampling/UCB 控制曝光与风险。新用户:先用人口属性与热门/多样化内容试探,结合快速在线学习几刷内收敛兴趣;冷启动样本单独建模避免被大盘淹没。

追问 3反馈延迟和样本偏差如何处理,避免模型越推越窄?

完播/点赞等正反馈到达有延迟,直接训练会把延迟正样本当负样本,用延迟反馈建模(如对转化时间建模、重要性加权或等待窗口修正)。位置/曝光偏差用 IPW 逆倾向加权或位置特征显式建模剥离。再叠加探索流量与多样性约束,持续注入分布外样本,打破「只推已知偏好」的自强化循环。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。