如何设计一个短视频推荐系统？

Question 1

如何设计一个短视频推荐系统？

Accepted Answer

需求与指标 明确优化目标：人均使用时长与次日/7 日留存是北极星，辅以完播率、互动率。约束：单次刷新延迟（百毫秒级）、亿级视频库与千万级 DAU、实时反馈。 整体架构 请求 → 多路召回 → 粗排 → 精排 → 重排 → 下发；行为日志经流式管道实时回传更新特征与样本。 召回 多路并行：协同过滤（i2i/u2i）、双塔 向量召回（用户/视频 embedding 经 ANN 检索，库可用 Milvus 类）、标签与关注关系召回、热门兜底，外加冷启动专路给新视频/新用户曝光机会。各路取 TopN 合并去重。 粗排与精排 粗排用轻量双塔/GBDT 把上万候选砍到数百，平衡延迟与精度。精排是 多目标 排序：用多任务模型同时预测完播、点赞、评论、有效观看时长等，再加权融合成最终分。依赖实时特征（近期行为序列）与 特征平台 保证训练/推理一致。 重排 在精排结果上做多样性与打散（同作者/同品类去重）、新鲜度提权、规则与生态调控，并引入探索（EE）给长尾与新内容曝光。 评估与去偏 线上以 A/B 实验为准，关注时长与留存；离线纠正位置/曝光偏差与反馈延迟（点赞/完播信号到达有时延），用无偏估计与延迟反馈建模避免样本偏差累积。

Question 2

精排多目标如何融合？权重怎么定？

Accepted Answer

用多任务模型共享底层、分塔输出各目标概率，再用加权公式（如 score = 完播^a × 时长^b × (1+互动)^c）融合。权重不靠拍脑袋：先用线上 A/B 网格/贝叶斯搜索，或用帕累托/进化算法在留存与互动间寻优；也可上多目标融合模型（如 MMoE/PLE）让网络自学任务关系，长期目标用强化学习或长期价值建模校正。

Question 3

冷启动（新视频、新用户）怎么解决？

Accepted Answer

新视频：用内容侧特征（标题/标签/封面/作者画像 + 多模态 embedding）做内容召回，给探索流量快速收集反馈，用 Thompson Sampling/UCB 控制曝光与风险。新用户：先用人口属性与热门/多样化内容试探，结合快速在线学习几刷内收敛兴趣；冷启动样本单独建模避免被大盘淹没。

Question 4

反馈延迟和样本偏差如何处理，避免模型越推越窄？

Accepted Answer

完播/点赞等正反馈到达有延迟，直接训练会把延迟正样本当负样本，用延迟反馈建模（如对转化时间建模、重要性加权或等待窗口修正）。位置/曝光偏差用 IPW 逆倾向加权或位置特征显式建模剥离。再叠加探索流量与多样性约束，持续注入分布外样本，打破「只推已知偏好」的自强化循环。

如何设计一个短视频推荐系统？

核心要点

标准回答

常见误区

追问

延伸学习