核心要点
画出经典漏斗:多路召回 → 粗排 → 精排(多目标)→ 重排(多样性/打散/规则),逐层缩小候选
召回要多路:协同过滤、双塔向量召回、标签/作者关注、热门兜底与冷启动专路
精排是多目标:完播、点赞、评论、时长加权融合,强调实时特征与行为流回传
讲清难点:探索利用平衡、反馈延迟与位置/曝光偏差纠偏、冷启动,指标看人均时长与次留
标准回答
需求与指标
明确优化目标:人均使用时长与次日/7 日留存是北极星,辅以完播率、互动率。约束:单次刷新延迟(百毫秒级)、亿级视频库与千万级 DAU、实时反馈。
整体架构
请求 → 多路召回 → 粗排 → 精排 → 重排 → 下发;行为日志经流式管道实时回传更新特征与样本。
召回
多路并行:协同过滤(i2i/u2i)、双塔 向量召回(用户/视频 embedding 经 ANN 检索,库可用 Milvus 类)、标签与关注关系召回、热门兜底,外加冷启动专路给新视频/新用户曝光机会。各路取 TopN 合并去重。
粗排与精排
粗排用轻量双塔/GBDT 把上万候选砍到数百,平衡延迟与精度。精排是 多目标 排序:用多任务模型同时预测完播、点赞、评论、有效观看时长等,再加权融合成最终分。依赖实时特征(近期行为序列)与 特征平台 保证训练/推理一致。
重排
在精排结果上做多样性与打散(同作者/同品类去重)、新鲜度提权、规则与生态调控,并引入探索(EE)给长尾与新内容曝光。
评估与去偏
线上以 A/B 实验为准,关注时长与留存;离线纠正位置/曝光偏差与反馈延迟(点赞/完播信号到达有时延),用无偏估计与延迟反馈建模避免样本偏差累积。
常见误区
⚠️ 常见踩坑
只优化点击/完播单目标会导致标题党与体验下降;忽略探索与冷启动会让新内容无法起量;不处理位置偏差与反馈延迟会让模型自我强化、推荐越来越窄。
追问
追问 1:精排多目标如何融合?权重怎么定?
用多任务模型共享底层、分塔输出各目标概率,再用加权公式(如 score = 完播^a × 时长^b × (1+互动)^c)融合。权重不靠拍脑袋:先用线上 A/B 网格/贝叶斯搜索,或用帕累托/进化算法在留存与互动间寻优;也可上多目标融合模型(如 MMoE/PLE)让网络自学任务关系,长期目标用强化学习或长期价值建模校正。
追问 2:冷启动(新视频、新用户)怎么解决?
新视频:用内容侧特征(标题/标签/封面/作者画像 + 多模态 embedding)做内容召回,给探索流量快速收集反馈,用 Thompson Sampling/UCB 控制曝光与风险。新用户:先用人口属性与热门/多样化内容试探,结合快速在线学习几刷内收敛兴趣;冷启动样本单独建模避免被大盘淹没。
追问 3:反馈延迟和样本偏差如何处理,避免模型越推越窄?
完播/点赞等正反馈到达有延迟,直接训练会把延迟正样本当负样本,用延迟反馈建模(如对转化时间建模、重要性加权或等待窗口修正)。位置/曝光偏差用 IPW 逆倾向加权或位置特征显式建模剥离。再叠加探索流量与多样性约束,持续注入分布外样本,打破「只推已知偏好」的自强化循环。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。
🛠️ AI 工具
- Milvus
云原生向量数据库,43,875+ stars。专为 AI 应用设计的分布式向量搜索引擎,支持千亿级向量检索,广泛应用于 RAG、推荐系统和相似性搜索场景