核心要点
区分三类:新用户、新物品、新系统冷启动,应对手段不同
没有行为就用内容/画像特征(侧信息)替代,让新对象也能进双塔召回
热门/兜底召回保证基本体验,探索(EE,如 Bandit)给新物品曝光机会
跨域/跨平台迁移用户画像与 embedding,加速冷启动
标准回答
问题拆分
冷启动指缺少交互数据时难以推荐,分三类:新用户(无历史行为)、新物品(无被点击数据)、新系统(整体数据稀少)。
新用户冷启动
用注册信息/设备/地理等画像,结合热门、新手探索(多样化试探兴趣)、问卷引导;有跨平台数据则迁移画像。逐步积累行为后切换到个性化模型。
新物品冷启动
关键是用内容特征(标题、标签、图文 embedding、作者)替代行为特征,让新物品也能被双塔向量召回与内容召回触达;同时用探索机制(EE)给一定曝光配额收集反馈。
探索与利用(EE)
冷启动天然是探索-利用权衡:用 ε-greedy、UCB、Thompson Sampling(Bandit)在「推已知好内容」与「试探新内容」间平衡,让新物品快速积累数据又不过度牺牲体验。
迁移与兜底
跨域迁移已有 embedding/画像;热门、运营池作为兜底召回保证不冷场。
评估
关注新用户次留、新物品曝光后的成长速度(冷启动转正率),用 A/B 对比策略。
常见误区
⚠️ 常见踩坑
把冷启动当纯算法问题,忽视用内容/画像侧信息和热门兜底;以及完全不做探索(EE),新物品永远拿不到曝光、永远冷,形成马太效应。
追问
追问 1:新物品没有行为数据,怎么进入召回和排序?
用内容特征替代:把标题、标签、类目、图文做 embedding,新物品即可被内容召回和双塔向量召回触达,排序时也用这些侧信息特征。同时给新物品分配探索曝光配额收集真实反馈,逐步从「靠内容预估」过渡到「靠行为预估」。
追问 2:探索利用(EE)常用哪些方法,各自特点?
ε-greedy 以小概率随机探索,简单但盲目;UCB 给不确定性高的物品加置信上界奖励,倾向探索数据少的;Thompson Sampling 按后验分布采样,自然平衡探索利用、工程上常用。Bandit 类方法都在「利用已知最优」和「试探潜在更优」间权衡,适合冷启动场景。
追问 3:怎么评估冷启动策略有没有效果?
针对性指标:新用户看次日/7 日留存、兴趣探明速度;新物品看曝光后的「冷启动转正率」(多久积累到足够数据进入正常推荐)、首批曝光的转化效率。整体用 A/B,对比新策略下新用户留存与新物品成长是否提升,同时确保不显著损害大盘体验。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。