核心要点

  • 区分三类:新用户、新物品、新系统冷启动,应对手段不同

  • 没有行为就用内容/画像特征(侧信息)替代,让新对象也能进双塔召回

  • 热门/兜底召回保证基本体验,探索(EE,如 Bandit)给新物品曝光机会

  • 跨域/跨平台迁移用户画像与 embedding,加速冷启动

标准回答

问题拆分

冷启动指缺少交互数据时难以推荐,分三类:新用户(无历史行为)、新物品(无被点击数据)、新系统(整体数据稀少)。

新用户冷启动

用注册信息/设备/地理等画像,结合热门、新手探索(多样化试探兴趣)、问卷引导;有跨平台数据则迁移画像。逐步积累行为后切换到个性化模型。

新物品冷启动

关键是用内容特征(标题、标签、图文 embedding、作者)替代行为特征,让新物品也能被双塔向量召回与内容召回触达;同时用探索机制(EE)给一定曝光配额收集反馈。

探索与利用(EE)

冷启动天然是探索-利用权衡:用 ε-greedy、UCB、Thompson Sampling(Bandit)在「推已知好内容」与「试探新内容」间平衡,让新物品快速积累数据又不过度牺牲体验。

迁移与兜底

跨域迁移已有 embedding/画像;热门、运营池作为兜底召回保证不冷场。

评估

关注新用户次留、新物品曝光后的成长速度(冷启动转正率),用 A/B 对比策略

常见误区

⚠️ 常见踩坑

把冷启动当纯算法问题,忽视用内容/画像侧信息和热门兜底;以及完全不做探索(EE),新物品永远拿不到曝光、永远冷,形成马太效应。

追问

追问 1新物品没有行为数据,怎么进入召回和排序?

用内容特征替代:把标题、标签、类目、图文做 embedding,新物品即可被内容召回和双塔向量召回触达,排序时也用这些侧信息特征。同时给新物品分配探索曝光配额收集真实反馈,逐步从「靠内容预估」过渡到「靠行为预估」。

追问 2探索利用(EE)常用哪些方法,各自特点?

ε-greedy 以小概率随机探索,简单但盲目;UCB 给不确定性高的物品加置信上界奖励,倾向探索数据少的;Thompson Sampling 按后验分布采样,自然平衡探索利用、工程上常用。Bandit 类方法都在「利用已知最优」和「试探潜在更优」间权衡,适合冷启动场景。

追问 3怎么评估冷启动策略有没有效果?

针对性指标:新用户看次日/7 日留存、兴趣探明速度;新物品看曝光后的「冷启动转正率」(多久积累到足够数据进入正常推荐)、首批曝光的转化效率。整体用 A/B,对比新策略下新用户留存与新物品成长是否提升,同时确保不显著损害大盘体验。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。