推荐系统的冷启动问题如何解决？

Question 1

推荐系统的冷启动问题如何解决？

Accepted Answer

问题拆分 冷启动指缺少交互数据时难以推荐，分三类：新用户（无历史行为）、新物品（无被点击数据）、新系统（整体数据稀少）。 新用户冷启动 用注册信息/设备/地理等画像，结合热门、新手探索（多样化试探兴趣）、问卷引导；有跨平台数据则迁移画像。逐步积累行为后切换到个性化模型。 新物品冷启动 关键是用内容特征（标题、标签、图文 embedding、作者）替代行为特征，让新物品也能被双塔向量召回与内容召回触达；同时用探索机制（EE）给一定曝光配额收集反馈。 探索与利用（EE） 冷启动天然是探索-利用权衡：用 ε-greedy、UCB、Thompson Sampling（Bandit）在「推已知好内容」与「试探新内容」间平衡，让新物品快速积累数据又不过度牺牲体验。 迁移与兜底 跨域迁移已有 embedding/画像；热门、运营池作为兜底召回保证不冷场。 评估 关注新用户次留、新物品曝光后的成长速度（冷启动转正率），用 A/B 对比策略。

Question 2

新物品没有行为数据，怎么进入召回和排序？

Accepted Answer

用内容特征替代：把标题、标签、类目、图文做 embedding，新物品即可被内容召回和双塔向量召回触达，排序时也用这些侧信息特征。同时给新物品分配探索曝光配额收集真实反馈，逐步从「靠内容预估」过渡到「靠行为预估」。

Question 3

探索利用（EE）常用哪些方法，各自特点？

Accepted Answer

ε-greedy 以小概率随机探索，简单但盲目；UCB 给不确定性高的物品加置信上界奖励，倾向探索数据少的；Thompson Sampling 按后验分布采样，自然平衡探索利用、工程上常用。Bandit 类方法都在「利用已知最优」和「试探潜在更优」间权衡，适合冷启动场景。

Question 4

怎么评估冷启动策略有没有效果？

Accepted Answer

针对性指标：新用户看次日/7 日留存、兴趣探明速度；新物品看曝光后的「冷启动转正率」（多久积累到足够数据进入正常推荐）、首批曝光的转化效率。整体用 A/B，对比新策略下新用户留存与新物品成长是否提升，同时确保不显著损害大盘体验。

推荐系统的冷启动问题如何解决？

核心要点

标准回答

常见误区

追问

延伸学习