核心要点
定义:数据以流的形式持续到达,模型在新数据上逐步更新参数,而不是攒齐全量重新训练
场景:推荐/广告 CTR、风控、实时排序等数据量大、时效强、分布随时间变化的任务
核心挑战:灾难性遗忘(学新忘旧)、概念漂移(数据分布随时间变)、稳定性-可塑性权衡
常用手段:在线 SGD 逐样本/小批更新、经验回放保留旧样本、滑动窗口/衰减、漂移检测触发再训
标准回答
定义
在线学习指数据像流水一样持续到达,模型每来一批(甚至一条)就更新一次参数;增量学习强调在不访问全部历史数据的前提下持续吸收新数据/新任务。两者都对应「不一次性见到全量数据」的设定,与传统批量训练相对。
适用场景
数据量极大无法一次载入、或时效性强、分布会随时间变化的任务:推荐与广告 CTR、实时风控、搜索排序、传感器流等。优点是能及时跟上最新分布、节省重训成本。
核心挑战
一是灾难性遗忘:在新数据上更新会冲掉旧知识;二是概念漂移:数据分布随时间改变,旧模式失效;三是稳定性-可塑性权衡:太稳则学不动新知识,太可塑则遗忘旧的。
常用手段
在线 SGD 逐步更新并配合学习率衰减;经验回放/保留少量旧样本一起训练;滑动窗口或样本加权侧重近期数据;用漂移检测(如分布/误差监控)触发重新训练或学习率调整。
常见误区
⚠️ 常见踩坑
以为在线学习只是「不停地用新数据微调」就够了——若不处理灾难性遗忘和概念漂移,模型会快速偏向最近数据、遗忘旧知识甚至被异常流量污染;生产中需配合回放、漂移检测和监控。
追问
追问 1:概念漂移有哪些类型,如何检测?
常见类型:突变漂移(分布骤变)、渐变漂移(缓慢过渡)、周期性漂移(如节假日)、以及虚拟漂移(输入分布变但条件分布不变)。检测方法包括监控在线预测误差/准确率的变化(如 DDM、ADWIN)、统计检验比较新旧窗口分布、监控特征分布偏移。检测到后触发再训练、调整学习率或切换模型。
追问 2:在线学习如何缓解灾难性遗忘?
常用三类:回放法(保留或生成旧样本与新数据混合训练);正则法(如 EWC,对重要参数加约束惩罚其偏移);参数隔离/扩展(为新任务分配新容量,冻结旧部分)。工程上最实用的是经验回放配合合适的学习率与样本加权,在可塑性与稳定性间取得平衡。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。