核心要点

  • 定义:数据以流的形式持续到达,模型在新数据上逐步更新参数,而不是攒齐全量重新训练

  • 场景:推荐/广告 CTR、风控、实时排序等数据量大、时效强、分布随时间变化的任务

  • 核心挑战:灾难性遗忘(学新忘旧)、概念漂移(数据分布随时间变)、稳定性-可塑性权衡

  • 常用手段:在线 SGD 逐样本/小批更新、经验回放保留旧样本、滑动窗口/衰减、漂移检测触发再训

标准回答

定义

在线学习指数据像流水一样持续到达,模型每来一批(甚至一条)就更新一次参数;增量学习强调在不访问全部历史数据的前提下持续吸收新数据/新任务。两者都对应「不一次性见到全量数据」的设定,与传统批量训练相对。

适用场景

数据量极大无法一次载入、或时效性强、分布会随时间变化的任务:推荐与广告 CTR、实时风控、搜索排序、传感器流等。优点是能及时跟上最新分布、节省重训成本。

核心挑战

一是灾难性遗忘:在新数据上更新会冲掉旧知识;二是概念漂移:数据分布随时间改变,旧模式失效;三是稳定性-可塑性权衡:太稳则学不动新知识,太可塑则遗忘旧的。

常用手段

在线 SGD 逐步更新并配合学习率衰减;经验回放/保留少量旧样本一起训练;滑动窗口或样本加权侧重近期数据;用漂移检测(如分布/误差监控)触发重新训练或学习率调整。

常见误区

⚠️ 常见踩坑

以为在线学习只是「不停地用新数据微调」就够了——若不处理灾难性遗忘和概念漂移,模型会快速偏向最近数据、遗忘旧知识甚至被异常流量污染;生产中需配合回放、漂移检测和监控。

追问

追问 1概念漂移有哪些类型,如何检测?

常见类型:突变漂移(分布骤变)、渐变漂移(缓慢过渡)、周期性漂移(如节假日)、以及虚拟漂移(输入分布变但条件分布不变)。检测方法包括监控在线预测误差/准确率的变化(如 DDM、ADWIN)、统计检验比较新旧窗口分布、监控特征分布偏移。检测到后触发再训练、调整学习率或切换模型。

追问 2在线学习如何缓解灾难性遗忘?

常用三类:回放法(保留或生成旧样本与新数据混合训练);正则法(如 EWC,对重要参数加约束惩罚其偏移);参数隔离/扩展(为新任务分配新容量,冻结旧部分)。工程上最实用的是经验回放配合合适的学习率与样本加权,在可塑性与稳定性间取得平衡。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。