在线学习与增量学习是什么？适用什么场景？

Question 1

Accepted Answer

定义

在线学习指数据像流水一样持续到达，模型每来一批（甚至一条）就更新一次参数；增量学习强调在不访问全部历史数据的前提下持续吸收新数据/新任务。两者都对应「不一次性见到全量数据」的设定，与传统批量训练相对。

适用场景

数据量极大无法一次载入、或时效性强、分布会随时间变化的任务：推荐与广告 CTR、实时风控、搜索排序、传感器流等。优点是能及时跟上最新分布、节省重训成本。

核心挑战

一是灾难性遗忘：在新数据上更新会冲掉旧知识；二是概念漂移：数据分布随时间改变，旧模式失效；三是稳定性-可塑性权衡：太稳则学不动新知识，太可塑则遗忘旧的。

常用手段

在线 SGD 逐步更新并配合学习率衰减；经验回放/保留少量旧样本一起训练；滑动窗口或样本加权侧重近期数据；用漂移检测（如分布/误差监控）触发重新训练或学习率调整。

Question 2

概念漂移有哪些类型，如何检测？

Accepted Answer

常见类型：突变漂移（分布骤变）、渐变漂移（缓慢过渡）、周期性漂移（如节假日）、以及虚拟漂移（输入分布变但条件分布不变）。检测方法包括监控在线预测误差/准确率的变化（如 DDM、ADWIN）、统计检验比较新旧窗口分布、监控特征分布偏移。检测到后触发再训练、调整学习率或切换模型。

Question 3

在线学习如何缓解灾难性遗忘？

Accepted Answer

常用三类：回放法（保留或生成旧样本与新数据混合训练）；正则法（如 EWC，对重要参数加约束惩罚其偏移）；参数隔离/扩展（为新任务分配新容量，冻结旧部分）。工程上最实用的是经验回放配合合适的学习率与样本加权，在可塑性与稳定性间取得平衡。

核心要点