标准回答
数据特点
时间序列与普通监督学习最大的不同是样本有时间顺序且彼此相关。典型结构包括:趋势(长期方向)、季节性(固定周期的波动,如周/年)、自相关(当前值与滞后值相关)以及噪声。建模前常用差分使序列平稳。
常用方法
- 统计模型:ARIMA(自回归+差分+移动平均)、指数平滑(Holt-Winters)、Facebook Prophet(趋势+季节+节假日,鲁棒易用)。
- 深度学习:LSTM/GRU、Temporal Convolution、Transformer,适合长序列和多变量。
- 特征化树模型:构造滞后特征、滑动统计、时间特征后用 XGBoost/LightGBM,工程上常很强。
关键注意
训练/验证/测试必须按时间先后切分,验证集在训练集之后;评估用时序交叉验证(rolling/expanding window),切忌随机打乱造成未来信息泄漏。指标用 MAE、RMSE、MAPE,并与朴素基线对比。
常见误区
⚠️ 常见踩坑
像普通分类任务那样随机 shuffle 后划分训练/测试集,会让模型见到未来数据导致信息泄漏,离线指标虚高、上线翻车。
追问
追问 1:什么是平稳性?为什么 ARIMA 需要它?
平稳指序列的均值、方差、自相关结构不随时间改变。ARIMA 的自回归与移动平均部分建立在平稳假设上,非平稳序列(有趋势或季节性)需先通过差分(I 中的 d)或季节差分转为平稳,否则参数估计与预测不可靠。可用 ADF 检验判断平稳性。
追问 2:多变量、有外部特征时怎么建模?
可用带外生变量的模型,如 ARIMAX/SARIMAX、Prophet 加 regressor,或直接把外部特征与滞后特征拼接喂给 LSTM、Transformer 或树模型。工程上常把问题转成「用过去窗口预测未来窗口」的监督学习,外生变量作为额外列输入。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。
📖 术语表
🛠️ AI 工具
- Temporal
Temporal 是一个开源的微服务编排引擎,提供可靠的分布式工作流执行能力。支持容错、重试、状态持久化等特性,被广泛应用于 AI Agent 工作流编排、数据处理管道和跨服务协调场景。21K+ stars。