核心要点

  • 把握三大特点:趋势(长期上升/下降)、季节性(周期波动)、自相关(当前值依赖历史值)。

  • 统计方法选 ARIMA、指数平滑、Prophet;深度方法用 LSTM;也可特征化后用树模型(XGBoost)。

  • 划分数据严格按时间顺序切分,绝不能随机 shuffle,否则会用未来信息泄漏。

  • 常用评估指标 MAE、RMSE、MAPE,并对比一个朴素基线(如上一周期值)。

标准回答

数据特点

时间序列与普通监督学习最大的不同是样本有时间顺序且彼此相关。典型结构包括:趋势(长期方向)、季节性(固定周期的波动,如周/年)、自相关(当前值与滞后值相关)以及噪声。建模前常用差分使序列平稳。

常用方法

  • 统计模型:ARIMA(自回归+差分+移动平均)、指数平滑(Holt-Winters)、Facebook Prophet(趋势+季节+节假日,鲁棒易用)。
  • 深度学习:LSTM/GRU、Temporal Convolution、Transformer,适合长序列和多变量。
  • 特征化树模型:构造滞后特征、滑动统计、时间特征后用 XGBoost/LightGBM,工程上常很强。

关键注意

训练/验证/测试必须按时间先后切分,验证集在训练集之后;评估用时序交叉验证(rolling/expanding window),切忌随机打乱造成未来信息泄漏。指标用 MAE、RMSE、MAPE,并与朴素基线对比。

常见误区

⚠️ 常见踩坑

像普通分类任务那样随机 shuffle 后划分训练/测试集,会让模型见到未来数据导致信息泄漏,离线指标虚高、上线翻车。

追问

追问 1什么是平稳性?为什么 ARIMA 需要它?

平稳指序列的均值、方差、自相关结构不随时间改变。ARIMA 的自回归与移动平均部分建立在平稳假设上,非平稳序列(有趋势或季节性)需先通过差分(I 中的 d)或季节差分转为平稳,否则参数估计与预测不可靠。可用 ADF 检验判断平稳性。

追问 2多变量、有外部特征时怎么建模?

可用带外生变量的模型,如 ARIMAX/SARIMAX、Prophet 加 regressor,或直接把外部特征与滞后特征拼接喂给 LSTM、Transformer 或树模型。工程上常把问题转成「用过去窗口预测未来窗口」的监督学习,外生变量作为额外列输入。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。

🛠️ AI 工具

  • Temporal

    Temporal 是一个开源的微服务编排引擎,提供可靠的分布式工作流执行能力。支持容错、重试、状态持久化等特性,被广泛应用于 AI Agent 工作流编排、数据处理管道和跨服务协调场景。21K+ stars。