核心要点

  • AR(p):用前 p 期自身的滞后值线性回归当前值,刻画自相关。

  • I(d):做 d 阶差分使序列平稳,d 通常为 0/1/2,由 ADF 检验决定。

  • MA(q):用前 q 期的预测残差(白噪声)线性组合,刻画短期冲击。

  • 定阶:差分后看 ACF 定 q、PACF 定 p,或用 AIC/BIC 网格搜索。

标准回答

模型构成

ARIMA(p, d, q) 把序列分解为三层处理。AR(AutoRegressive,自回归)的 p 阶项假设当前值由前 p 个时刻的观测值线性决定:

\( y_t = c + \sum_{i=1}^{p}\phi_i y_{t-i} + \varepsilon_t \)

I(Integrated,差分整合)的 d 表示对原序列做 d 阶差分,把非平稳序列转成平稳序列后再建模。MA(Moving Average,移动平均)的 q 阶项用前 q 个时刻的残差(白噪声冲击)建模:\( \sum_{j=1}^{q}\theta_j \varepsilon_{t-j} \)。

定阶流程

先用 ADF/KPSS 检验平稳性、确定 d;对差分后序列画 ACF(自相关)和 PACF(偏自相关):PACF 在 p 阶后截尾定 AR 阶,ACF 在 q 阶后截尾定 MA 阶。也可在候选范围内用 AIC/BIC 网格搜索取最小者。带季节项时扩展为 SARIMA。

常见误区

⚠️ 常见踩坑

把 d 当成越大越好——过度差分会引入虚假负相关、放大方差;d 应取「恰好平稳」的最小阶。

追问

追问 1怎么判断该用几阶差分 d?

对原序列做 ADF 检验,若不平稳则差分一次再检验,直到通过(KPSS 互为补充)。一般金融/趋势数据 d=1 即可,d 很少超过 2。也可结合 ACF 衰减是否过慢来判断。

追问 2ARIMA 与 SARIMA 的区别?

SARIMA = ARIMA(p,d,q)×(P,D,Q)_s,额外引入以周期 s(如 12 个月)为间隔的季节性 AR/差分/MA 项,专门刻画周期模式,而 ARIMA 只建模非季节的短期依赖。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。