为了确定时间序列模型的最佳滞后阶数,通常需要结合统计检验、可视化分析和验证技术。 目标是通过选择能够捕捉数据中最相关模式的最小滞后阶数,来平衡模型的准确性和简洁性。 常用的方法包括分析自相关图,使用 AIC 或 BIC 等信息准则,以及使用交叉验证测试模型。 每种方法都有其优缺点,通常结合使用可以获得最佳结果。
首先,自相关函数 (ACF) 和偏自相关函数 (PACF) 图是初步滞后阶数选择的实用工具。 ACF 显示时间序列与其滞后值之间的相关性有多强,而 PACF 则隔离特定滞后阶数的相关性,排除早期滞后阶数的影响。 例如,在自回归 (AR) 模型中,PACF 图中的显着峰值表示要包含的潜在滞后阶数。 如果 PACF 在滞后 3 之后急剧下降,则 AR(3) 模型可能适合。 相反,移动平均 (MA) 模型依赖于 ACF 来识别滞后阶数的截止点。 这些图提供了一个可视化的起点,但需要解释,因为真实世界的数据通常包含可能产生误导的噪声或季节性因素。
接下来,诸如赤池信息量准则 (AIC) 或贝叶斯信息量准则 (BIC) 之类的信息准则提供了一种定量方法来比较具有不同滞后结构的模型。 这些指标会惩罚模型复杂性(更多滞后阶数),同时奖励拟合优度。 例如,您可以拟合多个滞后阶数从 1 到 10 的 AR 模型,并选择 AIC 最低的模型。 在 Python 的 statsmodels
库中,这对于使用 auto_arima
等方法的 ARIMA 模型来说是自动化的,它会迭代滞后组合并根据 AIC 返回最佳模型。 但是,仅仅依赖这些准则有时会忽略实际性能,尤其是在数据存在结构性中断或异常值的情况下。
最后,交叉验证通过测试预测性能来帮助验证滞后阶数的选择。 对于时间序列,请使用滚动窗口验证等技术:在数据的子集上训练模型,预测下一个时期,并测量误差(例如,RMSE)。 在逐步增加滞后阶数的同时重复此过程。 平均误差最低的滞后阶数是最佳的。 例如,如果滞后 5 始终比滞后 3 或 7 产生更好的预测,那么它就是一个强有力的候选者。 这种方法计算量很大,但直接将滞后阶数的选择与实际性能联系起来。 将交叉验证与 ACF/PACF 分析和信息准则相结合可确保稳健性,尤其是在噪声或非平稳数据集中。