ARIMA (p,d,q) 模型是一种用于时间序列预测的统计方法。 ARIMA 代表自回归积分滑动平均,它结合了三个组成部分来建模和预测未来的数据点。参数 p、d 和 q 定义了模型的结构:p 是自回归 (AR) 分量的阶数,d 是使数据平稳所需的差分(积分)次数,q 是移动平均 (MA) 分量的阶数。 总之,这些参数允许模型捕获时间序列数据中的趋势、季节性和噪声。
p 参数表示自回归模型中包含的滞后观测值的数量。 例如,如果 p=2,则该模型使用最近的两个时间步(t-1 和 t-2)来预测当前值(t)。 当过去的值直接影响未来的值时,这非常有用,例如在股票价格中,最近的趋势可能会持续存在。 d 参数确定对数据进行差分以消除非平稳性(例如,趋势或变化方差)的次数。 如果 d=1,则模型使用连续数据点(t 和 t-1)之间的差值。 例如,如果月度销售数据具有线性趋势,则差分一次可以稳定均值。 q 参数指定移动平均分量中滞后的预测误差的数量。 q=1 模型使用先前预测中的误差来调整当前预测,这有助于解释数据中的突然冲击或异常,例如由于病毒事件导致的网站流量激增。
这些参数协同工作以平衡历史模式 (AR)、稳定趋势 (I) 和校正随机噪声 (MA)。 例如,ARIMA(1,1,1) 模型可以应用于月度用电量数据。 在这里,p=1 捕获了上个月使用量的势头,d=1 消除了随着时间推移能源使用量的上升趋势,q=1 调整了意外事件(例如热浪)。 开发人员通常使用诸如增广迪基-福勒检验之类的工具来确定 d,并使用自相关 (ACF) 或偏自相关 (PACF) 图来估计 p 和 q。 正确调整这些参数可确保模型适应数据的独特特征,使其成为在金融、供应链或资源规划等领域执行预测任务的灵活工具。