¿Y cómo se trabaja con un modelo ARIMA de medias móviles? [MARTIN, JM]

Mg. José-Manuel Martin Coronado
Chief Economist, EMECEP Consultoría www.emecep-consultoria.com
Docente Principal, Instituto de Econometría de Lima www.institutoeconometria.com
www.martineconometrics.com
Lima, 29 de julio de 2019

1.- Introducción

El tratamiento de la autocorrelación es uno de los aspectos fundamentales de la econometría. Más allá de que tenga que ser un supuesto MCO, la autocorrelación de los errores genera ineficiencia en los parámetros estimados y por lo tanto un mayor error en la variable endógena estimada. Por ello, su tratamiento es prioritario.

Ahora bien, esto plantea una interrogante: ¿Qué tipo de modelamiento y/o método de estimación es el más recomendable? Muchos dirán automáticamente que debe hacerse un SARIMA, pero antes de ello, debe analizarse la naturaleza de la serie de tiempo y verificar si efectivamente requiere hacerse un modelo con esas propiedades o tal vez uno más simple que cumpla con el cometido.

En el presente artículo se elaborará un modelo de tratamiento de la autocorrelación, ya sea por el método no iterativo autoregresivo (DAR), el método iterativo autoregresivo (AR) y el método iterativo de medias móviles del error (MA), con constante y sin constante. Aunque el énfasis especial se realizará a las medias móviles como una alternativa especial para este tipo de circunstancias.

Así, los modelos tendrán la siguiente especificación econométrica:

DAR: Y_t = Bo + p*Y_t-1 + u_t

AR: Y_t = α + p*Y_t-1 + e_t, donde α = (1-p)*Bo y u_t = p*u_t-1 + e_t

MA: Y_t = Bo + e_t + θe_t-1, donde u_t = e_t + θe_t-1

Se asumirá que el coeficiente autoregresivo (p ó θ) es menor a 1 en valor absoluto. Así mismo, se considera que e_t es ruido blanco, es decir, tiene distribución normal con media cero y varianza uno.

2.- Fórmulas autoregresivas básicas

Cabe recordar la siguiente fórmula que será útil para entender el concepto de invertibilidad:

Y_t - pY_t-1 = α + e_t ,

donde Y_t - pLY_t = (1 - pL)Y_t = α + e_t ,

por lo tanto, Y_t = α/(1 - pL) + e_t / (1 - pL),

lo cual equivale a Y_t = e_t / (1 - pL) si α = 0

Y la siguiente fórmula para los modelos AR(p) de un orden mayor a 1:

AR(1): Y_t = α + p*Y_t-1 + e_t

AR(2): Y_t = α + p*Y_t-1 + p*Y_t-2+ e_t= α + Σ_l²pY_t-l+ e_t, donde l= (1,2)

_{AR(n): Y_t = α + Σ_lⁿpY_t-l+ e_t}, donde l = (1, 2, ... ,n)

3.- Las medias móviles y su relación con la autoregresividad

Al respecto, el modelo MA(1) ó ARIMA(0,0,1) parece un modelo diferente a los autoregresivos (y de hecho lo es), por lo que se detallará un poco más la estructura del mismo. La idea central parte de la forma en que se encuentran distribuidos los errores (u_t). Es decir, u_t = e_t + θe_t-1= e_t + θ.L¹.e_t= (1 + θ.L¹)e_t = (1 + θ.L)e_t.

Entonces, el modelo iterativo ARIMA(0,0,1) realmente es el siguiente:

Y_t = Bo + (1 + θ.L)e_t

Y_t - Bo = (1 + θ.L)e_t

(Y_t - Bo)/(1 + θ.L) = e_t

e_t= (Y_t - Bo)/(1 + θ.L)

Por otra parte, se dice que un proceso AR(1) es equivalente a un proceso MA(∞) y que un proceso MA(1) es equivalente a un proceso AR(∞). Para ello se debe utilizar la fórmula de la serie geométrica infinita, es decir:

Sean a = Y_t - Bo y r = -θL

Entonces, e_t = a / (1-r) = Σarⁿ, donde n ∈ [0, ∞>

Por lo tanto e_t = Σ(Y_t-Bo)(-θL)ⁿ

e_t = Σ(-θL)ⁿ(Y_t-Bo)

e_t = -BoΣ(-θL)ⁿ + Σ(-θL)ⁿY_t

e_t = Σ(-θL)ⁿY_t, si Bo = 0

e_t = Σ(-θL)^n-1Y_t+Y_t

e_t - Σ(-θL)^n-1Y_t = Y_t

Y_t = e_t - Σ(-θL)^n-1Y_t

Y_t = - Σ(-θL)^n-1Y_t + e_t

Y_t = - Σ(-θ)^n-1Y_t-n + e_t, el cual es claramente un AR(∞)

4.- Modelamiento del error basado en el enfoque de medias móviles

No obstante, desde el punto de vista práctico, se encontrará los siguientes resultados recursivos, si: Y_t = Bo + e_t + θe_t-1, entonces:

e_t = Y_t - Bo - θe_t-1, se asume que Bo no cambia.

e_t-1 = Y_t-1 - Bo - θe_t-2
_{e_t-2 = Y_t-2 - Bo - θe_t-3}

e_t = Y_t - Bo - θ(Y_t-1 - Bo - θe_t-2)

e_t = Y_t - Bo - θY_t-1 + θBo + θ²e_t-2

e_t = Y_t - Bo - θY_t-1 + θBo + θ²(Y_t-2-Bo-θ²e_t-3)

e_t = Y_t - Bo - θY_t-1 + θBo + θ²Y_t-2-θ²Bo-θ³e_t-3)

e_t = - Bo + θBo - θ²Bo + Y_t - θY_t-1 + θ²Y_t-2- θ³e_t-3

e_t = (-1 + θ - θ²)Bo + Y_t - θLY_t + θ²L²Y_t- θ³L³e_t

e_t = (-1 + θ - θ²)Bo + (1 - θL + θ²L²)Y_t- θ³L³e_t

e_t + θ³L³e_t= (-1 + θ - θ²)Bo + (1 - θL+ θ²L²)Y_t

(1+ θ³L³)e_t= (-1 + θ - θ²)Bo + (1 - θL + θ²L²)Y_t

e_t = (-1 + θ - θ²)/(1+ θ³L³)Bo + (1 - θL + θ²L²)/(1+ θ³L³)Y_t

e_t = (1 - θL + θ²L²)/(1+ θ³L³)Y_t, si Bo = 0

Como puede observarse, este proceso puede continuarse hasta el infinito.

5.- Modelamiento de la variable endógena basado en el enfoque de medias móviles

A continuación se realizará la misma serie, pero desde el punto de vista de la variable endógena.

Y_t = Bo + e_t + θ(Y_t-1 - Bo - θe_t-2)

Y_t = Bo + e_t + θY_t-1 - θBo - θ²e_t-2

Y_t = (1- θ)*Bo + e_t + θY_t-1 - θ²e_t-2

e_t-2 = Y_t-2 - Bo - θe_t-3

Y_t = (1-θ)*Bo + e_t + θY_t-1 - θ²(Y_t-2 - Bo - θe_t-3)

Y_t = (1-θ)*Bo + e_t + θY_t-1 - θ²Y_t-2 - θ²Bo - θ³e_t-3

Y_t = (1-θ -θ²)*Bo + e_t + θY_t-1 - θ²Y_t-2 - θ³e_t-3

Y_t = (1-θ -θ²)*Bo + e_t + θLY_t - θ²L²Y_t - θ³L³e_t

Y_t = (1-θ -θ²)*Bo + (θL - θ²L²)Y_t + (1- θ³L³)e_t
Y_t - (θL - θ²L²)Y_t = (1-θ -θ²)*Bo + (1- θ³L³)e_t
(1 - θL + θ²L²)Y_t = (1-θ -θ²)*Bo + (1- θ³L³)e_t
Y_t = (1-θ -θ²)/(1 - θL + θ²L²)*Bo + (1- θ³L³)/(1 - θL + θ²L²)e_t

Y_t = (1- θ³L³)/(1 - θL + θ²L²)e_t, si Bo = 0

Al igual que el desarrollo anterior, este proceso puede continuarse hasta el infinito. No obstante, para simplificar todas las operaciones anteriores, puede obtenerse la siguiente regla básica de invertibilidad también llamada dualidad, a saber: Y_t = f(e_t) ó e_t = f^-1(Y_t).

6.- La equivalencia entre diferencias y rezagos, y las medidas móviles de orden 2

Vista la potencia de los modelos de medias móviles, se puede ahora considerar los modelos ARIMA(0,1,1), es decir los modelos MA(1) en diferencias. La ecuación básica es un proceso de media móvil de una diferencial, es decir: Δ Yt = Bo + e_t+ θe_t-1, la cual puede reescribirse como:

ΔY_t = Bo + e_t+ θe_t-1.

Y_t - Y_t-1 = Bo + e_t+ θe_t-1

Y_t = Bo + Y_t-1+ e_t+ θe_t-1, donde se deduce que p=1

Y_t = Bo + pY_t-1+ e_t+ θe_t-1, lo cual tiene semejanza con un ARIMA(1,0,1) con p=1

En otras palabras, ΔY_t= Y_t - Y_t-1= Y_t - LY_t= (1 - L)Y_t = (1 - L)Y_t , con p=1

Cabe precisar que si no existiera el elemento de medias móviles, la presencia de un p=1, implicaría que la variable endógena sea una Caminata Aleatoria (Random Walk), de la forma ΔY_t = e_t(sin drift ó sesgo) ó ΔY_t = Bo + e_t (con drift).

No obstante, si se procede a aplicar una segunda diferencia, la situación puede ser un poco más interesante:

Δ²Y_t = Δ(Y_t - Y_t-1 )

Δ²Y_t = ΔY_t - ΔY_t-1

Δ²Y_t = (Y_t - Y_t-1) - (Y_t-1 - Y_t-2)

Δ²Y_t = Y_t - Y_t-1 - Y_t-1 + Y_t-2
Δ²Y_t = Y_t - 2Y_t-1 + Y_t-2
Δ²Y_t= = Y_t - 2LY_t + L²Y_t

Δ²Y_t= p₁Y_t + p₂LY_t + p₃L²Y_t, donde p₁=1, p₂=-2 y p₃=1

Δ²Y_t= (p₁ + p₂L + p₃L²)Y_t
Δ²Y_t= p(L²)Y_t

Siendo esta fórmula útil para elaborar el modelo ARIMA(0,2,1). No obstante, surge la disyuntiva entre si es lo mismo aplicar diferencias a tres procesos MA(1) ò aplicar un proceso MA(1) a una segunda diferencia. La misma duda también puede surgir en el caso del ARIMA(0,1,1).

El problema radica en que para hacer lo primero es necesario asumir que los coeficientes no cambian en el tiempo y que las medias móviles de mayor orden al deseado son equivalentes a cero. Es decir, siguiendo esta técnica al incorporar en el modelo MA(1) para convertirlo en un ARIMA(0,2,1), se debería

Δ²Y_t= Y_t - 2Y_t-1 + Y_t-2

Y_t= Bo + e_t+ θe_t

Y_t - 2Y_t-1 + Y_t-2 = (Bo + e_t+ θe_t-1) - 2*(Bo + e_t-1+ θe_t-2) + (Bo + e_t-2+ θe_t-3)

Y_t - 2Y_t-1 + Y_t-2 = e_t+ θe_t-1 - 2e_t-1- 2θe_t-2 + e_t-2+ θe_t-3

Y_t = 2Y_t-1 - Y_t-2 + e_t+ θe_t-1 - 2e_t-1- 2θe_t-2 + e_t-2+ θe_t-3

Y_t = 2Y_t-1 - Y_t-2 + e_t+ (θ - 2)e_t-1 + (1 - 2θ)e_t-2 + θe_t-3
Y_t = 2Y_t-1 - Y_t-2 + e_t+ (θ - 2)e_t-1, eliminando e_t-2 y e_t-3

Empero, esta derivación es demasiado forzada, sobre todo si se incorporan más términos de medias móviles. Por lo cual se utilizará la definición y se desarrollará la misma es decir.

Δ²Y_t= Bo + e_t + θe_t-1

Y_t - 2Y_t-1 + Y_t-2 = Bo + e_t + θe_t-1

Y_t = 2Y_t-1 - Y_t-2 + Bo + e_t + θe_t-1

Y_t = ΔY_t-1 - Y_t-1 + Bo + e_t + θe_t-1

Por lo tanto, la extensión a dos medias móviles sería:

Δ²Y_t = Bo + e_t + θe_t-1+ θe_t-2

Y_t = 2Y_t-1 - Y_t-2+ Bo + e_t + θe_t-1+ θe_t-2

7.- Aplicación econométrica de las medias móviles

A continuación se estiman los modelos econométricos correspondientes a las medias móviles desarrolladas para la variable VAB Construcción desestacionalizada.

Esta tabla permite deducir los resultados de los parámetros estimados para cada modelo, es decir:

ARIMA(0,0,1): Y_t = 123.11 + e_t + 0.74e_t-1

ARIMA(0,1,1): ΔY_t = 0.29 + e_t - 0.57e_t-1→ Y_t = Y_t-1+0.29 + e_t - 0.57e_t-1

ARIMA(0,0,2): Y_t = 123.07 + e_t + 0.87e_t-1+ 0.21e_t-2

ARIMA(0,1,2): ΔY_t = 0.29+ e_t - 0.55e_t-1- 0.02e_t-2→ Y_t = Y_t-1+0.29 + e_t - 0.55e_t-1- 0.02e_t-2

ARIMA(0,2,1): Δ²Y_t = - 0.009+ e_t - 0.99e_t-1→ Y_t = 2Y_t-1- Y_t-2- 0.009 + e_t - 0.99e_t-1

ARIMA(0,2,2): Δ²Y_t = -0.008+ e_t - 1.6e_{t-1 -} 0.62e_t-2→ Y_t = 2Y_t-1- Y_t-1-0.008 + e_t - 1.6e_t-1- 0.62e_t-2

A simple vista, no es posible saber qué modelo podría ser mejor que otro. Para ello, se observará la bondad de ajuste a partir de los resultados de la variable estimada según cada modelo.

Al respecto, claramente los modelos en niveles (ARIMA001 y ARIMA002) no logran captar la tendencia inicial ni los quiebres en la variable objeto de estudio. De otro lado, el modelo en segundas diferencias y con una media móvil representa un simple comportamiento estimado espectral rezagado.

Por el contrario, los modelos en diferencias, salvo el ARIMA(0,2,1), presentan una menor varianza y una mejor bondad de ajuste pues la estimación presenta un comportamiento muy cercano aunque relativamente suavizado de la variable.

En articular, los modelos ARIMA011 y ARIMA012 presentan menor varianza del modelo que en el ARIMA022, aunque visualmente la diferencia no sería significativa. Si se observan los errores, se puede confirmar que estos modelos tienen un menor varianza del error. Un consideración por el detalle sugiere que el modelo ARIMA012 presenta la mínima varianza, es decir, sería el modelo más eficiente para este caso concreto.

Para concluir, si se hace una prueba de raíces unitarias, se podrá observar que los errores de ambas variables son estacionarios

Por lo tanto, al ser matemáticamente casi equivalente, la elección entre ambas deberá seguir un criterio de adicional: el correlograma.

Y este caso, el correlograma muestra que efectivamente la variable en cuestión debería tener dos rezagos para que trate adecuadamente el problema de la autocorrelación por su consistencia con los parámetros obtenidos. Por lo tanto, el modelo final elegido deberá ser el ARIMA(0,1,2).

Search This Blog

Martin Econometrics: Econometría y Aplicaciones

¿Y cómo se trabaja con un modelo ARIMA de medias móviles? [MARTIN, JM]

Comments

Post a Comment

Popular posts from this blog

Endogeneidad y Exogeneidad en los Modelos Econométricos [MARTIN, JM.]

"De los modelos ARDL - Primera Parte" (Traducción)

La multicausalidad y la insuficiencia de la causalidad lineal: Aspectos preliminares