¿Y cómo se trabaja con un modelo ARIMA de medias móviles? [MARTIN, JM]

Mg. José-Manuel Martin Coronado
Chief Economist, EMECEP Consultoría www.emecep-consultoria.com
Docente Principal, Instituto de Econometría de Lima www.institutoeconometria.com
www.martineconometrics.com
Lima, 29 de julio de 2019

1.- Introducción

El tratamiento de la autocorrelación es uno de los aspectos fundamentales de la econometría. Más allá de que tenga que ser un supuesto MCO, la autocorrelación de los errores genera ineficiencia en los parámetros estimados y por lo tanto un mayor error en la variable endógena estimada. Por ello, su tratamiento es prioritario. 

Ahora bien, esto plantea una interrogante: ¿Qué tipo de modelamiento y/o método de estimación es el más recomendable? Muchos dirán automáticamente que debe hacerse un SARIMA, pero antes de ello, debe analizarse la naturaleza de la serie de tiempo y verificar si efectivamente requiere hacerse un modelo con esas propiedades o tal vez uno más simple que cumpla con el cometido. 

En el presente artículo se elaborará un modelo de tratamiento de la autocorrelación, ya sea por el método no iterativo autoregresivo (DAR), el método iterativo autoregresivo (AR) y el método iterativo de medias móviles del error (MA), con constante y sin constante. Aunque el énfasis especial se realizará a las medias móviles como una alternativa especial para este tipo de circunstancias. 

Así, los modelos tendrán la siguiente especificación econométrica:

DAR: Yt = Bo + p*Yt-1 + ut

AR: Yt = α + p*Yt-1 + et, donde α = (1-p)*Bout = p*ut-1 + et

MA: Yt = Bo + et +  θet-1, donde ut = et +  θet-1 

Se asumirá que el coeficiente autoregresivo (p ó θ) es menor a 1 en valor absoluto. Así mismo, se considera que et es ruido blanco, es decir, tiene distribución normal con media cero y varianza uno. 

2.- Fórmulas autoregresivas básicas

Cabe recordar la siguiente fórmula que será útil para entender el concepto de invertibilidad:

Yt - pYt-1 = α + et ,

donde Yt - pLYt = (1 - pL)Yt = α + et ,

por lo tanto, Yt = α/(1 - pL) + et / (1 - pL),

lo cual equivale a Yt = et / (1 - pL) si α = 0

Y la siguiente fórmula para los modelos AR(p) de un orden mayor a 1:


AR(1): Yt = α + p*Yt-1 + et

AR(2): Yt = α + p*Yt-1 + p*Yt-2eα + Σl2pYt-l et, donde l= (1,2)

AR(n): Yt = α + ΣlnpYt-l et, donde l = (1, 2, ... ,n)

3.- Las medias móviles y su relación con la autoregresividad

Al respecto, el modelo MA(1) ó ARIMA(0,0,1) parece un modelo diferente a los autoregresivos (y de hecho lo es), por lo que se detallará un poco más la estructura del mismo. La idea central parte de la forma en que se encuentran distribuidos los errores (ut). Es decir, ut = et +  θet-1 =  et +  θ.L1.et = (1 +  θ.L1)e = (1 +  θ.L)e.

Entonces, el modelo iterativo ARIMA(0,0,1) realmente es el siguiente:

Yt = Bo + (1 + θ.L)et

Yt - Bo = (1 + θ.L)et

(Yt - Bo)/(1 + θ.L) = et

 e= (Yt - Bo)/(1 + θ.L)


Por otra parte, se dice que un proceso AR(1) es equivalente a un proceso MA(∞) y que un proceso MA(1) es equivalente a un proceso AR(). Para ello se debe utilizar la fórmula de la serie geométrica infinita, es decir:


Sean a = Yt - Bo  y r = -θL

Entonces, et = a / (1-r) = Σarn, donde ∈ [0, ∞>

Por lo tanto et = Σ(Yt-Bo)(-θL)n

et = Σ(-θL)n(Yt-Bo)

et = -BoΣ(-θL)n + Σ(-θL)nYt

et = Σ(-θL)nYt, si Bo = 0

et = Σ(-θL)n-1Yt+Yt

et - Σ(-θL)n-1Yt = Yt

 Yt = et - Σ(-θL)n-1Yt

Yt = - Σ(-θL)n-1Yt + et

Yt = - Σ(-θ)n-1Yt-n + et, el cual es claramente un AR(∞)

4.- Modelamiento del error basado en el enfoque de medias móviles

No obstante, desde el punto de vista práctico, se encontrará los siguientes resultados recursivos, si: Yt = Bo + et +  θet-1, entonces:

et = Yt - Bo - θet-1, se asume que Bo no cambia.

et-1 = Yt-1 - Bo - θet-2

et-2 = Yt-2 - Bo - θet-3

et = Yt - Bo - θ(Yt-1 - Bo - θet-2)

et = Yt - Bo - θYt-1 + θBo + θ2et-2

et = Yt - Bo - θYt-1 + θBo + θ2(Yt-2-Bo-θ2et-3)

et = Yt - Bo - θYt-1 + θBo + θ2Yt-2-θ2Bo-θ3et-3)

et = - Bo + θBo θ2Bo Yt - θYt-1 + θ2Yt-2 - θ3et-3

et = (-1 + θ θ2)Bo Yt - θLYt + θ2L2Y- θ3L3et

et = (-1 + θ θ2)Bo + (1 - θL + θ2L2)Y- θ3L3et

et + θ3L3e= (-1 + θ θ2)Bo + (1 - θL+ θ2L2)Yt

(1+ θ3L3)e= (-1 + θ θ2)Bo + (1 - θL + θ2L2)Yt

et = (-1 + θ - θ2)/(1+ θ3L3)Bo + (1 - θL + θ2L2)/(1+ θ3L3)Yt

et =  (1 - θL + θ2L2)/(1+ θ3L3)Yt, si Bo = 0

Como puede observarse, este proceso puede continuarse hasta el infinito.

5.- Modelamiento de la variable endógena basado en el enfoque de medias móviles

A continuación se realizará la misma serie, pero desde el punto de vista de la variable endógena.

Yt = Bo + et + θ(Yt-1 - Bo - θet-2)

Yt = Bo + et + θYt-1θBo - θ2et-2

Yt = (1- θ)*Bo + et + θYt-1 - θ2et-2

et-2 = Yt-2 - Bo - θet-3

Yt = (1-θ)*Bo + et + θYt-1 - θ2(Yt-2 - Bo - θet-3)

Yt = (1-θ)*Bo + et + θYt-1 - θ2Yt-2 - θ2Bo - θ3et-3

Yt = (1-θ -θ2)*Bo + et + θYt-1 - θ2Yt-2 θ3et-3

Yt = (1-θ -θ2)*Bo + et + θLYt - θ2L2Yt θ3L3et

Yt = (1-θ -θ2)*Bo + (θL - θ2L2)Yt  + (1- θ3L3)et

Yt - (θL - θ2L2)Yt = (1-θ -θ2)*Bo + (1- θ3L3)et

(1 - θL + θ2L2)Yt = (1-θ -θ2)*Bo + (1- θ3L3)et

Yt = (1-θ -θ2)/(1 - θL + θ2L2)*Bo + (1- θ3L3)/(1 - θL + θ2L2)et

Yt = (1- θ3L3)/(1 - θL + θ2L2)et, si Bo = 0

Al igual que el desarrollo anterior, este proceso puede continuarse hasta el infinito. No obstante, para simplificar todas las operaciones anteriores, puede obtenerse la siguiente regla básica de invertibilidad también llamada dualidad, a saber: Yt = f(et) ó et = f-1(Yt).

6.- La equivalencia entre diferencias y rezagos, y las medidas móviles de orden 2


Vista la potencia de los modelos de medias móviles, se puede ahora considerar los modelos ARIMA(0,1,1), es decir los modelos MA(1) en diferencias. La ecuación básica es un proceso de media móvil de una diferencial, es decir: Δ Yt = Bo + eθet-1 , la cual puede reescribirse como:

ΔYt = Bo + eθet-1.

Yt - Yt-1 = Bo + eθet-1

Yt  = Bo Yt-1 eθet-1, donde se deduce que p=1 

Yt  = Bo + pYt-1 eθet-1, lo cual tiene semejanza con un ARIMA(1,0,1) con p=1

En otras palabras, ΔY= Yt - Yt-1 = Yt - LY= (1 - L)Yt = (1 - L)Yt , con p=1

Cabe precisar que si no existiera el elemento de medias móviles, la presencia de un p=1, implicaría que la variable endógena sea una Caminata Aleatoria (Random Walk), de la forma ΔYt e(sin drift ó sesgo) ó ΔYt = Bo + et (con drift).

No obstante, si se procede a aplicar una segunda diferencia, la situación puede ser un poco más interesante: 

Δ2Yt = Δ(Yt - Yt-1 )

Δ2Yt = ΔYt - ΔYt-1 

Δ2Yt = (Yt - Yt-1) - (Yt-1 - Yt-2)

Δ2Yt = Yt - Yt-1 - Yt-1 + Yt-2

Δ2Yt = Yt - 2Yt-1 Yt-2 

Δ2Y= Yt - 2LYt + L2Y

Δ2Y= p1Yt + p2LYt + p3L2Yt, donde p1=1, p2=-2 y p3=1

Δ2Y= (p1 + p2+ p3L2)Yt

Δ2Y= p(L2)Yt

Siendo esta fórmula útil para elaborar el modelo ARIMA(0,2,1). No obstante, surge la disyuntiva entre si es lo mismo aplicar diferencias a tres procesos MA(1) ò aplicar un proceso MA(1) a una segunda diferencia. La misma duda también puede surgir en el caso del ARIMA(0,1,1).

El problema radica en que para hacer lo primero es necesario asumir que los coeficientes no cambian en el tiempo y que las medias móviles de mayor orden al deseado son equivalentes a cero. Es decir, siguiendo esta técnica al incorporar en el modelo MA(1) para convertirlo en un ARIMA(0,2,1), se debería

Δ2Yt  Yt - 2Yt-1 Yt-2

Yt  = Bo + eθet

Yt - 2Yt-1 Yt-2 =  (Bo + eθet-1) - 2*(Bo + et-1 θet-2 ) + (Bo + et-2 θet-3)

Yt - 2Yt-1 Yt-2 =  eθet-1 - 2et-1 - 2θet-2  + et-2 θet-3

Yt  =  2Yt-1 - Yt-2  + eθet-1 - 2et-1 - 2θet-2  + et-2 θet-3

Yt  =  2Yt-1 - Yt-2  + e+ (θ - 2)et-1 + (1 - 2θ)et-2  θet-3

Yt  =  2Yt-1 - Yt-2  + e+ (θ - 2)et-1, eliminando et-2 y et-3

Empero, esta derivación es demasiado forzada, sobre todo si se incorporan más términos de medias móviles. Por lo cual se utilizará la definición y se desarrollará la misma es decir.

Δ2Y= Bo + et + θet-1

Yt - 2Yt-1 + Yt-2 = Bo + et + θet-1

Yt = 2Yt-1 - Yt-2 + Bo + et + θet-1

Yt =  ΔYt-1 - Yt-1 + Bo + et + θet-1

Por lo tanto, la extensión a dos medias móviles sería:

Δ2Y = Bo et + θet-1 + θet-2

Y = 2Yt-1 - Yt-2 + Bo et + θet-1 + θet-2

7.- Aplicación econométrica de las medias móviles

A continuación se estiman los modelos econométricos correspondientes a las medias móviles desarrolladas para la variable VAB Construcción desestacionalizada. 


Esta tabla permite deducir los resultados de los parámetros estimados para cada modelo, es decir: 

ARIMA(0,0,1): Yt = 123.11 + et + 0.74et-1 
ARIMA(0,1,1): ΔYt = 0.29 + et - 0.57et-1 → Yt = Yt-1 +0.29 + et - 0.57et-1
ARIMA(0,0,2): Yt = 123.07 + et + 0.87et-1 + 0.21et-2 
ARIMA(0,1,2): ΔYt = 0.29+ et - 0.55et-1 - 0.02et-2 → Yt = Yt-1 +0.29 + et - 0.55et-1 - 0.02et-2
ARIMA(0,2,1): Δ2Yt = - 0.009+ et - 0.99et-1 → Yt = 2Yt-1 Yt-2 - 0.009 + et - 0.99et-1   
ARIMA(0,2,2): Δ2Yt = -0.008+ et - 1.6et-1 - 0.62et-2  → Yt = 2Yt-1 - Yt-1 -0.008 + et - 1.6et-1 - 0.62et-2

A simple vista, no es posible saber qué modelo podría ser mejor que otro. Para ello, se observará la bondad de ajuste a partir de los resultados de la variable estimada según cada modelo. 

Al respecto, claramente los modelos en niveles (ARIMA001 y ARIMA002) no logran captar la tendencia inicial ni los quiebres en la variable objeto de estudio.  De otro lado, el modelo en segundas diferencias y con una media móvil representa un simple comportamiento estimado espectral rezagado.

Por el contrario, los modelos en diferencias, salvo el ARIMA(0,2,1), presentan una menor varianza y una mejor bondad de ajuste pues la estimación presenta un comportamiento muy cercano aunque relativamente suavizado de la variable.

En articular, los modelos ARIMA011 y ARIMA012 presentan menor varianza del modelo que en el ARIMA022, aunque visualmente la diferencia no sería significativa. Si se observan los errores, se puede confirmar que estos modelos tienen un menor varianza del error. Un consideración por el detalle sugiere que el modelo ARIMA012 presenta la mínima varianza, es decir, sería el modelo más eficiente para este caso concreto. 


Para concluir, si se hace una prueba de raíces unitarias, se podrá observar que los errores de ambas variables son estacionarios



Por lo tanto, al ser matemáticamente casi equivalente, la elección entre ambas deberá seguir un criterio de adicional: el correlograma. 


Y este caso, el correlograma muestra que efectivamente la variable en cuestión debería tener dos rezagos para que trate adecuadamente el problema de la autocorrelación por su consistencia con los parámetros obtenidos. Por lo tanto, el modelo final elegido deberá ser el ARIMA(0,1,2). 

Comments

Popular posts from this blog

Endogeneidad y Exogeneidad en los Modelos Econométricos [MARTIN, JM.]

"De los modelos ARDL - Primera Parte" (Traducción)

¿Qué es un Proceso Generador de Datos ARIMA(1,1)? [J.M. MARTIN]