¿Qué es un Proceso Generador de Datos ARIMA(1,1)? [J.M. MARTIN]

José-Manuel Martin Coronado
Instituto de Econometría de Lima
www.institutoeconometria.com

Existe un concepto muy utilizado en el análisis de series de tiempo y es el de Proceso Generador de Datos (PGD ó DGP en inglés). Si bien el nombre parece complejo, en principio es bastante sencillo: Es una fórmula matemática que representa una secuencia de datos. Y por definición, esa fórmula de una secuencia permite crear datos en serie, es decir, sucesivos en función a algún indicador, en este caso, el tiempo.

No obstante, muchos estudiosos de la materia buscan confundir y asustar al lector novel en estos temas, afirmando que es algo muy complejo. Si bien algunas fórmulas de series de tiempo puede ser excesivamente complejas, esto a veces es arbitrario y no necesariamente representativo, particularmente si se tiene en cuenta que los modelos Naïve puede llegar a ser tan precisos como los modelos con PGD de alta complejidad. 

Por ejemplo, un proceso generador de datos muy simple sería el siguiente: Yt = Bo + B1*Yt-1. Esto quiere decir que el dato actual (Yt) depende del dato anterior (Yt-1) ponderado por un coeficiente (B1) y ajustado por otro (B0) en forma de suma (aunque también a Bo se le conoce el promedio de Yt).  Así, si Y(t=0) = Y(0) = Yo = 100 y B0 = 20 y B1 = 0.9, entonces, Y(t=1) = Y(1) = 20+0.9*100 = 110. En efecto, la fórmula matemática nos permitió crear el dato del período siguiente sin necesidad de obtenerlo de la realidad. (¿Qué hubiera pasado si Bo=10?) En la práctica, teniendo los coeficientes, sólo es necesario tener el dato inicial (Y0).

En el mundo de los llamados "modelos de series de tiempo" se hacer referencia a los modelos ARIMA, que no son otra cosa que modelos autoregresivos con medias móviles. El modelo más sencillo y balanceado es el ARIMA(1,0,1), es decir un modelo que contiene un elemento autoregresivo y un elemento de media móvil. El componente autoregresivo suele derivarse de la presencia de autocorrelación de los errores. Mientras que el elemento de media móvil se deduce de la existencia de uno o más términos aleatorios adicionales a lo usual.

Por lo tanto, la ecuación ó mejor dicho el PGD estaría compuesto por dos ecuaciones:
Ecuación de Regresión: Yt = Bo + u
Proceso ARMA complementario a la Ecuación de Regresión: ut = B1*ut-1et + B2*et-1

Empero, estas ecuaciones se pueden juntar en una única ecuación (nótese el cambio de ut-1 ór Yt-1), a saber:
Yt = B0 + B1* Yt-1 + et + B2*et-1

Este proceso se ve más complejo y es recomendable estimarlo por métodos diferentes al MCO, por ejemplo el de Máximo Verosimilitud, sobre todo por el hecho que los coeficientes a estimar no sólo están en la parte determinística de la ecuación sino en la estocástica. Ahora bien, en este modelo el término aleatorio es "et-p", el cual se suele asumir que es normal, con todos sus elementos independientes e identicamente distribuidos (I.I,D.)

Nótese que Bo podría llegar a ser cero, por lo que es importante verificar dicha estimación. En la práctica, dependiendo de los coeficientes, el modelo "regresará" a la media de largo plazo, es decir, este valor será un punto de convergencia. La media de largo plazo se diferencia de la media (Bo) dado que se obtiene de la siguiente fórmula: B0 / (1-B1).

Una propiedad interesante de este modelo es que la varianza del lado derecho de la ecuación puede determinarse a través de una fórmula muy sencilla a saber: Var(Yt-Bo) = Var(et)*[(1-B1)/(1-B2)]2 donde  Var(et) = Σe2t. O también se puede obtener una fórmula en caso que la variable Yt sea estacionaria en varianzas, entonces, Var(Yt)= Var(et)*(1+2*B1*B2)/(1-B22).

Básicamente, la idea de los procesos generadores de datos es ofrecer bastante información sobre las características de la serie de tiempo sujeta a modelamiento, y no sólo de los valores que ésta tendrá en el futuro, sino de la media de largo plazo, de su varianza o la varianza de los errores. No obstante, algunas dificultades típicas serán la invertibilidad (o no) de los componentes del proceso ARMA ó bien la estacionariedad o no de la serie que se desea modelar ó bien la fórmula de las funciones de autovarianzas.

Comments

Popular posts from this blog

Endogeneidad y Exogeneidad en los Modelos Econométricos [MARTIN, JM.]

Impactos no lineales de la multicolinealidad sobre la eficiencia de los estimadores [MARTIN C., J.M.]

¿El manejo de Base de Datos es Econometría? [MARTIN C, J.M.]