Martin (2021) Estacionariedad y Cointegración: ¿Un problema asintótico o de generalización?

José-Manuel Martin Coronado
Instituto de Econometría de Lima
El problema de la cointegración nació por la sospecha de la existencia de regresiones espurias en los casos de series no estacionarias (Ej. I(1)), para lo cual se implementaron diversas técnicas: Engle-Granger, Johansen-Juselius, entre otros. En particular Engle y Granger indican que el mayor orden de integración tiene un efecto dominante en la relación entre dos variables. 

Si bien gran parte de las series económicas no son estacionarias, otro grupo sí lo son. O mejor dicho, una forma más interesante de éstas lo es (Ej. Variación porcentual). En tales casos, lo usual es trabajar con modelos no estructurales dinámicos de tipo ARIMA, ARDL, VAR, entre otros. ¿Pero, es posible sustentar la existencia de cointegración a través de un modelo estructural simple, en el caso de MCO, que represente relaciones de largo plazo?

La respuesta usual es NO, dado un paper de Pesaran et al. (1999), en el cual afirma que en tal situación, o incluso en el caso que sólo una de las variables no sea estacionaria, el modelo ARDL puede utilizarse. Y en caso desee construirse un modelo estructural de largo plazo, se tendría que despejar y reparametrizar los coeficientes de corto plazo hacia unos de largo plazo, desde un enfoque de funciones de transferencia.

Si bien la definición original de cointegración era justamente para series de tiempo integradas; siguiendo una definición estricta, integración sólo ocurre cuando I ≥ 1, por lo que la cointegración sólo ocurriría en este escenario. Sin embargo, siguiendo a Granger y Newbold (1974) y Lutkepohl y Kratzig (2004), puede dejarse de lado esta formalidad, ya que si el resultado final es el mismo, es decir que el error de la ecuación estructural sea estacionario, entonces eso implica que también puede hablarse de una cointegración entre dos variables I(0). 

De otro lado, según reiteran Granger y Newbold (1974), la principal causa es la presencia de autocorrelación (y no necesariamente no estacionariedad) en las series, y sobre todo, en los residuos. Al respecto, los autores reclaman que esta advertencia no ha sido lo suficientemente clara, y que aún se siguen presentando investigaciones con elevada autocorrelación. Obviamente esta problemática altera la estimación de la varianza. 

El principal problema no es tanto la estimación de los coeficientes, sino la posibilidad de cometer errores de de tipo I, falsos positivos, a través de una muestra finita de datos que genera desconfianza en los estadísticos t-student y F-Fisher. Esta idea ha sido refrendada por Hansen & Phillips (1990).

No obstante, tal como precisa Pesaran y Shin (1999), el uso de una metodología alternativa para estimar las varianzas de los estimadores, por ejemplo, el método delta, haría irrelevante el potencial incumplimiento de la teoría asintótica. 

La pregunta lógica es: ¿Pueden ser iguales las varianzas de una variable estacionaria de otra no estacionaria? Una prueba rápida (n=100) sugiere que sí. Para probar lo anterior se generaron dos series, una estacionaria y otra no. Ambas tienen la misma distribución, es decir, son normales, con la misma media μ y la misma varianza σ.

En otras palabras, no existe inconveniente en que exista igualdad estadística entre dos variables una estacionaria y otra no. Por lo tanto, la no estacionariedad no necesariamente implica una distorsión de la varianza. 

Gráfico N° 1


Gráfico N° 2


Cabe precisar que en esta muestra, puede observarse que la variable no estacionaria no es normal, mientras que la estacionaria sí. No obstante, la anormalidad puede corregirse a través de cambios estructurales a fin de contrarrestar la dominancia de una distribución uniforme. 

Por otro lado, a través de una breve simulación de Montecarlo (s=1000), con la cual se puede calcular el promedio de la varianza, se puede observar que las varianzas sí pueden ser diferentes en promedio. 

Gráfico N° 3

Por lo tanto, debido a la necesidad de generalizar la estimación del promedio de la varianza de ambas variables, a pesar de ser normales, existen elementos que sugieren el rechazo de la hipótesis nula de que las varianzas puedan ser iguales. Estos resultados permiten concluir que efectivamente es posible que haya distorsiones de la varianza que a su vez generen un impacto en las pruebas, en particular si las varianzas se reducen.

Empero, en el fondo el principal problema es que es necesario observar la relación entre las variables, no sólo a nivel de series de tiempo sino a partir del diagrama de dispersión entre ambas, pero además acompañado de un razonamiento económico al respecto, así como un nivel de prudencia al momento de realizar afirmaciones de existencia de relaciones ó, dicho en términos estadísticos, rechazos de hipótesis nula. 

La esquizofrenia de la espuriedad es muy difícil de descartar, pero lo cierto es que es imprescindible que los econometristas de series de tiempo no traten de hacer trampa en el encuentro de relaciones econométricas de corto ó de largo plazo. En efecto, una cosa es la existencia de una relación restringida al período de estudio y otra es la existencia de una relación de largo plazo. Lo segundo representa una generalización más agresiva. Incluso, si pudiera ser generalizable, si no cuenta con una historia causal, sólo sería estadísticamente válido, más no económicamente válido. 

En el caso bivariable, conviene verificar si gráficamente realmente se visualiza una relación entre las variables. Y en el caso multivariable, no debe dejarse de lado el análisis bivariable, ya que al combinar linealmente todas las variables, los coeficientes probablemente caerán, así como su porción en la composición de las varianzas, generándose situaciones de significancia que no existían antes. Esto sin tomar en cuenta el problema de la multicolinealidad.


Referencias

Engle R y C. Granger (1987). Co-Integration and Error Correction: Representation, Estimation, and Testing. Econometrica. Vol. 55, No. 2 (Mar., 1987), pp. 251-276 (26 pages). Obtenido de: https://doi.org/10.2307/1913236

Granger C y P. Newbold (1973). Spurious regressions in econometrics. Journal of Econometrics 2 (1974) pages 111-120. North-Holland Publishing Company. Obtenido de: https://doi.org/10.1016/0304-4076(74)90034-7

Hansen, B y Phillips P. (1988). Estimation and Inference in Models of Cointegration: A Simulation Study. Cowloes Foundation Paper 747. PAges 225-248. Obtenido de: https://cowles.yale.edu/sites/default/files/files/pub/d08/d0881.pdf 

Hansen, B y Phillips P. (1990). Statistical Inference in Instrumental Variables Regression with I(1) Processes, The Review of Economic Studies, Volume 57, Issue 1, January 1990, Pages 99–125. Obtenido de: https://doi.org/10.2307/2297545

Lutkepohl, Helmut y Markus Kratzig (2004). Applied Times Series Econometrics. Cambridge University Press. Obtenido de: ISBN-13: 978-0521547871

Pesaran y Shin (1999). An Autoregressive Distributed-Lag Modelling Approach to Cointegration Analysis. Cambridge University Press, Obtenido de: https://doi.org/10.1017/CCOL521633230.011

Phillips P. C. B.  (1986) Understanding spurious regressions in econometrics. Journal of Econometrics
Volume 33, Issue 3, December 1986, Pages 311-340. Obtenido de: https://doi.org/10.1016/0304-4076(86)90001-1 

Comments

Popular posts from this blog

Endogeneidad y Exogeneidad en los Modelos Econométricos [MARTIN, JM.]

"De los modelos ARDL - Primera Parte" (Traducción)

¿Qué es un Proceso Generador de Datos ARIMA(1,1)? [J.M. MARTIN]