Martin, J.M. (2022b). ¿Puede predecirse la multicolinealidad problemática? WP N° 0503-2022-IEL/MULTI

La multicolinealidad siempre ha sido un problema, pero, como es obvio, no es un problema binario sino de grado. Un gran predictor de la multicolinealidad es la correlación que pudieran tener las variables explicativas. Sin embargo, existe un atenuante: el ruido que pudiera tener esa relación bivariable. Las relaciones económicas no son exactas, tanto las principales como las accesorias. El nivel de ruido puede afectar la predictibilidad de la multicolinealidad problemática, o incluso crear falsos negativos. 

A partir de un ejercicio de simulación se realizó el siguiente modelo:

(1)     x1,t = a0 + a1t + a2 x1,t-1 + a3ex1,t 

(2)     x2,t = b0 + b1x1,t+ b2ex2,t

(3)     yt = c0 + c1x1,t + c2 x2,t + c3ey,t

Puede observarse claramente la relación entre las variables explicativas en este caso (x2 = f(x1)), y ello claramente tendrá un impacto en la variable endógena. A través de la técnica de funciones compuestas o anidadas se puede simplificar el modelos y hacerlo sólo dependiente de x1 sin embargo, eso no permite visualizar el verdadero impacto de la multicolinealidad en el modelo. 

Si b1=0, entonces no existe correlación entre las variables del modelo, mientras que si b1=1 existirá una cuasi identificación entre x1 y x2. No obstante, la existencia de un ruido en esta relación puede generar distorsiones a este razonamiento. Dependiendo de los mayores o menores niveles de ruido, la multicolinealidad teórica será exacta, pero en la práctica no lo será. Ello se traducirá en menores niveles de inflación de varianza a los esperados, generándose falsos negativos de multicolinealidad.

Aún más, dependiendo de los valores que puedan tener los coeficientes del modelo propuesto, los niveles máximos de correlación lineal pueden ser muy altos antes de observar un VIF significativo. En adición a ello, podrá observarse como la significancia de la variable incumbente (x1) tendrá una caída con tasa creciente, incluso pudiendo generar errores de signo, según los parámetros elegidos. A continuación se presenta un resultado de simulación con los valores indicados. 





Comments

Popular posts from this blog

¿Qué es un Proceso Generador de Datos ARIMA(1,1)? [J.M. MARTIN]

Martin (2021) ¿Qué es el círculo vicioso de la validación econométrica?

¿El manejo de Base de Datos es Econometría? [MARTIN C, J.M.]