¿Cómo especificar un modelo econométrico? [MARTIN, J.M., 2022]

¿Cómo especificar un modelo econométrico?

Mg. José-Manuel Martin Coronado
Senior Economist at EMECEP Consultorías Económicas
Professor at Instituto Econometría de Lima

Lima, 21 abril 2022

Cuando nos piden hacer un modelo econométrico, lo primero que uno piensa es en las variables. Entonces uno piensa en una variable Y, X1, X2, X3, y así, por ejemplo, tres variables. Pero generalmente se piensa en la primera, como la variable Y. A veces ocurre que, sólo se piensa en la variable Y como tal y no se piensa en las demás. Así, las demás vienen en el camino.  En realidad hay que tener mucho cuidado porque supuestamente un modelo debe tener muchas variables no solamente 1 ni tal vez 2 sino 3 o más. Tampoco tantas 20 ó 30 sino un número normal 8 ó 7, más o menos. 

En primer lugar, a veces se piensa solamente la Y, y con esa, se hace el título. Por ejemplo, con el título "tipo de Cambio"  entonces la tesis es sobre tipo de cambio en el Perú. Pero ahí no se está haciendo una relación econométrica, no se está especificando un modelo, simplemente se está hablando de un tema. Cuando se habla de especificar un modelo, entonces se refiere a la existencia de relaciones causales.  En este caso, en el sentido de las variables X1, X2, X3 hacia Y. 

Y <-- X1, X2, X3                                                        (1)

Por lo tanto, siempre debe pensarse en esa forma ó sentido de la relación. En otras palabras, la especificación es relacional, no es monotemática. 

En segundo lugar, una vez que el investigador tiene sus variables (asumiendo que tienen varias), directamente se lanzan al modelo.  Y a veces se ha visto algo así:

Y  =  X1 + X2 + X3                                                        (2)

Obviamente ello es incorrecto. ¿Por qué estaría mal si están las tres variables en forma de suma y a la izquierda está la Y? En un modelo econométrico, lo que se va a estimar son los parámetros, los coeficientes, y acá no hay coeficientes. Y si no hay coeficientes, no hay nada que estimar, no es un modelo econométrico. 

¿Qué debe hacerse? Poner los coeficientes. No deben olvidarse de los coeficientes. Y siempre se pone, por costumbre, un intercepto, o coeficiente "independiente" ó "autónomo. 

Y  =  B1*X1 + B2*X2 + B3*X3+B0                                    (3)

Entonces, este modelo debe ser relacional y con coeficientes.

En tercer lugar, a veces no se nota, pero cuando se construyen estas ecuaciones, que parecen correctas, se olvida la existencia de relaciones entre las variables explicativas elegidas. Entonces, podría ser que exista relación entre éstas, en cualquiera de los órdenes o sentidos posibles. Por ejemplo: 

X1 = f(X2); X1=f(X3), X2 = f(X3), X = f(X1,X2, X3)                    (4)

Podrían ocurrir los mencionados problemas que es necesario evaluar. ¿Qué quiere decir? Si son problemas muy fuertes (problema de grado), se puede tener un problema de multicolinealidad significativa.  Se agrega el término significativa porque siempre existirá algo de relación entre las variables explicativas, pero lo importante es que ésta sea significativa. Entonces, la pregunta es "¿Cuán fuerte es la relación?" Es una relación totalmente exacta o es cercana pero no es fuerte como para destruir el modelo. 

En cuarto lugar, la existencia de relaciones fuertes entre las variables explicativas puede ser incluso fatal para el modelo. Si por ejemplo, el X1 se relaciona con el X2, lo cual quiere decir que en realidad existen dos ecuaciones en el modelo, tal que: 

Y = B0+B1*X1+B2*X2+B3*X3                                (5)

X1 = A0+A1*X2                                            (6)

Al tener tener esas dos ecuaciones, el modelo automáticamente se convierte en un mdelo multiecuacional. Se tienen muchas opciones o estrategias para trabajar con ello, pero por el momento, se tendría que reconocer dicha naturaleza. 

Pero si no se reconoce la multiecuacionalidad del modelo, entonces se tendría que juntar las ecuaciones en una sola, de la siguiente manera. 

Y = B0+B1*(A0+A1*X2)+B2*X2+B3*X3                                (7)

Y = (B0+B1*A0)+(B1*A1+B2)*X2+B3*X3                                (7a)

Y a través de la reparametrización, se puede lograr la siguiente expresión. 

Y = C0 +C1*X2+B3*X3                                (7b)

¿Qué ocurrió? Se perdió X1. Al respecto, corresponde reflexionar, ¿Eso es grave? ¿Es un problema fuerte? Probablemente sí, en el caso que X1 debería haber sido una de las variables más significativas y por lo tanto no debería haberse ido. En tal caso, sí es complicado tomar esa estrategia de simplificación. 

¿Qué se podría hacer? Invertir la relación entre X1 y X2. Es decir:

X2 = A0' +A1'*X1                                            (6a)

Con lo cual, sólo se perdería X2, tal que: 

Y = C0' +C1'*X1+B3*X3                                (7c)

¿Qué permite esta tecnica? Permite reorganizar el modelo y eliminar una de las variables de la relación multicolineal, en particular una no tan importante (X2), este logro eliminaría el problema de multicolinealidad. Obviamente, si se elimina una variable que debería estar siendo incluida en el modelo, se estaría afectando seriamente el modelo (sesgo por omisión de variable relevante).  

En conclusión, el problema de la multicolinealidad es bastante común. Es muy dificil encontrar ecuaciones cuyas variables explicativas no se relacionen, y ello abre la puerta a que sea dificil pretender hacer un modelo econométrico de una sola ecuación, salvo modelos de libro o de laboratorio. Sobre todo si las variables explicativas se relacionan de manera muy fuerte, a través de un impacto ecuacional que podría hacer que desaparezca la principal variable del modelo. 

Comments

Popular posts from this blog

Endogeneidad y Exogeneidad en los Modelos Econométricos [MARTIN, JM.]

"De los modelos ARDL - Primera Parte" (Traducción)

La multicausalidad y la insuficiencia de la causalidad lineal: Aspectos preliminares