Endogeneidad y Exogeneidad en los Modelos Econométricos [MARTIN, JM.]

Econometrista

En las clases de estadística, en el tema de regresión lineal, los alumnos aprenden que hay variables dependientes (regresadas) y variables independientes (regresoras), básicamente la "Y" y la "X", como un recordatorio de las clases de geometría analítica. No obstante, cuando los alumnos llegan al curso de econometría, ese lenguaje tiende a cambiar, para confundir, y a veces, para estresar a los alumnos.

Aunque en el fondo podrían llegar a ser sinónimos, lo cierto es que la denominación más usual es la de variable endógena y variable exógena, respectivamente. La primera no es otra que aquella variable económica cuya evolución y/o comportamiento depende de otras, mientras que la segunda es lo contrario. (no dependencia). No obstante, este enfoque parece ser más un supuesto que una propiedad.

En otras palabras, mientras se tienen experimentos plenamente controlados y con objetivos poco o nada flexibles, las variables dependientes son inevitablemente endógenas; sin embargo, ello no ocurre con muchas variables económicas, en particular las macroeconómicas.

De este modo, la endogeneidad ("dependencia") y la exogeneidad ("independencia") se vuelven supuestos débiles, que en realidad deben ser comprobados por el econometrista, a fin de verificar si su modelo está correctamente especificado. Es decir que es mejor considerarlos como hipótesis a ser comprobadas. Y como ya los alumnos deben saber, para toda hipótesis debería haber una prueba de hipótesis. Existen muchos estadísticos de prueba de endogeneidad y exogeneidad, los cuales serán tratados en un próximo artículo. 

Veamos lo anterior con un ejemplo:
  • Jan es un joven estudiante de econometría y quiere hacer un modelo que explique la tasa de interés del banco donde sus padres tienen sus ahorros. Luego de consultar con un asesor del banco, entendió que esta tasa depende de dos cosas: El costo intertemporal del dinero (resumido, por ejemplo, en la inflación proyectada) y el costo de gestión del dinero (el cual, para estos efectos, se traduce términos porcentuales)
  • De este modo, Jan elabora el siguiente modelo: TIt = Bo + B1*INFt + B2*CGDt + U, aprovechando las ventajas de la información publica.
  • Al estimar el modelo, se encuentra con los siguientes resultados: TIt = 1%  + 0.6*INFt + 0.4*CGDt, (R2 = 95%) lo cual le hace muy feliz y desea presentarle los resultados a sus padres. 
  • Su padre, un pensionista de una pequeña empresa financiera, no parece estar muy de acuerdo con sus resultados. Le dice que la tasa de interés en realidad depende de más variables, por ejemplo, la tasa de encaje ó la tasa de referencia del banco central.
  • Jan, alumno aplicado del curso, le responde que si bien ello es cierto, el error residual tiene por finalidad captar todas las demás variables que podrían no estar incluidas en el modelo, y que de ser el caso, estas explican sólo el 5% ya que las exógenas elegidas explican el 95%.
  • ¿Exógenas? Le cuestiona su padre. ¿No te parece que la tasa de referencia del banco central afecta a la inflación? ¿No crees que la inflación afecta al costo de gestión del dinero? ¿Y este costo no depende de otras variables, por ejemplo, el porcentaje de endeudamiento de los bancos con el público?
  • Sorprendido por los conocimientos de su padre, el joven Jan no tiene mucho que responder. Sólo que el R2 al final puede no servir para nada, el error residual es más potente e informacional de lo que pensaba, la exogeneidad no es un supuesto controlable sino una hipotesis a demostrar (o a convencer). 
El lector se preguntará, ¿y qué con la Endogeneidad? Pues, lo que no es exógeno es endógeno. Son dos caras de la misma moneda. A saber: 
  • Si la inflación no es una variable exógena (en el modelo propuesto), entonces será endógena.
  • Y si es endógena puede serlo con otra variable del modelo o con el error-residual. 
  • Si es con una variable del modelo, se trata de una multicolinealidad (combinación lineal de regresores) y deberá realizar un modelo con dos ecuaciones (por lo menos), donde la inflación es "exógena" en una y endógena en la otra. (aunque en la primera ecuación, la inflación entrará en la forma de datos y no en la forma observacional). 
  • Si es con el error (porque no hay otra opción), es necesario verificar si esta relación es fuerte (significativa) o no (no significativa).
  • Si es significativa en su relación con el error residual, es necesario agregar más variables al modelo (las exógenas a la inflación respectivamente) y/o utilizar modelos de variables instrumentales mediante mínimos cuadrados en dos etapas (TSLS). 
Las pruebas para verificar si las exógenas se relacionan con el error pueden ser diversas, pero un simple coeficiente de correlación puede dar pie a algunas conclusiones preliminares. Incluso en series de tiempo puede sugerirse que la variables denominadas exógenas no tengan una distribución aleatoria sino determinística, puesto que es altamente probable que se correlacionen con el error.

Muy aparte de las razones económicas para verificar la endogeneidad/exogeneidad, desde un punto de vista estadístico, la "no exogeneidad de las exógenas" (está bien escrito) genera que el estimador MCO no cumpla con las propiedades previstas, debido a que su descomposición matemática va diferir del supuesto ideal [(X'X)-1X'Y], por lo que pueden tenerse problemas de sesgo, ineficiencia e incluso inconsistencia. 

Sí, a veces es más fácil tener la endogeneidad/exogeneidad como supuesto, es más simple, pero puede generar falsas conclusiones de los modelos que se estimen, y con ello, el econometrista puede cometer serios errores de aplicación/interpretación para su recomendaciones y/o acciones de política. 

Comments

Popular posts from this blog

"De los modelos ARDL - Primera Parte" (Traducción)

¿Qué es un Proceso Generador de Datos ARIMA(1,1)? [J.M. MARTIN]