Una importación mal hecha: El LSE y la famosa técnica de eliminar variables no significativas [MARTIN, J.M.]

Mg. José-Manuel Martin Coronado
Chief Economist, EMECEP Consultoría, www.emecep-consultoria.com
Docente Principal, Instituto de Econometría de Lima, www.institutoeconometria.com

Es lamentable que alumnos profesores todavía enseñen la técnica de eliminación de variables como criterio de parsimonia automática para la especificación de modelos econométricos. Esta técnica es una simplificación mecánica del enfoque econométrico del London School of Economics de exploración de modelos (método de Hendry de lo general a lo específico), el cual tiene mayor profundidad analítica que, obviamente, no se está transmitiendo a los alumnos.

En términos sencillos, la versión simplificada del LSE approach, la cual es curiosamente similar al enfoque estadístico ateórico, es que cuando el modelador tiene una ecuación con k variables seleccionadas, y observa que J variables son no significativas, se eliminan esas últimas, quedándose con K - J variables. Así en el enfoque extremo, no hay que observar nada más, se trata de una ejecución masiva de variables.

El problema de este enfoque simplificado es que no se está considerando el fenómeno de la absorción, es decir que la presencia de las variables J tiene un efecto redistributivo sobre los coeficientes betas y sus desviaciones estándar, y por ende sobre los valores t y los p-valores (p-values). Y en dicho efecto, algunas variables absorberán más que otras, no necesariamente porque sean más explicativas en sí mismas, pero porque su explicatividad multivariante no se ve significativamente afectada por las demás variables.

Por otra parte, esta simplificación evita tener que cuestionarse sobre la factibilidad causal de las K variables. Dicha causalidad se volvería irrelevante porque se presume que esta esta contenida en los p-values y, si esté es no significativo, es que no hay causalidad. Se niega que los objetivos de investigación no sólo son rechazar Ho, sino también rechazar H1. En buena cuenta, se trata de un enfoque exploratorio de modelos pero no busca la exploración de las relaciones causales potenciales.

Desde un enfoque del R2, se entiende que hay un menor castigo al eliminar variables en un modelo econométrico, por lo que este podría ser un incentivo adicional. Algunos interpretan que es una forma de hacer más eficiente un modelo econométrico, aunque como debe recordarse el R2 es un indicador muy engañoso, sobre todo cuando más se le necesita. Así mismo, visualmente el modelo es mucho más atractivo dado que el rechazo masivo de las hipótesis nulas parece sugerir que las variables han sido adecuadamente seleccionadas.

Nada más lejano de la realidad. Como se sabe, lamentablemente, los modelos multivariantes no tienen la misma reacción que los modelos bivariables, esto es que si hay significancia entre las variables exógenas y la endogena pairwise, no necesariamente existirá al ponerlas en el mismo modelo, o peor aún podrá existir pero no tendrá la misma naturaleza. Así, un problema relacionado con la aborción es que la causalidad en los modelos multivariantes es de tipo residual, es decir, X2 explica lo que no explica X1, ni Bo ni el error.

En adición a ello, debe recordarse que la existencia de un error permite que existan muchas combinaciones lineales que satisfagan el modelo, pero aquella que será visualizada es la que minimiza los errores al cuadrado y no necesariamente la "real" o la mas razonable con la teoría económica. Si bien puede obtenerse, dadas las circunstancias antes indicadas, el éxito es más aleatorio que determinístico. La obtención generalizada de RHo no está garantizada al eliminar las variables no significativas.

Ahora bien, analizando el problema con mayor profundidad se puede observar que la eliminación de variables J con interacciones con las variables K-J y en general con efectos redistributivos con la variable endógena, genera que la causalidad residual pueda cumplir (o no) con las condiciones matemáticas y estadísticas, pero no necesariamente con las condiciones económicas. En otras palabras, los coeficientes beta de la variables en el modelo KJ (K variables menos J variables) no necesariamente van a ser los mismos que en el modelo con K variables (modelo K).

En algunos casos la diferencia no es relevante, pero en otros casos puede obtenerse coeficientes beta muy diferentes a los modelo K, tan diferentes que se puede encontrar un error de tipo S (un error de signo) ó un error de tipo M (error de magnitud). Por ejemplo, se espera que el coeficiente beta de la variable X1 sea significativo positivo y mayor que X2. Y cuando se traslada del modelo K al modelo KJ, el cual mantiene las variables X1 y X2, resulta que ambas son significativas pero X2 es mayor que X1 y X1 tiene un signo negativo y X2 tiene un signo positivo.

Si el modelador es cauto, entonces debería ver estos resultados como un riesgo derivado de la combinación lineal elegida por el método de estimación restringido, cuyos resultados podrían estar sesgados (algo inherente al MCR) y de ello, no es recomendable pasar a la interpretación. Pero, dado que la filosofía econométrica o estrategia econométrica de largo plazo no es algo que se enseñe en las clases de econometría salvo en el Instituto de Econometría de Lima, lo más común es que el alumno universitario busque probar otra combinación de modelo KJ que cumpla con lo que espera de las variables.

Este resultado esperado puede ocurrir, como también puede que nunca llegue. Y esto último puede ser frustrante para el alumno, lo cual puede llevarle a cometer un delito: el p-hacking. En el fondo, el método simplificado de selección mecánica y ateórica de variables es un hackeo de p-valores. Un tipo de técnica que no garantiza que uno obtenga los resultados esperados y si los obtiene, no necesariamente son consistentes con la teoría económica (o con la lógica económica) ni con el análisis bivariable (análisis previo de variables), por lo que su validez econométrica es nula, a pesar de contar con validez matemático-estadística.

Al respecto, es necesario identificar que existen hasta cinco tipos de resultados: 1) Los esperados por la teoría económica o lógica económica de terceros, 2) Los buscados por el modelador (si son propios, usualmente son "lógicos", aunque no necesariamente), 3) Los observados en la relación bivariable, 4) Los observados en la ecuación general (la completa, el modelo K) y 5) los observados en la ecuación reducida (restringida, el modelo KJ). Muchos pueden coincidir, voluntariamente o no, pero lo importante es no forzar dicha coincidencia.

Y justamente ahí radica el problema. La técnica de lo general a lo específico, simplificada, presume que lo general está mal, no porque sea general sino porque es imperfecto, mientras que asume que los específico si lo es. Al mismo tiempo asume que la transición entre lo general a lo específico es lineal y que no hay ninguna ecuación con mayor validez en el medio. Así mismo, presume que todas las ecuaciones desde la general (inicial), la intermedia y la especifica (final) son comparables, algo de que no es cierto. Finalmente, se asume que la validez estadístico-matemática es equivalente a la validez económica, cuando en realidad es una pseudo-condición necesaria pero no suficiente.

Lamentablemente, a pesar de las buenas intenciones de Hendry y sus amigos, la importación estuvo mal realizada y el daño ya está hecho. Muchos investigadores son creadores masivos de cajas negras con resultados ajustados y forzados a la mayor conveniencia del investigador y su sesgo de confirmación/publicación. Afortunadamente, en el Instituto de Econometría de Lima contamos con alumno/as con pensamiento crítico (critical thinking), que saben con las técnicas y operatividades econométricas no reemplazan un análisis profundo (deep analysis), y que la transparencia/traceability de sus investigaciones, así como su replicabilidad permitirán contrarrestar en un mediano plazo el daño hecho a la investigación económica.


Lima, 18 de Julio de 2019

Comments

Popular posts from this blog

Endogeneidad y Exogeneidad en los Modelos Econométricos [MARTIN, JM.]

"De los modelos ARDL - Primera Parte" (Traducción)

¿Qué es un Proceso Generador de Datos ARIMA(1,1)? [J.M. MARTIN]