Martin C., J.M. (2020o) - Pobreza, falsos positivos y sesgos estadísticos

José-Manuel Martin Coronado
Chief Economist, EMECEP Consultoría

Existen muchos estudiantes de economía interesados por los temas de pobreza, ya sea porque el tema legítimamente les interesa, porque un profesor les inculcó dicho interés y/ó porque existe un interés económico de especializarse en dicha área. Sea como fuere los estudios de pobreza, por su naturaleza crítica, tienen un financiamiento especial por parte del Estado, no sólo por el elevado interés público, sino también por la aceptación generalizada que esto puede generar. 

Si bien, resolver el problema de la pobreza es un objetivo nacional, no es tan simple. Se trata de un proceso largo de reducción de las desigualdad y del nivel mínimo de subsistencia. Pero para lograrlo y, sobre todo, obtenerlo efectivamente, es necesaria una gran cantidad de estudios que confirmen que tales políticas públicas. Y la palabra confirmar es crítica en este punto. Es más útil para los financistas de tales estudios, que los mismos confirmen la política general y las políticas específicas, a que las rechacen. 

Esto no tiene por qué sorprender. Es un caso más de sesgo de confirmación. Esto ocurre en muchos lugares. Si el financista de un estudio no obtiene los resultados que espera, entonces dejará de contratar dicho grupo de estudios, reemplazado por otro. De ello es que los profesores y alumnos se encuentran constantemente a la casa de encontrar resultados positivos en los programas sociales de la lucha contra la pobreza. Y lo más curioso es que no conciben la posibilidad que haya sesgo de selección (algo muy común por cierto) en estos estudios, por lo que consideran que sus modelos están equivocados y es necesario arreglarlo, máxime si existen estudios que muestran que sí hay efectos positivos. 

Por lo tanto, los estudios de pobreza, profesionales y pre-profesionales tienen dos grandes riesgos: el sesgo de confirmación y el sesgo de selección. El segundo de ellos ha sido bastante combatido por J.Heckman y los Randomized Controlled Trials, sin embargo, no puede afirmarse que estos problemas ya están superados. El principal problema es que el Selection Bias no es algo enteramente natural ó casual por razones de realidad socio-económica, sino por la propia selección hecha por los investigadores ó la intervención realizada por el Gobierno sobre los individuos. 

Lamentablemente, aún cuando el sesgo de selección pudiera minimizarse de manera técnica, existen incentivos perversos para que que simplemente se considere como inexistente estadísticamente, a pesar de que aún lo esté. Y la causa de esto es el sesgo de confirmación, no sólo aplicable a la aleatoriedad de los datos, sino también a la existencia de causalidades, generando una tendencia hacia falsos positivos. Al respecto, los positivos (falsos o no tan falsos) permiten la (pseudo-confirmación) de teorías o causalidades prácticas, aunque en muchos casos no existen debido a la alta heterogeneidad de datos. 

En efecto, la alta heterogeneidad de los datos genera que el sesgo de selección, y otros problemas estadísticos más, se mantengan, por más modificaciones, alteraciones o hackeos a la data. Por ello es que tal vez los métodos submuestrales (clasificación) ó los métodos de remuestreo, bootstrapping, pueden ser aquellos que permitan un análisis más limpio de heterogeneidad. Aunque ello no elimina la gran posibilidad que los datos simplemente no provengan de una misma función de densidad de probabilidad, con lo cual sólo serán meras aproximaciones, pero nunca certezas. 

Ante este escenario, los financistas de proyectos sociales requieren certezas para continuar con los programas que respalda, todo lo demás puede pasar a un segundo paso, si el estudio de contrafácticos ó estos de falseación son poco promocionados. Seguiremos viviendo una mentira estadística, pensando que los programas sociales realmente ayudan conforme se espera de ellos, cuando en realidad ayudan a sobrevivir, pero no a ser mejores, es decir, no son significativos a nivel general.

Comments

Popular posts from this blog

Endogeneidad y Exogeneidad en los Modelos Econométricos [MARTIN, JM.]

"De los modelos ARDL - Primera Parte" (Traducción)

¿Qué es un Proceso Generador de Datos ARIMA(1,1)? [J.M. MARTIN]