Читать книгу El lado oscuro de la econometría - Walter Sosa Escudero - Страница 10

UN AÑO SIN EL R2

Оглавление

Supongamos que viene nuestro hijo (hermano, amigo, lo que sea), de 16 años y nos dice “me saqué un 10 en un examen” (cuyas calificaciones van de 0 a 10). ¿Es una buena noticia? Bueno, si es en uno de Mecánica Cuántica, del doctorado en Física, seguro. ¿Y si el tipo volvió a sentarse con los niñitos de la primaria y tomó el examen de Matemática de primer grado? Mmmm. Esta ambivalencia de reacciones debería provocarle a uno la noticia de que el modelo que acaba de estimar tiene un R2 alto.

Como todos sabemos, el R2 es una medida de la contribución relativa del modelo lineal estimado por el método de mínimos cuadrados. Relativa a un modelo naive consistente en la media muestral de la variable de interés.

El R2 es una medida de calidad en relación con la pregunta que uno se hizo inicialmente, es decir, el R2 no juzga la respuesta ni la pregunta, sino la adecuación de la respuesta a la pregunta. Por ejemplo, si en un modelo la variable explicada es el activo de una empresa, y las variables explicativas son el pasivo y el patrimonio neto, a menos que cometamos algún error al ingresar los datos, el R2 será exactamente igual a uno. Es decir, el modelo proporciona una respuesta perfecta a una pregunta demasiado estúpida: siempre el activo es igual al pasivo más el patrimonio neto, por lo menos desde la época de fray Luca Pacioli, como discutimos antes. En el otro extremo está cualquier modelo de economía laboral, que aun con miles de datos no puede proporcionar un R2 mayor a 0.3. ¿Cuál de los dos modelos es mejor? Comparar modelos nada más que sobre la base del R2 es como comparar coches sobre la base de su tamaño. Sin otra mención en particular, creer que un modelo es mejor que otro porque tiene R2 más alto es como creer que un desvencijado ómnibus es mejor que un Porsche solo porque es más grande.

La enorme popularidad del R2 tiene que ver con hacerles creer a los principiantes que se trata de “la” medida de calidad. La estadística clásica tiene enormes dificultades en definir con precisión qué significa que un modelo sea bueno y, de hecho, recurre a un conjunto de propiedades deseables, dejándole al usuario que defina (explícita o implícitamente) su mapa de preferencias sobre ellas, por ejemplo, si es preferible más sesgo que varianza o que un estimador sea robusto o no.

Cualquier modelo es obviamente erróneo como representación de la realidad, y la discusión de si es bueno o malo es, en realidad, una discusión de si es útil o no, en el sentido de lo que decía George Box, eso de que “todos los modelos están mal, pero algunos son útiles”. En el caso de las ecuaciones de Mincer, ¿es el R2 igual a 0.3 bajo? Depende. Depende de para qué se quiera usar al modelo. Si es para estimar el efecto de la edad sobre los salarios, posiblemente el modelo sea excelente, a juzgar por la ínfima varianza con la que dicho efecto puede ser estimado. Ahora si el objetivo es usar el modelo para predecir salarios, el modelo es bastante malo. No existe forma de decir si 0.3 es bajo o alto, a menos que explicitemos qué pretendíamos del modelo. En el caso de los activos antes mencionados, un R2 de 0.99999 es patéticamente bajo: ya sabíamos cómo funcionaba el modelo sin necesidad de estimar absolutamente nada.

A veces pienso si no es mejor tirar el R2 a la basura en la enseñanza de la econometría básica. Sí, ya sé que hay mucho para perder. Pero también hay para ganar, para que el alumno focalice en la complejidad de evaluar multidimensionalmente si un modelo es bueno o no, en particular sobre la base de los objetivos que se propuso con la estimación del modelo.

El mejor favor que alguien me ha hecho es enseñarme a afinar mi guitarra a oído. Una vez que me acostumbré a confiar en mi oído interno, mi afinador electrónico Korg y yo convivimos en sana armonía. El R2 es una característica del modelo, que aun cuando sea elevado, puede dejarnos tan lejos de un buen modelo como el tocar afinado está de tocar bien la guitarra.

El lado oscuro de la econometría

Подняться наверх