Читать книгу El lado oscuro de la econometría - Walter Sosa Escudero - Страница 8
FUCK GAUSS MARKOV
ОглавлениеPuede ser una estrategia de marketing, tanto como decir que Borges escribía unos simpáticos cuentitos metafísicos. Y posiblemente lo sea. Pero, si sirve para desmitificar a algún intocable de la econometría con olor a naftalina y hacer pensar a los alumnos (más que memorizar y repetir como loro), valga la chanza. No le voy a pedir perdón ni a Gauss ni a Markov: ninguno de ellos pasó a la historia por el “teorema de Gauss-Markov” (TGM), en el mismo sentido en que Michael Jordan tampoco lo hará por sus incursiones en el golf.
El problema con el TGM es que no dice lo que uno querría que dijera: que, bajo ciertas condiciones, el estimador MCO es el mejor. Peor aun sabiendo que lo mejor no es necesariamente bueno (como hablásemos anteriormente), querríamos que el TGM nos dijera que el método de MCO es bueno, y que nos diera una justificación para usarlo. Entonces, como con los carbohidratos o Ricardo Arjona, es el abuso y no el uso lo que daña y agiganta artificialmente la relevancia del TGM. Y este es el tema de esta sección: darle al teorema la importancia que se le debe, ni más ni menos.
El TGM no dice que el método de MCO es el mejor estimador. La estadística clásica tiene serios problemas en garantizar la existencia de un “mejor estimador”, así nomás (técnicamente, en términos uniformes), sin imponer restricciones. Ni siquiera dice que sea el mejor estimador insesgado. Y aun cuando lo dijese, deberíamos discutir si es interesante (o no) que un estimador sea insesgado, cuestión a la que le dedicaremos una sección entera más adelante y que, a la luz de la enseñanza dogmática de la estadística en economía, es como preguntarle a un alumno si opina que sus padres son realmente sus padres. Y deberíamos discutir también si la noción de “mejor” estimador (y, si vamos al caso, de bueno y malo) es medible solo a través de su varianza. Desde cierto punto de vista, reducir la apreciación de la calidad de un estimador insesgado a que su varianza sea chica o grande es como creer que un autobús escolar (de esos amarillos que hay en EEUU) es mejor que una Ferrari solo porque es más grande. Aclaremos. La propiedad de varianza pequeña es claramente deseable, pero no es la única. Por ejemplo, la de robustez es también otra característica interesante que un estimador debería poseer y tiene muy poco que ver con que la varianza sea alta o baja.
El TGM dice, ni más ni menos, que el estimador de MCO es el de varianza mínima en la clase de estimadores lineales e insesgados. Que no es poco, pero tampoco es demasiado. La clase de estimadores insesgados posiblemente sea interesante. Pero ¿la clase de estimadores lineales? ¿En serio? ¿Para qué quiere uno que el estimador sea lineal? ¿Para sacar cuentas más rápido? ¿Para pasar las esperanzas a través de funciones lineales? ¿Para deducir normalidad, ya que toda función lineal de una variable normal también lo es? Posiblemente. Son todas ventajas analíticas, pero difícilmente sean conveniencias conceptuales, como la insesgadez. Decir que el método de MCO es el mejor estimador lineal e insesgado es como decir que tal vino es el mejor vino antimagnético, o que tal raza de perro es buena porque su nombre no contiene la letra “t”. En definitiva, mi problema con el TGM es que muchos alumnos creen que justifica el uso de MCO, pero solo lo hace en términos relativos. O sea, el TGM dice que el estimador de MCO es óptimo: a) en un sentido muy particular (varianza mínima) y b) dentro de una clase de estimadores que no es necesariamente interesante (la de los lineales e insesgados).
Ahora, hablemos bien del TGM. Es un “teorema chusma” (chusma (arg.): ‘que habla mal de otro y en su ausencia’), como esas viejas vecinas de barrio que tienen demasiado tiempo libre. En general, el TGM sirve para descartar otras estrategias lineales e insesgadas. Por ejemplo, bajo los supuestos clásicos, el método de mínimos cuadrados ponderados no puede ser mejor que MCO (porque por el TGM el mejor es MCO), bajo exogeneidad, el método de variables instrumentales no puede ser mejor que MCO, etc., etc., lo cual no es poco.
Hace unos meses puse en Yahoo Answers la pregunta: “¿Por qué es importante el TGM?”, y la respuesta más votada es: “Porque lo dice mi profesor de econometría”. Y esto es lo que quiero desterrar e invitar al lector a que me acompañe en esta cruzada. ¿Es el TGM un teorema importante? Sí. Es casi lo mejor que se puede decir de MCO en muestras fijas y sin suponer normalidad. ¿Es tan importante? No, porque es realmente poco lo que puede decir, o en todo caso, el TGM será tan importante como relevante sea la clase de estimadores insesgados y lineales, y como efectiva sea la varianza como medición de la calidad de un estimador.
Dedico mucho tiempo en mis clases al TGM, lo demuestro con detalle y lo discuto, a veces en los términos heréticos de esta sección. A veces ando con ganas de eliminarlo por completo, pero lo dejo, porque me da lástima y porque me parece que es una buena gimnasia econométrica. Y para pasar el mensaje de que jamás la relevancia de un resultado es “porque lo dice el profesor”. No crean todo lo que dicen por ahí. Ni lo que dice esta sección.
Referencia
Gauss, C., 1987, Theory of the Combination of Observations Least Subject to Errors: Part One, Part Two, Supplement, Society for Industrial and Applied Mathematics, Filadelfia. Resulta muy instructivo mirar el trabajo original de Gauss. El contexto y la notación son completamente distintos, pero realmente vale la pena el esfuerzo.