J., 1997, Econometric Methods, 4ta. Ed., McGraw Hill, Nueva York.
Judge, G., Griffiths, W., Carter Hill, R., Lutkepohl, H. y Lee, T., 1985, The Theory and Practice of Econometrics, Wiley, Nueva York.
Goldberger, A., 1991, A Course in Econometrics, Harvard University Press, Cambridge.
Wooldridge, J., 2012, Introductory Econometrics: A Modern Approach, 5ta. Ed., Cengage Learning, Nueva York.
FUCK GAUSS MARKOV
Puede ser una estrategia de marketing, tanto como decir que Borges escribía unos simpáticos cuentitos metafísicos. Y posiblemente lo sea. Pero, si sirve para desmitificar a algún intocable de la econometría con olor a naftalina y hacer pensar a los alumnos (más que memorizar y repetir como loro), valga la chanza. No le voy a pedir perdón ni a Gauss ni a Markov: ninguno de ellos pasó a la historia por el “teorema de Gauss-Markov” (TGM), en el mismo sentido en que Michael Jordan tampoco lo hará por sus incursiones en el golf.
El problema con el TGM es que no dice lo que uno querría que dijera: que, bajo ciertas condiciones, el estimador MCO es el mejor. Peor aun sabiendo que lo mejor no es necesariamente bueno (como hablásemos anteriormente), querríamos que el TGM nos dijera que el método de MCO es bueno, y que nos diera una justificación para usarlo. Entonces, como con los carbohidratos o Ricardo Arjona, es el abuso y no el uso lo que daña y agiganta artificialmente la relevancia del TGM. Y este es el tema de esta sección: darle al teorema la importancia que se le debe, ni más ni menos.
El TGM no dice que el método de MCO es el mejor estimador. La estadística clásica tiene serios problemas en garantizar la existencia de un “mejor estimador”, así nomás (técnicamente, en términos uniformes), sin imponer restricciones. Ni siquiera dice que sea el mejor estimador insesgado. Y aun cuando lo dijese, deberíamos discutir si es interesante (o no) que un estimador sea insesgado, cuestión a la que le dedicaremos una sección entera más adelante y que, a la luz de la enseñanza dogmática de la estadística en economía, es como preguntarle a un alumno si opina que sus padres son realmente sus padres. Y deberíamos discutir también si la noción de “mejor” estimador (y, si vamos al caso, de bueno y malo) es medible solo a través de su varianza. Desde cierto punto de vista, reducir la apreciación de la calidad de un estimador insesgado a que su varianza sea chica o grande es como creer que un autobús escolar (de esos amarillos que hay en EEUU) es mejor que una Ferrari solo porque es más grande. Aclaremos. La propiedad de varianza pequeña es claramente deseable, pero no es la única. Por ejemplo, la de robustez es también otra característica interesante que un estimador debería poseer y tiene muy poco que ver con que la varianza sea alta o baja.
El TGM dice, ni más ni menos, que el estimador de MCO es el de varianza mínima en la clase de estimadores lineales e insesgados. Que no es poco, pero tampoco es demasiado. La clase de estimadores insesgados posiblemente sea interesante. Pero ¿la clase de estimadores lineales? ¿En serio? ¿Para qué quiere uno que el estimador sea lineal? ¿Para sacar cuentas más rápido? ¿Para pasar las esperanzas a través de funciones lineales? ¿Para deducir normalidad, ya que toda función lineal de una variable normal también lo es? Posiblemente. Son todas ventajas analíticas, pero difícilmente sean conveniencias conceptuales, como la insesgadez. Decir que el método de MCO es el mejor estimador lineal e insesgado es como decir que tal vino es el mejor vino antimagnético, o que tal raza de perro es buena porque su nombre no contiene la letra “t”. En definitiva, mi problema con el TGM es que muchos alumnos creen que justifica el uso de MCO, pero solo lo hace en términos relativos. O sea, el TGM dice que el estimador de MCO es óptimo: a) en un sentido muy particular (varianza mínima) y b) dentro de una clase de estimadores que no es necesariamente interesante (la de los lineales e insesgados).
Ahora, hablemos bien del TGM. Es un “teorema chusma” (chusma (arg.): ‘que habla mal de otro y en su ausencia’), como esas viejas vecinas de barrio que tienen demasiado tiempo libre. En general, el TGM sirve para descartar otras estrategias lineales e insesgadas. Por ejemplo, bajo los supuestos clásicos, el método de mínimos cuadrados ponderados no puede ser mejor que MCO (porque por el TGM el mejor es MCO), bajo exogeneidad, el método de variables instrumentales no puede ser mejor que MCO, etc., etc., lo cual no es poco.
Hace unos meses puse en Yahoo Answers la pregunta: “¿Por qué es importante el TGM?”, y la respuesta más votada es: “Porque lo dice mi profesor de econometría”. Y esto es lo que quiero desterrar e invitar al lector a que me acompañe en esta cruzada. ¿Es el TGM un teorema importante? Sí. Es casi lo mejor que se puede decir de MCO en muestras fijas y sin suponer normalidad. ¿Es tan importante? No, porque es realmente poco lo que puede decir, o en todo caso, el TGM será tan importante como relevante sea la clase de estimadores insesgados y lineales, y como efectiva sea la varianza como medición de la calidad de un estimador.
Dedico mucho tiempo en mis clases al TGM, lo demuestro con detalle y lo discuto, a veces en los términos heréticos de esta sección. A veces ando con ganas de eliminarlo por completo, pero lo dejo, porque me da lástima y porque me parece que es una buena gimnasia econométrica. Y para pasar el mensaje de que jamás la relevancia de un resultado es “porque lo dice el profesor”. No crean todo lo que dicen por ahí. Ni lo que dice esta sección.
Referencia
Gauss, C., 1987, Theory of the Combination of Observations Least Subject to Errors: Part One, Part Two, Supplement, Society for Industrial and Applied Mathematics, Filadelfia. Resulta muy instructivo mirar el trabajo original de Gauss. El contexto y la notación son completamente distintos, pero realmente vale la pena el esfuerzo.
MAMÁ, MAMÁ, MI MODELO TIENE HETEROCEDASTICIDAD
Una vieja chanza de la estadística dice que los científicos aplicados creen en la distribución normal porque piensan que es un hecho de la matemática, mientras que los matemáticos creen en ella porque piensan que es un fenómeno aceptado en la ciencia aplicada.
Tengo la impresión de que algo similar pasa con los así llamados “supuestos clásicos” en econometría. Los estudiantes y practicantes tienden a darle importancia porque creen que es algo que los econometristas teóricos juzgan relevante, y estos últimos parecen respetarlos porque creen que a los economistas aplicados les son importantes. ¿Son los supuestos clásicos algo relevante a la teoría o a la práctica de la econometría? Se agrega a esta disquisición una tercera dimensión: puede que sea cierto que estos supuestos (y el modelo al cual conducen) sean relevantes en un sentido pedagógico; quizás es más útil comenzar por una estructura simple y no necesariamente realista, y luego pasar a alguna más compleja y posiblemente más apropiada para la realidad. Más o menos por las mismas razones que la física empieza con el poco realista “movimiento rectilíneo uniforme”, para luego construir un castillo que conduce a la mecánica clásica y tal vez a la física cuántica.
Más allá de estas disquisiciones, el grueso de la práctica econométrica se basa en la estimación mínimo cuadrática del modelo lineal, usando herramientas estándar (como los estadísticos “t”) a fin de evaluar hipótesis simples o construir intervalos de confianza. Los economistas tenemos una relación casi atávica con esta simple estructura, y siempre que pareció que la íbamos a abandonar, algún evento nos devolvió al vientre materno. Cuando los modelos macroestructurales amenazaron al modelo simple estimado por MCO, los vectores autorregresivos (estimados ecuación por ecuación por MCO) nos devolvieron a la realidad. Lo mismo ocurrió con la “revolución de credibilidad” (encabezada por Joshua Angrist y sus coautores), que sugirió que utilizar modelos más complejos que el combo “modelo lineal / MCO” era inútil como esterilizar un cuchillo para asesinar a un tipo, en el sentido de que cualquier sofisticación econométrica tiene un impacto menor (si alguno) en comparación con prestar atención a la estructura de identificación del problema en cuestión.
Tengo la impresión de que chequear los supuestos clásicos es como verificar si en la práctica se da el movimiento rectilíneo uniforme de la secundaria. Es más seguro pensar que no. De modo que la preocupación no es si se cumplen o no (no se cumplen), sino cuáles