Magos, espadas y rosas: leyes y leyendas de la econometría
por Walter Sosa Escudero
Una vez alguien puso en un blog de matemática la siguiente pregunta ¿Hay algún número que es tan pequeño que uno pueda tomarlo como si fuese cero? A todos nos suena a disparate esta pregunta, pero la vida cotidiana está llena de reglas y atajos que nos permiten proceder con comodidad. A modo de ejemplo, si alguien me pregunta mi edad, respondo “48 años”, y no “48 años, 8 meses, 12 dias, 6 horas, 26 minutos, etc.”, porque hemos convenido, sin firmar papel alguno, que la edad se pregunta y responde en años. Entonces, cualquier regla es un intento de resumir algo complejo, lo cual es necesariamente bueno y malo, tan malo como que mi edad no es exactamente 48 años, y bueno como que la discrepancia entre mi verdadera edad y 48 es socialmente insignificante, y es lo que permite comunicarnos sin volvernos locos. Ahora ¿Dónde está escrito que la edad se comunica en años? ¿Y las distancias en cuadras?
La econometría no está exenta a esta dinámica. Existen varias reglas, que mucha gente usa pero que ningún teórico de la econometría admite haber pronunciado. Entonces, vaya aquí una colección incompleta y disparatada de “reglas econométricas”, que todos usan y nadie admite. Deliberadamente omitiré las fuentes, por por lo menos una de las siguientes razones (no mutuamente excluyentes): 1) Se dice el pecado, pero no el pecador, 2) Las desconozco, 3) Las conozco pero los que las inventaron son prestigiosos colegas a quienes no quiero desprestigiar. Solo daré algunas pistas para que en estos tiempos berreta de Google, hagan su propio trabajo arqueológico.
1. n>30. Quizas la más vieja de las reglas econométricas. Muchos estudiantes usan esta regla para hablar de “muestra grande”, es decir, en esta lógica maniquea 29 es “chico” y 31 es “grande”. Cuando en mi curso básico pregunto “cuán grande debe ser una muestra para ser considerada grande” (una pregunta bastante pavota, por cierto), por alguna razón esotérica mucha gente responde “más de treinta”. El autor de la regla ha sido injustamente olvidado. O quizás todo lo contrario.
2. T>20. Este es el límite de observaciones temporales más allá del cual el sesgo por panel dinámico no debería molestar. Es decir, con T>20 uno podría usar el estimador de efectos fijos y dejarse se embromar con Arellano-Bond y otras cosas estrambóticas. Esta cifra fue recientemente actualizada (a 30) en un paper de Judson y Owen. Los autores de la regla “abandonaron la institución, nunca más se supo de ellos, del caso no se habló más” como decían los Fabulosos Cadillacs de los oficiales que vieron morir a Manuel Santillán, El León.
3. G>50. Se dice por ahí, en los bajofondos de la econometría, que con más de 50 clusters los estimadores “cluster robust” son confiables y que con menos hay que apelar correcciones por sesgos, wild bootstrap y otras invocaciones mefistofélicas. Con mas de 50, con vce(cluster) alcanza. Ahora, ¿no es realmente sospechoso que 50 se parezca, misteriosamente, a la cantidad de estados que hay en los Estados Unidos de America? Mmm.
4. (p=f+1). Esta regla dice que la cantidad de rezagos (p) a incluir en un modelo dinámico (o en un ARMA) es la frecuencia de los datos (f) más uno. Por ejemplo, con datos trimestrales, f=4 (cuatro trimestres), ergo hay que incluir 5 rezagos. Y la cuenta da 13 para datos mensuales (y 2 para anuales). Esta regla me fue comunicada en una intersección de dos caminos de tierra que no figuran en ningún mapa, en el estado de Illinois, en una media noche de luna llena. Había un tipo con una guitarra, me escondi hasta que se fuera y recién ahí me aposté con mi notebook y mi PCGive.
5. F>10. Esta está en el libro de Angrist y Pischke, pero ellos no dicen quien la invento (asi cualquiera, que vivos!). Le regla reza que si el F de la primera etapa es mayor que 10, no hay un problema de instrumentos débiles. Ahora, si F es menor que 10, terribles cosas pueden suceder. Me contaron de un econometrista de Springfield, Arkansas, que quiso publicar un paper con F=9.99, tras lo cual su esposa lo abandonó, perdió toda su fortuna y ahora se dedica a escribir cadenas de mensajes por Facebook.
6. l= 1600. Dice la leyenda que Prescott se negaba sistemáticamente a publicar el famoso paper del “filtro de Hodrick y Prescott” (escrito en 1981 y publicado recién en…1997!) porque lo consideraba demasiado trivial. Como todos saben, el filtro necesita la previa determinación de un parámetro de suavizado, que los autores sugieren fijarlo en 1600, para datos trimestrales. Se cuenta de un grupo de econometristas dinamarqueses que fijaron l=1613, y que en el intervalo de un congreso en donde iban a presentar sus resultados, adujeron salir por unas cervezas, tras lo cual nunca más nadie oyó hablar de ellos.
Como las brujas, las reglas no existen, pero que las hay, las hay. ¿De cuales me olvide?
Buenas noches.
Econometría Avanzada
No hay comentarios:
Publicar un comentario