IECON-UdelaR
IIEP-UBA
Te contamos cuándo y por qué el estimador de efectos fijos puede fallar por heterogeneidad en las pendientes y cómo detectarlo empíricamente con un test muy simple.
“One ring to rule them all”, dice la famosa frase de la saga de J. R. R. Tolkien. La historia transcurre en un mundo inusual, lleno de magia, reinos y criaturas extraordinarias. Sauron, el villano principal, creó varios anillos de poder: nueve para los hombres, siete para los enanos y tres para los elfos. Estos anillos parecían otorgar riqueza y fuerza a sus dueños, pero escondían un propósito oscuro. En secreto, Sauron forjó un anillo más, el “anillo único”, con la capacidad de dominar a los demás y corromper la voluntad de quienes los poseían. Frodo Bolsón, el joven protagonista, debe llevar portar este anillo y enfrentar peligros en una aventura épica. Miedo, intriga y fantasía.
En la tierra más realista (pero no menos fantástica) de los modelos de regresión lineal con datos en panel, podemos encontrar una trama similar a la anterior en donde el villano de esta historia no requiere de conjuros y pócimas para corromper y sesgar nuestro entendimiento de cómo funciona el mundo. Durante varias décadas de economía aplicada, el famoso y aclamado estimador de Efectos Fijos (EF) ha sido un protagonista casi obligado de cualquier análisis empírico de regresión que involucre un seguimiento de datos a lo largo del tiempo. Su simplicidad y versatilidad, resumida a veces con el eslogan “es simplemente MCO con dummies”, nos ofrece un estimador libre de sesgos provocados por otros factores externos, siempre que estos se mantengan constantes a lo largo del tiempo. Su atractivo radica en que permite descontar el efecto de otros determinantes que el investigador no puede observar directamente. De este modo, el EF permite estudiar la relación entre dos variables de manera confiable, depurando el efecto de causas presentes en los datos que no nos interesan y que no podemos modificar. Usar otra alternativa, como el estimador de Efectos Aleatorios, suele percibirse entre los practitioners como una vía más complicada o de dudosa consistencia y practicidad.
Aún más, incluso parece ser obvio que el estimador de EF es un buen resumen de hacer un montón de regresiones MCO por separado para cada unidad del panel. ¿Cómo? Vayamos despacio: supongamos que tenemos un panel que sigue a N individuos durante T periodos y que queremos hacer una regresión de Y en X. Para simplificar, supongamos que no hay shocks generales que afecten en simultáneo a todos los individuos (en la jerga, no hay efectos fijos por tiempo). Tal como dijimos, el estimador de EF aparece como el candidato cantado para este problema de estimación. El modelo de regresión en este contexto sería algo como lo siguiente:

en donde el valor que nos interesa es beta (la relación entre Y con X) y los alphas son justamente los denominados efectos fijos, los cuales podemos incorporar fácilmente incluyendo al modelo de regresión variables dummies que identifican a la unidad de panel “i” a lo largo del tiempo. Noten además que el beta estimado es único, en el sentido de que es el mismo para todos los individuos. De cierta manera, nos dice que podemos aprender sobre la relación de Y con X tanto de la comparación de ambas variables en distintos momentos del tiempo como de distintos individuos en el mismo momento. Y más aún, el estimador de EF nos permite controlar por cualquier otra causa de Y que no se modifique en el tiempo.
Hasta ahora, lo mismo de siempre, “nada por aquí, nada por allá”. Pero fíjense que otra opción es pensar de la siguiente manera: cada individuo “i” tiene T observaciones, por lo que podríamos hacer N regresiones (una para cada individuo) y, por lo tanto, obtener N estimaciones de beta. Es decir, ahora estamos estimando N modelos de regresión con la forma:

donde ahora cada beta nos dice cómo afecta X a Y para ese individuo. Lo que estamos haciendo en este caso es correr N regresiones con datos de series temporales. Pero lo más importante es que en esta nueva estrategia, seguimos controlando por los factores de cada individuo que no cambian en el tiempo! (técnicamente, ese efecto queda “absorbido” en la constante de cada modelo individual). Obviamente, el problema de hacer esto es que nada nos asegura que esta colección de betas sean similares unos con otros. De hecho, lo más probable es que tengamos heterogeneidad por hacer cada regresión por separado. Además, si N es demasiado grande, esta estrategia no es muy conveniente a la hora de comunicar conclusiones generales esbozadas en unas pocas estimaciones. Entonces, una opción es promediar los N betas para tener un resumen único del efecto de X sobre Y…. pero esto mismo es justamente lo que nos ofrece EF! La diferencia es que lo hace de una manera mucho más simple y rápida, ya que lo hacemos en una única regresión (“MCO con dummies”).
Sin embargo, esta fábula de maravillas oculta una historia que, bajo ciertas condiciones, puede torcer el destino de nuestras interpretaciones econométricas. Si consideramos a EF como “el estimador único” podemos caer en una trampa, cual Sauron operando desde las sombras.
Un punto relevante es preguntarse: ¿qué tan diferentes son los betas individuales? Pero otro, aún más importante, es: ¿da lo mismo hacer un promedio de los betas individuales que estimar por EF? Parecen la misma pregunta, pero no: la primera es más general y no necesariamente responde a la segunda. A la primera solo le preocupa si el efecto de X sobre Y es heterogéneo, pero no le importa el promedio de esos valores, solo si son diferentes. Esta pregunta fue abordada ampliamente en la literatura; en particular, el trabajo de Pesaran y Yamagata (2008) propone una serie de procedimientos para testear la hipótesis de homogeneidad de los betas individuales.
Ahora bien, pasemos a la segunda pregunta, que en el fondo dice: ¿realmente el estimador de EF es un estimador confiable del promedio de los coeficientes de regresión individuales? En caso afirmativo, optar por una u otra estrategia parece que se reduce simplemente a elegir la más fácil de implementar, y es ahí donde EF se lleva los laureles. El problema justamente está en la otra situación, cuando la respuesta es negativa ya que en ese caso, alguno de los dos métodos “miente”.
Como se habrán dado cuenta, hemos establecido que el parámetro que nos interesa estimar es el promedio de los betas individuales para los cuales tenemos dos estimadores alternativos: (i) el viejo y querido EF y (ii) hacer N regresiones de MCO y luego promediar betas. A priori, pareciera ser lo mismo, es decir, si es cierto que nos interesa un único parámetro, entonces parecería sensato estimarlo con EF, ya que es un estimador que nos promete insesgadez y consistencia. “Nada puede malir sal”. Resulta que esto no es totalmente cierto. Resulta que si el modelo tiene distintos betas individuales y nosotros omitimos esa variabilidad (como hace EF), entonces esa heterogeneidad "se cuela" dentro del término de error de la ecuación de regresión. ¿Eso sesga al estimador de EF? ¡No necesariamente! Si la heterogeneidad de los betas no está relacionada con la variabilidad de X (o, como nos gusta decir en econometría, “es exógena”), entonces no hay ningún problema de sesgo. Usando el ejemplo clásico de X educación y Y salarios: si el retorno individual por educarse de los individuos con educación promedio es muy distinto de aquellos que tienen educación muy alta o baja, entonces esa correlación se filtra en forma de sesgo en el estimador de EF, quien cree que puede comparar libremente todos contra todos y es justo ahí es donde mete la pata.
¿Y hacer MCO para cada individuo es sesgado? La respuesta es: no, dado que para cada individuo “i” el coeficiente de regresión es un parámetro identificable (siempre y cuando el resto de los factores individuales sean exógenos). Sobre este problema escribieron Campello y Galvao en un lindo trabajo publicado en el JBES allá por 2019. Más recientemente, Callaway y Sant’Anna en 2021 nos cuentan una historia muy similar sobre los sesgos cometidos por el estimador de EF bajo el efecto de las heterogeneidades que surgen en el contexto de un tratamiento que se va implementando de manera escalonada a lo largo del tiempo (conocido en la jerga como staggered intervention) y cuya literatura se viene desarrollando vigorosamente hasta el momento. La diferencia con el caso anterior es que, en lugar de estimar regresiones individuales, se hace en pequeños grupos en los cuales se pueda implementar un diff-in-diff.
¿Qué hacer ante esta encrucijada? Bueno, parecería que lo más seguro es ir por la opción que hace N regresiones y luego un promedio de coeficientes. Pero, ¿hay alguna manera de testear empíricamente si el estimador de EF está haciendo macanas? Eso es justamente lo que te contamos en el trabajo que hicimos con Antonio Galvao. Ahí te mostramos cómo implementar un test de hipótesis para ver si EF está siendo sesgado por la presencia de heterogeneidad endógena en los betas individuales. El trabajo incluye una explicación un poco más formal (para los curiosos de las fórmulas), así como un ejemplo empírico implementado en un código computacional en Stata.
El estimador de EF puede equivocarse y parecería que la solución más razonable es deshacernos de él, tal como hizo Frodo Bolsón arrojando el anillo único a las incandescentes profundidades del Monte del Destino. Pero tranquilos, por suerte no necesitamos atravesar toda la Tierra Media para encontrar una solución. Usando el poder de un simple test de hipótesis como guía, podemos ir por el camino correcto (al menos con cierto nivel de confianza). Porque hasta el test más pequeño puede cambiar el curso de una investigación.
Referencias
Alejo J., A. Galvao y G. Montes-Rojas (2025). “Testing for Slope Heterogeneity Bias in the Fixed-Effects Estimator.” Stata Journal, Vol. 25, No. 4.
B. Callaway y P. Sant’Anna (2021). “Difference-in-Differences with Multiple Time Periods.” Journal of Econometrics, Vol. 225, No. 2, pp. 200–230.
Campello, M., A. Galvao y T. Juhl (2019). “Testing for Slope Heterogeneity Bias in Panel Data Models”. Journal of Business and Economic Statistics, 37(4): 749–760.
Pesaran, M. H., y T. Yamagata (2008). “Testing Slope Homogeneity in Large Panels”. Journal of Econometrics, 142: 50–93.
