Paradojas estadísticas: por qué los números pueden engañar

21

Las estadísticas, a pesar de su reputación de objetividad, pueden producir resultados contraintuitivos que desafían el sentido común. Esto suele deberse a paradojas estadísticas, como la paradoja de Simpson, donde aparece una tendencia en los datos agregados pero se invierte cuando los datos se dividen en subgrupos. Comprender estos fenómenos es crucial para una investigación y una toma de decisiones precisas.

El caso de admisión de Berkeley

Un ejemplo famoso ocurrió en la década de 1970, cuando la Universidad de California, Berkeley, fue acusada de discriminación de género en sus admisiones de posgrado. Los datos iniciales mostraron una tasa de aceptación más baja para las mujeres solicitantes (35%) en comparación con los hombres (44%), lo que aparentemente indica sesgo. Sin embargo, cuando se analizaron las admisiones por departamento, ocurrió lo contrario: en cuatro de seis departamentos principales, ingresaron más mujeres que hombres.

La discrepancia surgió porque las mujeres postularon de manera desproporcionada a departamentos más competitivos con tasas de aceptación generales más bajas, mientras que los hombres postularon a departamentos con más vacantes y menos solicitantes. Esto ilustra cómo la agrupación puede distorsionar las tendencias subyacentes.

Los orígenes de la paradoja

El fenómeno fue descrito por primera vez en 1899 por el matemático Karl Pearson, luego redescubierto por George Udny Yule en 1903. Sin embargo, pasó desapercibido hasta que Edward Simpson lo documentó formalmente en 1951, prestando su nombre al efecto. El trabajo de Simpson destacó cómo las tendencias pueden variar según las divisiones de los subgrupos.

Implicaciones en el mundo real

Esta paradoja no es meramente teórica. En 2021, los datos indicaron que la COVID-19 fue casi dos veces más mortal en Italia que en China, a pesar de que todos los grupos de edad en Italia tenían una tasa de supervivencia más alta. Este hallazgo aparentemente contradictorio demuestra cómo las tendencias agregadas pueden oscurecer la dinámica de los subgrupos.

Desafíos en la investigación médica

La paradoja de Simpson presenta desafíos en los estudios médicos, particularmente cuando se evalúa la eficacia de los medicamentos. Un fármaco puede demostrar eficacia general, pero resultar menos eficaz que un placebo cuando se analiza por subgrupos (p. ej., género). Decidir si se aprueba un medicamento de este tipo requiere una consideración cuidadosa: ¿se debe priorizar el resultado general o las inconsistencias de los subgrupos deben generar preocupación?

El enfoque científicamente más sólido es realizar más investigaciones para determinar el alcance de los factores de confusión y garantizar que las relaciones causales se identifiquen adecuadamente. No hay atajos para realizar un análisis riguroso a la hora de desenredar las correlaciones de los efectos genuinos.

En conclusión, la paradoja de Simpson nos recuerda que las estadísticas, aunque poderosas, no son infalibles. Es esencial aplicar un enfoque crítico al análisis de datos, incluido el examen de subgrupos y la consideración de influencias ocultas, para evitar conclusiones engañosas.