Statistiken können trotz ihres Rufs für Objektivität kontraintuitive Ergebnisse liefern, die sich dem gesunden Menschenverstand widersetzen. Dies ist häufig auf statistische Paradoxien zurückzuführen, wie beispielsweise das Simpson-Paradoxon, bei dem ein Trend in aggregierten Daten auftritt, sich jedoch umkehrt, wenn die Daten in Untergruppen unterteilt werden. Das Verständnis dieser Phänomene ist für eine genaue Forschung und Entscheidungsfindung von entscheidender Bedeutung.
Der Berkeley-Zulassungsfall
Ein berühmtes Beispiel ereignete sich in den 1970er Jahren, als der University of California, Berkeley, Geschlechterdiskriminierung bei der Zulassung von Hochschulabsolventen vorgeworfen wurde. Erste Daten zeigten eine geringere Akzeptanzquote für weibliche Bewerber (35 %) im Vergleich zu männlichen Bewerbern (44 %), was offenbar auf eine Voreingenommenheit hindeutet. Bei der Analyse der Zulassungen nach Abteilungen war jedoch das Gegenteil der Fall: In vier von sechs großen Abteilungen wurden mehr Frauen als Männer aufgenommen.
Die Diskrepanz entstand, weil sich Frauen überproportional auf wettbewerbsintensivere Abteilungen mit insgesamt niedrigeren Annahmequoten bewarben, während Männer sich auf Abteilungen mit mehr offenen Stellen und weniger Bewerbern bewarben. Dies zeigt, wie Gruppierungen zugrunde liegende Trends verzerren können.
Die Ursprünge des Paradoxons
Das Phänomen wurde erstmals 1899 vom Mathematiker Karl Pearson beschrieben und 1903 von George Udny Yule wiederentdeckt. Es blieb jedoch weitgehend unbemerkt, bis Edward Simpson es 1951 offiziell dokumentierte und dem Effekt seinen Namen gab. Simpsons Arbeit verdeutlichte, wie sich Trends je nach Untergruppeneinteilung unterscheiden können.
Auswirkungen auf die reale Welt
Dieses Paradoxon ist nicht nur theoretisch. Im Jahr 2021 zeigten Daten, dass COVID-19 in Italien fast doppelt so tödlich war wie in China, obwohl jede Altersgruppe in Italien eine höhere Überlebensrate aufwies. Dieser scheinbar widersprüchliche Befund zeigt, wie aggregierte Trends die Dynamik von Untergruppen verschleiern können.
Herausforderungen in der medizinischen Forschung
Das Simpson-Paradoxon stellt in medizinischen Studien eine Herausforderung dar, insbesondere bei der Bewertung der Wirksamkeit von Arzneimitteln. Ein Medikament kann insgesamt wirksam sein, sich jedoch bei der Analyse nach Untergruppen (z. B. Geschlecht) als weniger wirksam als ein Placebo erweisen. Die Entscheidung, ob ein solches Medikament zugelassen werden soll, erfordert sorgfältige Überlegungen: Sollte das Gesamtergebnis Vorrang haben oder sollten Inkonsistenzen zwischen Untergruppen Anlass zur Sorge geben?
Der wissenschaftlich fundierteste Ansatz ist eine weitere Untersuchung, um das Ausmaß der Störfaktoren zu bestimmen und sicherzustellen, dass kausale Zusammenhänge ordnungsgemäß identifiziert werden. Es gibt keine Abkürzung zu einer gründlichen Analyse, wenn es darum geht, Korrelationen von echten Effekten zu trennen.
Zusammenfassend lässt sich sagen, dass Simpsons Paradoxon uns daran erinnert, dass Statistiken zwar aussagekräftig, aber nicht narrensicher sind. Ein kritischer Ansatz bei der Datenanalyse, einschließlich der Untersuchung von Untergruppen und der Berücksichtigung versteckter Einflüsse, ist unerlässlich, um irreführende Schlussfolgerungen zu vermeiden.
