Statistiky, navzdory své pověsti objektivity, mohou produkovat neintuitivní výsledky, které odporují zdravému rozumu. K tomu často dochází v důsledku statistických paradoxů, jako je Simpsonův paradox, kde se vzorec objevuje v agregovaných datech, ale je obrácen, když jsou data rozdělena do podskupin. Pochopení těchto jevů je zásadní pro přesný výzkum a rozhodování.
Případ pro Berkeley Admissions
Slavný příklad nastal v 70. letech, kdy byla Kalifornská univerzita v Berkeley obviněna z genderové diskriminace při přijímání na postgraduální školy. Počáteční údaje ukázaly nižší míru přijetí u žen (35 %) ve srovnání s muži (44 %), což by mohlo naznačovat zaujatost. Když se však přijetí analyzovalo podle oddělení, byl zjištěn opak: na čtyřech ze šesti hlavních oddělení bylo přijato více žen než mužů.
Nesrovnalosti vznikly proto, že ženy se neúměrně hlásily do více konkurenceschopných oddělení s nižší celkovou mírou přijetí, zatímco muži se hlásili do oddělení s větším počtem míst a méně uchazečů. To ukazuje, jak shlukování může narušit základní trendy.
Origins of Paradox
Tento jev byl poprvé popsán v roce 1899 matematikem Karlem Pearsonem a poté znovu objeven Georgem Yulem v roce 1903. Zůstal však téměř bez povšimnutí, dokud jej Edward Simpson v roce 1951 formálně nezdokumentoval, čímž se projevil jeho název. Simpsonova práce zdůraznila, jak se trendy mohou měnit v závislosti na rozdělení podskupin.
Skutečné důsledky
Tento paradox není jen teoretickým cvičením. V roce 2021 data ukázala, že COVID-19 byl v Itálii téměř dvakrát smrtelnější než v Číně, přestože míra přežití je v Itálii vyšší ve všech věkových skupinách. Toto zdánlivě kontraintuitivní zjištění ukazuje, jak mohou agregátní trendy zatemnit dynamiku podskupin.
Problémy v lékařském výzkumu
Simpsonův paradox přináší problémy v lékařském výzkumu, zejména při hodnocení účinnosti léků. Lék může vykazovat celkovou účinnost, ale při analýze podle podskupin (například podle pohlaví) může být méně účinný než placebo. Rozhodnutí, zda schválit nebo neschválit takový lék, vyžaduje pečlivé zvážení: měl by být upřednostněn celkový výsledek, nebo by se měly znepokojovat rozdíly v podskupinách?
Přístupem nejvíce založeným na důkazech je další studium, které má určit rozsah vlivu matoucích faktorů a zajistit, aby byly kauzální vztahy stanoveny správně. Neexistují žádná řešení pro pečlivou analýzu při oddělování korelací od skutečných efektů.
Na závěr nám Simpson’s Paradox připomíná, že statistiky, i když jsou mocné, nejsou neomylné. Aby se zabránilo zavádějícím závěrům, je nutný kritický přístup k analýze dat, včetně testování podskupin a zvážení skrytých vlivů.




















