Nejnovější zprávy a články

Statistické paradoxy: Proč mohou čísla klamat

02.04.2026

Statistiky, navzdory své pověsti objektivity, mohou produkovat neintuitivní výsledky, které odporují zdravému rozumu. K tomu často dochází v důsledku statistických paradoxů, jako je Simpsonův paradox, kde se vzorec objevuje v agregovaných datech, ale je obrácen, když jsou data rozdělena do podskupin. Pochopení těchto jevů je zásadní pro přesný výzkum a rozhodování.

Případ pro Berkeley Admissions

Slavný příklad nastal v 70. letech, kdy byla Kalifornská univerzita v Berkeley obviněna z genderové diskriminace při přijímání na postgraduální školy. Počáteční údaje ukázaly nižší míru přijetí u žen (35 %) ve srovnání s muži (44 %), což by mohlo naznačovat zaujatost. Když se však přijetí analyzovalo podle oddělení, byl zjištěn opak: na čtyřech ze šesti hlavních oddělení bylo přijato více žen než mužů.

Nesrovnalosti vznikly proto, že ženy se neúměrně hlásily do více konkurenceschopných oddělení s nižší celkovou mírou přijetí, zatímco muži se hlásili do oddělení s větším počtem míst a méně uchazečů. To ukazuje, jak shlukování může narušit základní trendy.

Origins of Paradox

Tento jev byl poprvé popsán v roce 1899 matematikem Karlem Pearsonem a poté znovu objeven Georgem Yulem v roce 1903. Zůstal však téměř bez povšimnutí, dokud jej Edward Simpson v roce 1951 formálně nezdokumentoval, čímž se projevil jeho název. Simpsonova práce zdůraznila, jak se trendy mohou měnit v závislosti na rozdělení podskupin.

Skutečné důsledky

Tento paradox není jen teoretickým cvičením. V roce 2021 data ukázala, že COVID-19 byl v Itálii téměř dvakrát smrtelnější než v Číně, přestože míra přežití je v Itálii vyšší ve všech věkových skupinách. Toto zdánlivě kontraintuitivní zjištění ukazuje, jak mohou agregátní trendy zatemnit dynamiku podskupin.

Problémy v lékařském výzkumu

Simpsonův paradox přináší problémy v lékařském výzkumu, zejména při hodnocení účinnosti léků. Lék může vykazovat celkovou účinnost, ale při analýze podle podskupin (například podle pohlaví) může být méně účinný než placebo. Rozhodnutí, zda schválit nebo neschválit takový lék, vyžaduje pečlivé zvážení: měl by být upřednostněn celkový výsledek, nebo by se měly znepokojovat rozdíly v podskupinách?

Přístupem nejvíce založeným na důkazech je další studium, které má určit rozsah vlivu matoucích faktorů a zajistit, aby byly kauzální vztahy stanoveny správně. Neexistují žádná řešení pro pečlivou analýzu při oddělování korelací od skutečných efektů.

Na závěr nám Simpson’s Paradox připomíná, že statistiky, i když jsou mocné, nejsou neomylné. Aby se zabránilo zavádějícím závěrům, je nutný kritický přístup k analýze dat, včetně testování podskupin a zvážení skrytých vlivů.

Statistické paradoxy: Proč mohou čísla klamat

Případ pro Berkeley Admissions

Origins of Paradox

Skutečné důsledky

Problémy v lékařském výzkumu

УСПІХ

ОСОБИСТІСТЬ

САМОРОЗВИТОК

ВИБІР РЕДАКТОРА

AI-голосовые помощники трансформируют EdTech: интерактивное обучение для всех

Západní sněhová havárie v rekordním vedru, ohrožuje zásobování vodou

Selhání satelitu SpaceX vyvolává obavy z vesmírného odpadu

ПОПУЛЯРНІ ПОСТИ

Nápisy z doby kamenné naznačují vznik rané formy písma před 40...

Larry Summers opouští Harvard uprostřed vyšetřování Epsteinových vazeb

Udělej si sám: Hráč vytvořil konzoli Tetris v kartonové krabici

ПОПУЛЯРНА КАТЕГОРІЇ

AI-голосовые помощники трансформируют EdTech: интерактивное обучение для всех

Západní sněhová havárie v rekordním vedru, ohrožuje zásobování vodou