Paradoksy statystyczne: dlaczego liczby mogą oszukiwać

20

Statystyka, pomimo swojej reputacji obiektywnej, może dawać wyniki sprzeczne z intuicją, sprzeczne ze zdrowym rozsądkiem. Dzieje się tak często z powodu paradoksów statystycznych, takich jak paradoks Simpsona, gdzie wzór pojawia się w danych zagregowanych, ale ulega odwróceniu, gdy dane są podzielone na podgrupy. Zrozumienie tych zjawisk ma kluczowe znaczenie dla dokładnych badań i podejmowania decyzji.

Sprawa przyjęć do Berkeley

Słynny przykład miał miejsce w latach 70. XX wieku, kiedy Uniwersytet Kalifornijski w Berkeley został oskarżony o dyskryminację ze względu na płeć podczas przyjęć na studia magisterskie. Wstępne dane wykazały niższy wskaźnik akceptacji w przypadku kobiet (35%) w porównaniu z mężczyznami (44%), co wydaje się wskazywać na stronniczość. Jednak analiza przyjęć według wydziałów wykazała coś odwrotnego: na czterech z sześciu głównych wydziałów przyjęto więcej kobiet niż mężczyzn.

Rozbieżność powstała, ponieważ kobiety nieproporcjonalnie często aplikowały do ​​bardziej konkurencyjnych wydziałów, przy niższych ogólnych wskaźnikach akceptacji, podczas gdy mężczyźni aplikowali do wydziałów, w których było więcej miejsc i mniej kandydatów. To ilustruje, jak klastrowanie może zniekształcać podstawowe trendy.

Początki paradoksu

Zjawisko to zostało po raz pierwszy opisane w 1899 r. przez matematyka Karla Pearsona, a następnie ponownie odkryte przez George’a Yule w 1903 r. Jednak pozostało w dużej mierze niezauważone do czasu, gdy Edward Simpson formalnie je udokumentował w 1951 r., nadając efekt jego nazwie. Praca Simpsona uwypukliła, jak trendy mogą się zmieniać w zależności od podziału na podgrupy.

Prawdziwe konsekwencje

Paradoks ten nie jest jedynie ćwiczeniem teoretycznym. Dane z 2021 r. wykazały, że Covid-19 był prawie dwukrotnie bardziej śmiertelny we Włoszech niż w Chinach, mimo że wskaźniki przeżywalności były we Włoszech wyższe w każdej grupie wiekowej. To pozornie sprzeczne z intuicją odkrycie pokazuje, jak zagregowane trendy mogą przesłaniać dynamikę podgrup.

Problemy w badaniach medycznych

Paradoks Simpsona stwarza problemy w badaniach medycznych, zwłaszcza przy ocenie skuteczności leków. Lek może wykazywać ogólną skuteczność, ale być mniej skuteczny niż placebo, jeśli analizuje się go w podziale na podgrupy (na przykład według płci). Decyzja o zatwierdzeniu takiego leku wymaga dokładnego rozważenia: czy priorytetem powinien być ogólny wynik, czy też problemem powinny być dysproporcje w podgrupach?

Podejściem najbardziej opartym na dowodach są dalsze badania mające na celu określenie zakresu wpływu czynników zakłócających i zapewnienie prawidłowego ustalenia związków przyczynowych. Nie ma obejść konieczności rygorystycznej analizy oddzielającej korelacje od rzeczywistych efektów.

Podsumowując, Paradoks Simpsona przypomina nam, że statystyki, choć potężne, nie są nieomylne. Aby uniknąć mylących wniosków, konieczne jest krytyczne podejście do analizy danych, obejmujące testowanie podgrup i uwzględnianie ukrytych wpływów.