Paradoks Simpsona
Często oceniamy efektywność danej metody leczenia czy programów socjalnych na podstawie odsetka populacji, któremu pomagają. Ale to może wiązać się z pewnymi problemami.
Załóżmy, że mamy do czynienia z chorobą, która dotyka zarówno ludzi, jak i koty, i w grupie leczonych złożonej z 1 kota i 4 osób, 1 kot i 1 osoba zdrowieją, a 3 pozostałe umierają. a w grupie 4 kotów i 1 osoby, której nie leczymy, 3 koty zdrowieją, a 1 kot i 1 osoba umierają.
W rzeczywistości liczby te będą raczej na poziomie 300 i 100 czy podobnym, ale to bez znaczenia.
W przykładzie posłużymy się mniejszymi wartościami ze względów praktycznych. Tak więc w naszej próbie 100 proc. leczonych kotów przeżywa i 75 proc. kotów przeżywa z grupy nieleczonej, z grupy leczonej przeżywa 25 proc. osób i 0 proc. osób z grupy nieleczonej.
To może sugerować, że leczenie zwiększa szansę wyzdrowienia.
Szkopuł w tym, gdy zagregujemy te dane, tylko 40 proc. ludzi i kotów z grupy leczonych przeżywa, a w grupie nieleczonych kotów i ludzi 60% z nich wraca do zdrowia. To może sugerować, że leczenie zmniejsza szanse powrotu do zdrowia.
Zatem który wniosek jest poprawny?
To jest przykład paradoksu Simpsona, paradoksu statystycznego mówiącego o tym, że z tego samego zbioru danych można wyciągnąć dwa sprzeczne wnioski w zależności od tego jak pogrupujemy dane. Co więcej, nie można go rozwiązań na bazie samej statystyki. W tym celu musimy sięgnąć poza statystykę i spróbować zrozumieć relacje przyczynowo skutkowe analizowanego problemu.
Na przykład, jeśli wiemy, że ludzie daną chorobę przechodzą gorzej i stąd leczenie jest silniej uzasadnione, więc fakt, że mniejsza liczba osób leczonych przeżywa ma sens, nawet jeśli samo leczenie zwiększa szanse wyzdrowienia, ponieważ osoby leczone już od początku miały niższe prawdopodobieństwo przeżycia.
Z drugiej strony, gdybyśmy wiedzieli, że ludzie, niezależnie od tego, jak bardzo są chorzy i częściej otrzymują leczenie niż koty, ponieważ nikomu nie jest w smak płacić za weterynarza, fakt, że 4 na 5 ludzi zmarło, podczas gdy tylko 1 na 5 kotów zmarł, to rzeczywiście można dojść do wniosku, że leczenie faktycznie może być złym wyborem.
Zatem planując kontrolowany eksperyment musisz się upewnić, by żadne czynniki mogące wpływać przyczynowo na eksperyment nie wpływały na wybór próby badawczej. Jeśli przeprowadzasz eksperyment bez grupy kontrolnej, to musisz upewnić się, że te czynniki uwzględnisz w wynikach.
Nieco bardziej przyziemny przykład.
Wyniki zestandaryzowanych testów wśród ośmioklasistów ze stanu Wisconsin są konsekwentnie wyższe niż ich rówieśników z Teksasu, więc można by wnioskować, że w Wisconsin edukacja jest na lepszym poziomie. Jeśli jednak wyniki podzielić ze względu na rasę, która ze względów na różne czynniki socjoekonomiczne ma wpływ na wyniki takich testów – uczniowie z Teksasu osiągali generalnie lepsze wyniki w każdej z grup.
Uczniowie czarnoskórzy z Teksasu osiągali lepsze wyniki niż dzieci z tej grupy z Wisconsin, podobnie w grupie latynosów i białych. Różnica w ogólnym rankingu z faktu, że w Wisconsin jest proporcjonalnie mniej czarnoskórych i Latynosów uczniów i proporcjonalnie więcej białych studentów niż Teksas.
Zatem na pewno z tych danych nie można wyciągnąć wniosku o wyższości systemu edukacyjnego w Wisconsin, lecz co najwyżej, że w stanie tym mieszka więcej uczniów z uprzywilejowanych warstw społecznych.
Zatem zrozumienie kontekstu przyczynowego skutkowego wyników badania statystycznego może mieć znaczące skutki społeczne.
W niektórych przypadkach paradoks Simpsona można łatwo zwizualizować jako oddzielne linie trendu podążające w tych samych kierunkach, ale ogólny trend dla danej populacji podąża w przeciwnym.
Dla przykładu teza, że więcej pieniędzy czyni ludzi i koty mniej szczęśliwymi, ale jeśli wyjściowo koty są zamożniejsze i szczęśliwsze od ludzi, to zagregowany trend może sugerować, że wyższa zamożność prowadzi do mniejszego szczęścia.
W tym przypadku bycie kotem czyni cię szczęśliwszym, ale zarazem koreluje z posiadaniem większej ilości pieniędzy. Możesz również błędnie zinterpretować ten wykres i wnioskować, że ogólnie rzecz biorąc, więcej pieniędzy czyni z ciebie kota, co świetnie ilustruje fakt jak łatwo kłamać lub wyciągać błędne wnioski ślepo posługując się statystyką bez uwzględnienia kontekstu.
Oczywiście nie oznacza to, że statystyka zawsze prowadzi do paradoksów lub mylnych wniosków. Niekiedy wszystko nabiera sensu od samego początku. Na przykład, jeśli ludzie i koty stają się mniej szczęśliwi, gdy ofiarujemy im więcej pieniędzy i koty są jednocześnie uboższe i mniej szczęśliwe od ludzi, wtedy ogólny trend nie wykazuje paradoksu.
Więcej pieniędzy oznacza mniej szczęścia. Ale trzeba pamiętać, że paradoksy takie jak ten opisany przez Simpsona występują i wtedy potrzeba ująć dane w kontekście by zrozumieć ich sens.
Zobacz na: COVID – dlaczego terminologia ma znaczenie? – dr Malcolm Kendrick
Bezwzględna redukcja ryzyka: Twoja tajna broń w ocenie literatury medycznej – Prof. Brandon Dyson
Zmiany definicji terminu “szczepionka” przez CDC, a koncept Odporności Stada
Kiedy WHO zmieniła definicję odporności stada? Zmiana treści definicji terminu Odporność Stadna. [listopad 2020]