Dlaczego łatwiej przewidzieć zmianę klimatu niż konkretną prognozę pogody?

z cyklu Jak budować dobre intuicje statystyczne, część 1

Obszar kompozycji 6.jpg
 

Dzisiejszy wpis to pierwszy z cyklu artykułów o statystyce. Spróbuję opowiedzieć w nich o metodach statystycznych używanych przy podejmowaniu decyzji oraz o najczęstszych błędach, które popełniamy analizując statystyczne wyniki.

Zacznijmy od 2 typów błędów, które często popełniamy i które w uproszczeniu można nazwać tak:

  1. Oceniamy grupę na postawie jednostki.

  2. Oceniamy jednostkę na podstawie grupy.

W idealnym przypadku człowiek powinien wykorzystać każdą dostępną informację aby zaktualizować swoją wiedzę o świecie. Dotyczy to zarówno generalnych trendów jak i informacji o przypadkach jednostkowych. W praktyce jednak nie analizujemy każdej informacji, tylko polegamy na pewnych skrótach myślowych, które czasem wodzą nas na manowce. Dobrze opisuje je Daniel Kahneman w książce "Pułapki myślenia. O myśleniu szybkim i wolnym".

Celem tego artykułu jest zwrócenie uwagi na możliwe błędy w naszych intuicjach o częstotliwości występowania pewnych zjawisk (a więc o zależnościach statystycznych).

 

Ad 1. Ocenianie grupy (trendu) na podstawie sytuacji jednostkowych. Inaczej mówiąc, jest to wyciąganie zbyt daleko idących wniosków na podstawie zbyt małej ilości danych.

2.png

Przykłady:

Czytałam w gazecie że grupa Polaków ukradła drogi samochód. Polacy to złodzieje.

[przypadek jednostkowy -> błędny wniosek co do grupy]

Teoria o ociepleniu klimatu to ściema. Zobaczcie jaki mamy mróz za oknem!

[błędny wniosek co do trendu <- przypadek jednostkowy]

Z punktu widzenia psychologii, powyższy błąd jest skutkiem zasady WYSIWTI czyli What you see is what there is. Nasz mózg interpretuje tylko to co widzi i głównie na tej podstawie wyciąga wnioski. Gdy ktoś zada mi pytanie: czy Polacy częściej kradną niż inne nacje? Mój mózg automatycznie zastąpi ten problem o wiele prostszym pytaniem: czy słyszałem ostatnio o Polaku który ukradł auto? Odpowiem oczywiście intuicyjnie.

Wnioskowanie z przypadków jednostkowych (wyjątkowych) nosi nazwę dowodu anegdotycznego. Błąd ten spowodowany jest przez mechanizm, który nazywa się w psychologii zasadą spójności historii: im mniej danych posiadamy, tym paradoksalnie łatwiej zbudować spójną teorię (historię) na ich temat, gdyż nie musimy tłumaczyć nią zbyt wielu przypadków.

Niestety bardzo trudno bronić się przed tego typu błędami. Jako ludzie mamy wrodzoną tendencję do uogólniania. Trzeba powiedzieć że ten mechanizm jest generalnie przydatny i kluczowy do upraszczania otaczającej nas rzeczywistości. Gdybyśmy za każdym razem mieli analizować wszystkie dane, nie bylibyśmy w stanie podjąć żadnej decyzji.

Jak więc temu przeciwdziałać? Starajmy się nie wyciągać daleko idących wniosków na podstawie małej ilości danych.

Warto dodać że ludzie często szukają przykładów które tylko potwierdzają ich własne teorie. Jest to tzw. efekt potwierdzenia (confirmation bias). Dobrym przykładem jest właśnie zdanie: Teoria o ociepleniu klimatu to ściema. Zobaczcie jaki mamy mróz za oknem! Ktoś kto nie wierzy w zmianę klimatu, będzie szukał tylko tych dowodów które potwierdzają jego stanowisko. Aby się bronić przez tym błędem,

należy aktywnie szukać takich informacji
które mogą podważyć nasze dotychczasowe teorie.

Im bardziej ogólna teoria (np. wszystkie łabędzie są białe) tym łatwiej znaleźć kontrprzykład który ją obala (znalazłem czarnego łabędzia). Dlatego starajmy się niuansować uogólnienia jakimi posługujemy się na co dzień (większość gatunków łabędzi występujących w Polsce jest białych).

 

Ad 2. Drugi błąd to pochopna ocena jednostki na podstawie statystyk grupowych. Inaczej mówiąc, jest to nieprawidłowe przełożenie wartości statystycznych na prawdopodobieństwo sytuacji jednostkowej.

2_5.png

Przykłady:

Polacy kradną najwięcej aut w Niemczech, prawie 4 razy więcej niż drudzy w rankingu Turcy. Powinienem unikać Polaków w Niemczech.

[statystyka grupowa -> błędny wniosek jednostkowy]

→ Jak to jest, że potrafimy dokładnie przewidzieć ocieplenie klimatu, a nie potrafimy przewidzieć pogody za 14 dni?

[statystyczny trend -> błędny wniosek jednostkowy]

Powyższe błędy są skutkiem zbyt dużego zaufania do informacji o grupie (trendzie). Statystyki pozwalają przewidywać sytuacje jednostkowe, ale tylko z pewną dokładnością. Informacja o przynależności do grupy lub trendu stanowi tylko jedno z wielu czynników opisujących sytuację jednostkową. Spróbujmy to wyjaśnić na przykładach:

car.png

→ Statystyka grupowa: Polacy kradną najwięcej aut w Niemczech, prawie 4 razy więcej niż drudzy w rankingu Turcy.

→ Poprawny wniosek: Informacja o tym, że ktoś jest złodziejem może nam coś powiedzieć o jego narodowości, ale nie na odwrót. Przyjeżdżając do Niemiec, o wiele bardziej powinienem zwracać na czynniki takie jak: gdzie ma miejsce najwięcej kradzieży, jakiego typu auta są kradzione. Analiza tych czynników da mi o wiele większą informację o ewentualnym ryzyku kradzieży.

Wyjaśnienie: W danych w 2019 roku w Niemczech zarejestrowanych było było 47,1 mln aut. Skradziono 14 229 aut, co stanowi 0,03% wszystkich samochodów. Polacy byli odpowiedzialni za 30% kradzieży w Niemczech, Turcy za około 8% kradzieży. Prawdopodobieństwo że moje auto zostanie skradzione w Niemczech przez Turków wynosi 0,0024%, a przez Polaków 0,0090%. Wniosek jest taki, że Polacy częściej odpowiedzialni są za kradzieże, ale różnica w ogólnym rachunku prawdopodobieństwa jest bardzo mała. Racjonalne jest założenie, iż obie sytuacje jednostkowe (kradzież mojego auta przez osoby różnych narodowości) są bardzo mało prawdopodobne.

Warto dodać, że na podstawie wyżej wymienionych danych nie jesteśmy w stanie wywnioskować jakie jest prawdopodobieństwo że napotkany Polak lub Turek to potencjalny złodziej. Nie posiadamy informacji co do ilości złodziei danej narodowości (jedna grupa przestępcza może w danym roku ukraść bardzo wiele aut).

Zakładając pesymistyczny przypadek, to jest że każdy samochód został ukradziony przez innego Polaka, otrzymujemy 4268 unikatowych polskich złodziei. Jeśli założymy że w Niemczech przebywa 1,5 mln Polaków, oznacza to że tylko 0,2% nich to złodzieje. Wniosek jest taki, że w kontraście do intuicji którą zbudowaliśmy po przeczytaniu policyjnych statystyk, informacja o narodowości danej osoby nie daje nam wystarczających podstaw do obiektywnej oceny ryzyka kradzieży.

weather.png

→ Statystyka grupowa: Potrafimy przewidzieć ocieplenie klimatu z dużą dokładnością.

→ Poprawny wniosek: Wpływ globalnego trendu na konkretną pogodę za 14 dni będzie bardzo mały.

Wyjaśnienie: Na pogodę w danym dniu składa się bardzo, bardzo wiele czynników. Za każdym razem kiedy przewidujemy sytuację indywidualną w środowisku niezamkniętym i nieizolowanym, musimy się liczyć że nasz model zostanie zaburzony przez czynniki z zewnątrz. Dodatkowo obserwujemy tutaj tzw. efekt motyla, czyli fakt że mała zmiana warunków początkowych prowadzi w czasie do bardzo dużych konsekwencji.

To skąd wiemy że klimat się zmienia? Z uśredniania wyników dla wielu pomiarów i porównywania ich w czasie. Wzrost średniej temperatury na świecie to faktyczna tendencja którą obserwujemy od lat. Do stwierdzenia problemu systemowego jakim jest ocieplenie klimatu wystarczy nam potwierdzenie tej tendencji, nie musimy bazować na dowodach anegdotycznych. Z drugiej strony ta tendencja jest na tyle mała, że w niewielkim stopniu wpłynie na przewidywaną pogodę w konkretnym miejscu na Ziemi.

 

Statystyka bazuje na agregacji danych i wyciąganiu wniosków ze średniej. Tego typu podejście słabo przewiduje sytuacje indywidualne (bo te zależą od wielu innych czynników), ale za to dobrze wykrywa systemowe uprzedzenia oraz globalne tendencje.

 

Zachęcamy do zapoznania się z grafem argumentacji który przedstawia najważniejsze tezy zawarte w artykule. Dodaliśmy ostatnio emotikony które pozwalają głosować na te tezy które są dla Was ważne ⭐ i te które dały Wam do myślenia 💡.

Podsumowanie

Dane statystyczne powinny odpowiednio aktualizować naszą wiedzę o świecie. Ignorowanie statystyki przy podejmowaniu decyzji skutkuje błędem o nazwie zaniedbywanie miarodajności (base-rate fallacy), o którym opowiem w kolejnych wpisach.

Z drugiej strony musimy nauczyć się rozpoznawać sytuacje, w których nasz mózg stosuje zbyt duże uproszczenia. Są to na przykład:

→ tworzenie uogólnień na podstawie małej ilości danych oraz

→ szufladkowanie jednostek na podstawie ich przynależności grupowej.

Dlatego przy analizie danej sytuacji zawsze warto brać pod uwagę szerszy kontekst.

3.png

Pamiętajmy że prawda zależy od kontekstu, inaczej jest bezwartościowa. Informacja osadzona w kontekście jest zawsze bardziej praktyczna (ma tzw. większą moc predykcyjną czyli zdolność do przewidywania przyszłości). Przytoczę tutaj następujący przykład, który podaję za każdym razem gdy dyskutuję z osobami dla których obiektywność informacji jest o wiele ważniejsza niż w ich użyteczność (kontekst).

Jesteśmy świadkiem rozprawy rozwodowej w sądzie. Z oświadczenia prawnika ktoś przeczytał tylko jedno zdanie: “26 kwietnia żona zdradziła męża”. Jest to zdanie prawdziwe, obiektywna informacja. Jednak czy na podstawie tego jednego zdania możemy cokolwiek powiedzieć o tej kobiecie? Przecież nie wiemy nic o tym jak wyglądało ich małżeństwo, jak zachowywał się mąż. Być może kobieta ta żyła w piekle przez całe życie, a męża zdradziła tylko raz.

Nasuwa się pytanie: czy jakiekolwiek decyzje podjęte po przeczytaniu tylko tego jednego zdania będą słuszne? Lub ogólniej: czy bez szerszego kontekstu jesteśmy w stanie wyciągnąć jakiekolwiek sensowne wnioski z obiektywnych informacji?

Te otwarte pytania zostawiam Wam do przemyślenia.

 

Podsumowując życzę wszystkim żebyśmy każdego dnia potrafili ustrzegać się intuicyjnych błędów oraz pochopnych ocen i decyzji, które mogą rzutować na nas i na innych ludzi.

Na koniec zostawiam Wam zagadkę do przemyślenia:

W mieście o populacji 1 miliona osób, znajduje się 100 terrorystów i 999 900 praworządnych ludzi. Zainstalowany system bezpieczeństwa posiada następujące parametry:

→ istnieje 1% szansy, że system zwróci wynik fałszywie dodatni (tj. 1 na 100 praworządnych obywateli zostanie rozpoznany jako terrorysta)

→ istnieje 1% szansy, że system zwróci wynik fałszywie ujemny (tj. 1 na 100 terrorystów zostanie rozpoznany jako praworządny obywatel)

Przypuśćmy, że przypadkowy mieszkaniec włączył alarm w systemie. Jaka jest szansa, że mieszkaniec ten jest faktycznie terrorystą?

 
Previous
Previous

Jak gry kwantowe mogą pomóc usprawnić proces decyzyjny?

Next
Next

Czy rozum jest uniwersalny?