Zanim przejdę do rzeczy, prośba do Ciebie, czytelniku bądź czytelniczko: pomyśl sobie (i zapamiętaj) jakąś przypadkową liczbę od 1 do 20. W jakim celu – o tym trochę dalej.
Już? No to przejdźmy do rzeczy.
Był sobie profesor statystyki, który nowym studentom zwykł zadawać na dzień dobry pracę domową: rzucić monetą tysiąc razy, zapisując wyniki. Zadanie nieskomplikowane, ale nudne, żmudne i męczące – żeby wyrobić ten tysiąc, trzeba wszak rzucać i zapisywać przez godzinę-dwie przynajmniej. Większości studentów oczywiście się nie chciało, więc rzucanie sobie odpuszczali, wyniki po prostu wymyślając. Przecież takiego wymyślonego ciągu nijak nie da się odróżnić od prawdziwego, więc po co się męczyć?
A tu zonk – profesor ledwie rzucał okiem na kartkę i bez pudła rozpoznawał, kto faktycznie rzucał, a kto zmyślał. Ani chybi magia albo telepatia, bo jakże by inaczej?
Wyjaśnienie, o czym profesor informował po sprawdzeniu prac, było bardzo proste – rachunek prawdopodobieństwa, nawet na tak banalnym poziomie jak wyniki rzutów monetą, wcale nie jest tak intuicyjny, jak sądzimy. Wymyślone wyniki pasowały do intuicyjnego wyobrażenia o wyglądzie losowego ciągu, w rzeczywistości jednak mocno od niego odstawały, prezentując się dużo bardziej regularnie i przewidywalnie, niż się ich autorom wydawało.
Weźmy taki przykład: który z poniższych ciągów orłów i reszek jest bardziej prawdopodobny?
OROROR
OOOOOO
Intuicja oczywiście podpowiada, że ten pierwszy. Ale bynajmniej: obie sekwencje są dokładnie tak samo prawdopodobne, więc w tysiącu rzutów powinny nam się trafić z grubsza tyle samo razy (około ośmiu, gdyby ktoś chciał wiedzieć – choć rozrzut może być spory, więc w praktyce od kilku do kilkunastu). Nieuczciwi studenci nie brali tego pod uwagę i w ich wynikach serie naprzemiennych wyników pojawiały się raz po raz, natomiast dłuższe ciągi samych orłów bądź samych reszek nie występowały praktycznie wcale. Profesorowi wystarczało zatem poszukać wzrokiem wielokrotnych powtórzeń tej samej litery – jeśli znajdował je bez trudu w wielu miejscach, to w porządku; jeśli nie, to student musiał oszukiwać. Dziecinnie proste, a jakże efektowne i dające do myślenia.
Dla niedowiarków, poniżej wynik tysiąca rzutów wygenerowany losowo (za pomocą komputera, rzecz jasna, bo mi też by się nie chciało tyle rzucać)…
RRROROROORRROROORROORRRROORROOORROROROOOORRRRRRRROOOOOROOORORORRRORRRRORRROOROR RROOOROROOOROOROOOROOOOORRORORROOORRROOOROROOOOROOOOORRRRROOORRORROORROOROROORO ORRRRRROOROROORRRORRRRORRRORROROOOORRRORRRRRORROORROROORRORRORORRORROROOOOORRRO OROOROORORROROORRRRRRORRRRRROORROOORRRROOORROORROROROOROOROOOROORRRROOOROROORRR ROOOORRRRORRORRORRORRORROOORRRORRRRROOROROOOOOROROORROOOROOOORORROROOOROROOOROO OORRRRROORRORRRRRORRRRORROROORRRRRORRROROROORORROORROORORRROOROOOOROROOROOROORO ORRRROOOROOOORORORRRRRRRORRORRRRRRRRRRORRRROROORROOORROROORRORROORORORRORORROOO ORRROOOOORROOOORROROROOROROOOOROROROOROOOOOORRROOOROOOROROORROOROOOORRORROROROO RROOOOROOROORROOROORORORRRROOORROROOORORRRRRRRRRRORORROOOROORROROORRROOOORRORRR OROOROOROOROOORORROOORRRORORRORRORRRROORORRRROOOOOOROORRROROOOOROORRORROOOORROR RRROROOOROORRROOORORRRRRROROORORRROROOORRRRRRRORRORORROROORRRROOOOORRORORROROOO OOOOOOROROOOORORRRROORROROROOROOOORORRORROOOORRRRRRROOORRROROROROORRRRORORRRRRR OOROOOORROORROORRRRRORRRRRORORRORROOOOORRORORRROROOO
…oraz efekt „losowego” stukania w klawiaturę:
ROROORRROORRORORORORORORRORROOORRROOORRROROORORORORROORORRORORORROOORRROORORORR ROOORROOROROROROROOROROOROROOROROORRORORORRRORORORORROOORORRORORROOROROROOORROO ROROORORORORROROROROORROORORORORORRRRROROROROROOROROORROOOROROOROOROOROOOROORRO ORORORORROORORORORORORORROROOROROROORROOROROOORORROOROROROOORROOOROROROROOROORR RROORORORORORORRROROROOORROROOROROROOROROROOORORRORORRROORORORORROORRRROORROORO OROROROOORRROOORRORORRORORORRROROORORROOORROROROROROORORORROOOROROROOROROOORORR RROORROORRRORORORORORORRROORROOORROROOROROORORROOOORROORORORRROOORRRROOROORROOR ROROROROROORRROOORRROOORRROORORORORORORROROORROROORORRORORORORRORORRORRRORORRRO OORRORORRORORORORORORORRROROOROROOORORORRRORORRROROROROOROORROROOROROROOORROROR OROROOROROROORORRROORORORRORORORORORORORROORRRROOORRORORORORORRORORORORORRORORO RRORRORORRORORORORROORROROROROROROROROOORORROROORORORORORORORRORORRROORORORORRR OOROORORRORORRRORORORORROROOORRORRRORRORRORORORRRROROOROROROOROROOROORROROROORO RROROROROROOORRORORORRRROROOOROROROROROORRROOROROROR
(Jeśli ktoś ma problem z dostrzeżeniem różnicy, najlepiej wcisnąć ctrl+f i wyszukać ciąg kilku „r” lub kilku „o” – większość przeglądarek ładnie podświetli wszystkie znalezione, pozwalając ocenić gołym okiem, gdzie jest ich więcej.)
Z drugiej strony medalu, ocenianie poziomu losowości jakiegoś ciągu też wcale nie jest intuicyjne. Profesor wiedział jak to robić, bo znał się na rzeczy – gdyby zamiast tego ufał intuicji, zapewne oceniałby studentów na odwrót, jako że – paradoksalnie – prawdziwe wyniki rzucania monetą wyglądają mniej „losowo”, niż te zmyślone.
Tu znowu przykład z życia wzięty: firma, w której kiedyś pracowałem, w ramach robienia dobrze pracownikom wymyśliła pseudokonkurs – codziennie z całej kadry losowano cztery osoby, które otrzymywały symboliczną nagrodę. Skrypt losujący napisałem ja – i początkowo zadowoliłem się prostym losowaniem ludzi z listy, dbając tylko o to, żeby nikt nie wygrał dwa razy jednego dnia. Szybko jednak zaczęły się pretensje: a to, że ktoś wygrał dwa razy w ciągu tygodnia, a to, że X wygrał już trzy razy, a Y jeszcze wcale, a to, że Kowalski dwa razy wygrał w ten sam dzień co Iksiński…
Początkowo próbowałem tłumaczyć, że przecież tak właśnie działa rachunek prawdopodobieństwa – przy kilkudziesięciu osobach i czterech losowaniach dziennie różne mało prawdopodobne przypadki muszą się mimo wszystko zdarzać stosunkowo często i wynika to wyłącznie z dużej liczby losowań. 90% pracowników stanowili programiści, więc wydawałoby się, że takie tłumaczenie wystarczy – ale nie, pretensji i teorii spiskowych tylko przybywało. Nie pomagało ani to, że kod był ogólnodostępny i każdy mógł się doświadczalnie przekonać o jego uczciwości, ani to, że ja sam po kilku tygodniach zabawy miałem mniej wygranych niż statystyczna średnia. Wiele, oj wiele to mówi o ludzkiej psychice.
W końcu odpuściłem i skrypt zmodyfikowałem: prawdopodobieństwo wygranej zaczęło zależeć od daty poprzedniej (im dawniej, tym większa szansa), a zwycięzcy z ostatniego tygodnia w ogóle przestali być brani pod uwagę. I jak ręką odjął – w ciągu paru kolejnych tygodni wszelkie zastrzeżenia zniknęły i nikt już nie miał wątpliwości, że skrypt losuje jak trzeba. Właśnie dzięki temu, że losowość ograniczyłem! Nie chodziło bowiem o to, żeby wyniki zgadzały się z rachunkiem prawdopodobieństwa, tylko o to, żeby zgadzały się z intuicją…
A teraz wróćmy do sprawy z początku notki. Przypadkowa liczba od 1 do 20, pamiętasz jeszcze? No to spróbuję ją teraz odgadnąć: Siedemnaście? Siedem? Trzynaście? Dziewiętnaście?
Zgadłem czy nie, każdy już się chyba domyśla, o co chodzi: wybór, wbrew intencjom, wcale nie był taki znowu losowy – jak zbadano, prawie połowa ludzi wybiera tu którąś z czterech powyższych liczb. Co więcej, ponad połowa wybiera jakąś liczbę pierwszą, a prawie dwie trzecie – nieparzystą. Intuicyjnie bowiem postrzegamy takie liczby jako bardziej „losowe” niż np. 4 czy 20 – choć przecież wiemy (a przynajmniej powinniśmy wiedzieć), że każda liczba jest dokładnie tak samo prawdopodobna…Z czego to wszystko wynika? Cóż, nasze podejście do losowości cechuje się specyficzną wewnętrzną sprzecznością: z jednej strony losowość kojarzy nam się – słusznie – z chaosem (stąd preferencja dla liczb pierwszych i nieparzystych, jako że one również tak się kojarzą, stąd też awersja wobec dłuższych ciągów samych orłów/reszek, które odbieramy jako zbyt mocno uporządkowane), z drugiej strony mózg jest wyspecjalizowany w szukaniu wszędzie wzorców i prawidłowości, więc odtwarzanie tego chaosu mu nie wychodzi – choćby się nie wiem jak starać, podświadomie zawsze dążymy do jakiegoś schematu, czy to przy wymyślaniu wyników rzutów monetą, czy to przy ocenianiu wyników losowań, czy to w masie innych tego typu sytuacji. A że przypadek to coś banalnego, z czym każdy ma do czynienia codziennie, to często nadmiernie ufamy swoim osądom w tych kwestiach.
Stąd i teorie spiskowe (vide „seryjny samobójca”, będący najpewniej zwykłą fluktuacją prawdopodobieństwa, wzmocnioną medialnie przez wzrost zainteresowania kolejnymi przypadkami), stąd i popularność loterii czy hazardu (a skoro przy tym jesteśmy: im więcej razy z rzędu na ruletce wypadną czarne, tym więcej graczy stawia w kolejnej rundzie na czerwone i vice wersa, choć prawdopodobieństwo dla obu kolorów pozostaje niezmiennie takie samo – awersja do długich ciągów znów się kłania), stąd rozliczne przesądy i myślenie magiczne, stąd też sukcesy rzekomych jasnowidzów i innych szarlatanów, poza ludzką naiwnością wykorzystujących także nieumiejętność szacowania prawdopodobieństwa różnych zdarzeń (dzięki czemu łatwo stworzyć wrażenie, że przepowiednie fantastycznie się sprawdzają, gdy w rzeczywistości skuteczność jest zaledwie taka, jak dla ślepego trafu) – i tak dalej, i tak dalej.
A jaki z tego wniosek? Bardzo prosty: rachunek prawdopodobieństwa nie bez kozery nazywa się rachunkiem i w kwestiach z nim związanych nie należy ufać intuicji, tylko twardej matematyce. Ona jedna nas nie oszuka.
Komentarze
Bardzo fajny wpis, świetnie tłumaczy te błędy poznawcze (bo jak inaczej to ująć). Wyślę niematematycznym znajomym;) Pozdrawiam!
Brak polityki, to i dobry wpis ;) Wybrałem 17!
Świetny artykuł, wybrałem 7.
Ponieważ długo żyję i znam to zagadnienie, to wybrałem liczbę 1 i 5/7 (ułamek). Jednak gdybym miał zagrać w tę grę, wybrałbym 19.
Widzę pewną analogię między rachunkiem prawdopodobieństwa, a podejściem do prawdy. Jeśli rachunek nie zgadza się z naszą intuicją to tym gorzej dla rachunku. Jeśli prawda nie jest zgodna z naszymi oczekiwaniami, tym gorzej dla prawdy :)
Wybrałam 7, bo to pierwsza liczba, o której myślę (urodzona 07.07).
Skojarzyło mi się z krzyżówkami biologicznymi, gdzie niezależnie od płci poprzednich dzieci, płeć można zawsze określić z 50% prawdopodobieństwem. Jakie to wszystko połączone :)
Bardzo fajny wpis. Też wybrałem 7. Bez zastanowienia.
Chyba jeszcze nikt nie wytłumaczył mi prawdopodobieństwa w taki sposób. Dzięki, świetnie się czytało.
Znając moje lenistwo, pewnie nie chciałoby mi się stukać RO, tylko napisałbym kawałek kodu, który by mi o wygenerował i test u profesora bym przeszedł :)
A co do liczby to wybrałem 16. Taka, ładna, okrągła IYKWIM :)
Pewnie znasz, ale może nie znasz to się uśmiechniesz: https://xkcd.com/221/