Uczestnik teleturnieju dostaje do wyboru dwie koperty. W jednej jest dwa razy więcej pieniędzy niż w drugiej, ale nie wiadomo, która jest która, ani o jakie sumy chodzi. Uczestnik wybiera jedną z kopert i stwierdza, że jest w niej tysiąc złotych. Prowadzący proponuje mu wówczas zamianę kopert.
Bolek i Lolek siedzą przed telewizorem i zaczynają dyskutować, co opłaci się w takiej sytuacji zrobić.
BOLEK: W drugiej kopercie jest albo 500 złotych, albo 2000, a obie możliwości są tak samo prawdopodobne. Zamiana oznacza więc 50% szansy, że się straci 500 złotych i 50% szansy, że się zyska 1000. Statystycznie na zamianie zyskujesz 250 złotych, więc lepiej się zamienić.
LOLEK: Zamiana nic nie daje, oczekiwana wartość zawsze będzie taka sama. Wyobraź sobie, że zamiast jednego uczestnika jest ich dwóch, każdy zagląda do innej koperty i każdy przeprowadza takie samo rozumowanie – gdyby było ono prawidłowe, obaj statystycznie zyskiwaliby na zamianie po 25%, a przecież od wymiany kopert pieniędzy w nich nie przybywa.
Który z nich ma rację i dlaczego ten drugi się myli?
Komentarze
Zajęcia z prawdopodobieństwa nauczyły mnie, że lepiej się zamienić czy zmienić wybór bramki, czemu – kto to wie :P
W takiej sytuacji zamiana nic nie daje.
W przypadku 3 bramek z których jedna zostaje odsłonięta sytuacja jest inna – poznajemy stan jednej z nich, mamy dodatkową informację. Tutaj żadnej informacji nie zyskujemy.
Otwieranie tej pierwszej koperty, to marnowanie pieniędzy. Bo gdyby tak jej nie otworzyć, to po zamianie można byłoby rozumowanie powtórzyć i być kolejne 250 do przodu…
Bolek ma rację, wiedząc że w kopercie jest 1000 złotych, wartość oczekiwana wygranej przy zamianie wynosi 1/22000+1/2500=1250 złotych, a przy braku zamiany oczywiście 1000 złotych.
Lolek nie ma racji, gdyż dwaj gracze nie mogą się obaj na raz w jednej „odsłonie” tej gry znaleźć w posiadaniu tysiąca złotych i możliwości zamiany. Jeśli jeden gracz w swojej „odkrytej” kopercie ma 1000 złotych, drugi ma z prawdopodobieństwem 1/2 500 złotych, z pr. 1/2 2000 złotych. Jeśli więc nie zamieni się, wartość oczekiwana wygranej wyniesie 1/22000+1/2500=1250zł. Jeśli się zamieni, wartość oczekiwana wyniesie 1000zł. Drugiemu graczowi więc nie opłaca się zamieniać, i nie możemy na przykład zakładać, że odsłaniając 2000 złotych, ma on 50% szans na zdobycie 4000 złotych, gdyż jest to sprzeczne z założeniem że drugi gracz wie, że ma w kopercie 1000 złotych.
Tak na poważnie to sytuacja jest trochę bardziej skomplikowana, bo dla kogoś pewne 1000 złotych może być subiektywnie warte więcej niż 50% szansa na 500 złotych i 50% szansa na 2000 złotych. Teoria decyzji zajmuje się optymalnymi strategiami w takich sytuacjach przy bardziej realistycznych założeniach :)
Dyskutowanie o zagadkach matematycznych byłoby łatwiejsze gdyby znak ascii przyjęty za znak mnożenia nie stawał się italicą :)
Czekałem i czekałem, aż ktoś wyjaśni sprawę do końca, ale widzę, że wszyscy udzielili tylko częściowych odpowiedzi i dyskusja wygasła na dobre, więc wyjaśnię sam:
Lolek ma rację, że wymiana nic (statystycznie) nie da – ale też Bolek ma rację, że mając jednakowe szanse na podzielenie lub pomnożenie pieniędzy przez dwa, zyskujemy średnio 25% sumy. Jak to pogodzić? Ano tak, że suma, od której liczymy ten zysk, nie jest stałą niezależną od zawartości drugiej koperty – zyskać możemy tylko jeśli wylosowaliśmy kopertę z mniejszą sumą i na odwrót. Gdyby zatem wielokrotnie losować koperty z różnymi sumami i za radą Bolka każdorazowo iść na wymianę, zyski mielibyśmy procentowo większe, ale liczone od tych mniejszych sum, a straty odwrotnie, więc bilans wyjdzie na zero. Co innego, gdyby po prostu generować losową wyjściową sumę i dawać równe szanse na jej pomnożenie lub podzielenie – wówczas faktycznie taktyka Bolka dawałaby 25% zysku.
Oczywiście w pojedynczym przypadku wszystkie te rachuby biorą w łeb i najwięcej racji ma Jarosław Rzeszótko – wszystko zależy, czy wolimy pewne 1000 złotych, czy 50% szansy na 500 złotych i 50% na 2000. Ale to już kwestia spoza obszaru zainteresowań probabilistyki;-).
Z tego, co rzecze Wikipedia, to ten paradoks nie ma jednego ogólnie uznawanego wyjaśnienia.
@Cichy: Przy sposobie w jaki postawiłeś to zadanie, nie wiem w czym Lolek może mieć rację, jeśli rozpatrujemy długi ciąg prób w których w jednej kopercie jest 1000 złotych, a w drugiej 500 lub 2000, nie da się ukryć że przy zamianie w dużej ilości prób zyskujemy średnio o 25% więcej – wydaje mi się, że w swoim wyjaśnieniu mówisz o innej sytuacji niż ta którą postawiłeś w poście.
Jeśli mówimy ogólnie o zadaniu w którym w jednej kopercie jest dwa razy więcej pieniędzy niż w drugiej, to ciąg tych prób wygląda jakoś tak:
1) 2)
500 1000
1000 500
1000 500
500 1000
1000 2000
500 1000
…
Jeśli teraz „obserwujemy” tylko te próby w których pojawia się dowolna stała kwota w z góry ustalonej kopercie, to zamiana faktycznie w długim ciągu prób daję o 25% więcej. Np. Bolek może obserwować tylko te przypadki kiedy 1000 zł pojawia się w kopercie nr 1), a Lolek tylko przypadki kiedy 500 zł pojawia się w kopercie nr 2). Obaj statystycznie zyskają 25% na zamienianiu swoich kopert, ale nie oznacza to, że „rozmnożyli” pieniądze, bo ten „statystyczny zysk” może się zrealizować tylko jeżeli nie brali oni udziału w dokładnie tym samym ciągu prób.
Na koniec warto zauważyć, że jest to czysto matematyczne ćwiczenie, bo w rzeczywistości tego doświadczenia przy takich założeniach nie da się przeprowadzić, jeśli szansa na otrzymanie kwoty dwa razy większej jest taka sama jak szansa otrzymania kwoty dwa razy mniejszej, to w nieskończonej ilości prób musiałoby się pojawić tyle samo razy 1000 złotych co 2000 złotych, tyle samo razy 4000 złotych co 2000 złotych, tyle samo razy 8000 złotych co 4000 złotych, i tak dalej i tak dalej, nie sposób więc nawet przypisać jakiegokolwiek prawdopodobieństwa możliwości pojawienia się konkretnej kwoty.
@hcz
Nie znalazłem takiego hasła. Możesz podlinkować?
@Jarosław Rzeszótko
Ale właśnie o to chodzi, że nie ma stałej kwoty – stała jest tylko różnica między kopertami. Jeśli wybierasz sobie tylko te próby, w których wylosowałeś jakąś określoną sumę, to na zamianach faktycznie zyskasz, ale w pełnym zbiorze wyników zamiany dadzą taką samą średnią jak ich brak, bo zyski z mniejszych sum zrównoważą się ze stratami z większych.
Chociaż gdyby się zastanowić – jeśli przyjmiemy strategię, że zamieniamy się tylko po wylosowaniu koperty z tysiącem złotych, to na tych próbach będziemy zyskiwać 25%, a na pozostałych wyjdziemy na zero, więc w sumie jakiś tam minimalny zysk będzie. Ale czemu się ograniczać do tej jednej sumy? Dodajmy, że wymieniamy również koperty zawierające 2000 złotych – i na nich również zyskamy 25%. I tak dalej, dla każdej możliwej liczby, aż dojdziemy do wymieniania każdej koperty niezależnie od zawartości – i ciągle powinniśmy na tych wymianach zyskiwać, dochodząc asymptotycznie do 25%, bo dla każdej konkretnej sumy bilans wymian będzie dodatni. A jeśli ktoś jeszcze będzie zaglądać do drugiej koperty i zawsze iść na wymianę z nami, to każdy z nas wyjdzie na plus i dostaniemy ekonomiczne perpetuum mobile. Gdzie teraz tkwi haczyk?
Nie ma w rzeczywistości ciągu prób w którym każda kwota pojawiałaby się tyle samo razy co kwota dwa razy mniejsza i dwa razy większa. Każdy rzeczywisty ciąg prób usiłujący naśladować taką grę będzie w jakiś sposób asymetryczny w stosunku do tego wyidealizowanego ciągu, na przykład weźmy taki ciąg:
500 1000
500 1000
2000 1000
2000 1000
500 250
500 250
Do symetrii z założeń zadania, brakuję tu dwóch prób w których zamiana 250 dawałaby stratę, tj. 125 złotych, i dwóch prób w których zamiana 2000 złotych dawałaby 4000 złotych. Jeśli spróbujemy te próby dodać, znajdziemy się znów w tej samej sytuacji brakujących prób, tylko tym razem będzie nam brakować kopert z 8000 złotych i 62.5 złotych. Ponieważ kwoty w kopertach nie są ograniczone, to asymetria tego „uciętego” ciągu w stosunku do „wyidealizowanego” może być dowolnie dużej wielkości i to jest właśnie ten „haczyk”. Innymi słowy ten ciąg nie ma żadnej tedencji do „ustalania” się wraz ze wzrostem ilości prób, na przykład stosunek ilości prób w których pojawiło się 500 złotych do ilości wszystkich prób (czyli to co nazywamy prawdopodobieństwem pojawienia się 500 złotych w kopercie) nie dąży do żadnej konkretnej wartości wraz ze wzrostem ilości prób. W związku z tym klasyczny rachunek prawdopodobieństwa nie ma tu zastosowania i pojęcie wartości oczekiwanej traci swój sens.
Hasło na Wikipedii: http://en.wikipedia.org/wiki/Two_envelopes_problem. Wydaje mi się, że ten problem „nie ma rozwiązania”, tylko w tym sensie, że ludzie bawią się w rozważanie wielu różnych wariantów z wielu różnych perspektyw. Na pewno nie jest to nierozwiązany problem klasycznego rachunku prawdopodobieństwa.
Pozwoliłem sobie poprawić link w powyższym komentarzu, bo Markdown jak zwykle zepsuł podkreślenia, a hasło zdecydowanie godne polecenia – nawet nie zdawałem sobie sprawy, że ten problem jest aż tak złożony.