Do salonu gier codziennie zagląda dwóch specyficznych graczy: jeden z nich jest biedny i boi się tracić pieniądze, więc gra tylko tak długo, jak długo wygrywa – po pierwszej porażce kończy zabawę i idzie do domu. Drugi z kolei ma kasy pod dostatkiem, więc nie przejmuje się porażkami, natomiast do szczęścia wystarcza mu jedna wygrana dziennie – kiedy ją uzyska, również kończy zabawę i idzie do domu.
Zakładając, że gra toczy się zawsze o taką samą stawkę, a jej wynik jest całkowicie losowy, który z nich będzie na tym lepiej wychodzić?
Komentarze
Z cyklu nie znam się, to się wypowiem: ponieważ większość gier w kasynach ma większą szansę na przegranie, gracz biedny raczej będzie na tym gorzej wychodził. Gracz bogaty może grać na zasadzie: przegrałem, to teraz postawię dwa razy więcej.
Jak widać, biednemu zawsze wiatr w oczy.
Zakładając to samo co Sigvatr (ilość wygranych << ilość przegranych) lepiej na tym wychodzi pierwszy… Codziennie wygrywa życie.
Pierwszy wyjdzie lepiej. Każdego dnia przegra co najwyżej raz. Drugi każdego dnia wygra co najwyżej raz.
Przy zadanych warunkach i założeniu nieskończenie bogatego kasyna, biedny ma niezerowe prawdopodobieństwo uzyskania dowolnie wysokiej kwoty, a bogaty: co najwyżej wygranej za jedną grę.
Ale jeśli stawki mogą się zmieniać, to bogaty może podbijać tak, że jedna wygrana mu zrekompensuje poprzednie straty (tutaj musimy zakładać nieskończony kredyt) i wtedy jego strategia będzie nie gorsza.
Co już powiedziano, więcej wygrywa pierwszy.
Coś mi umknęło…
Teraz mogę zgodzić się z resztą: pierwszy ma więcej okazji na zwycięstwo, a drugi nie może sobie zrekompensować strat podnoszeniem stawki.
Wydaję mi się, że obie strategie są tak samo dobre.
Ponieważ stawka każdego zakładu jest taka sama, analizując kto w danym momencie wygrywa wystarczy śledzić liczbę zakładów wygranych przez obu graczu. Oznaczając porażkę przez „p”, a wygraną przez „w”, pierwszy gracz „generuje” w kolejnych dniach np. ciągi:
dzień 1: w w p
dzień 2: p
dzień 3: w p
dzień 4: p
dzień 5: p
…
Ponieważ jednak to, którego dnia gramy, nie ma żadnego wpływu na prawdopodobieństwo wygranej, ignorując upływ dni mamy po prostu ciąg:
w w p p w p p p …
Gdzie zawsze Pr(w) = 1/2 i Pr(p) = 1/2
Innymi słowy, strategia przerywania gry na jeden dzień po wygranej jest tak samo dobra jak strategia drapania się po uchu przy przegranej. Niezależnie od tego czy gracz właśnie rozpoczyna codzienny ciąg zakładów, czy też robi kolejny zakład po uprzednim przegranym lub wygranym zakładzie, ma szansę 1/2 na wygraną i 1/2 na przegraną. To więc, że gracz kończy grę do następnego dnia po zaobserwowaniu jakiegoś szczególnego wyniku nic nie zmienia, tworzy jedynie pewne „opóźnienie” w generowaniu kolejnego elementu ciągu wyników. Ostatecznym osiągiem obu graczy kiedy zatrzymamy cały proces jest całkowicie losowy ciąg przegranych i wygranych.
Oczywiście powinno być: wystarczy śledzić liczbę zakładów wygranych i przegranych przez obu graczy.
Interesujące, jak niewielkie zmiany w opisie danej sytuacji mogą całkowicie zmienić jej odbiór. Chyba nikt by się nie nabrał na taką zagadkę:
„Do salonu gier codziennie zagląda dwóch graczy: pierwszy robi sobie przerwę na papierosa po każdej wygranej, drugi po każdej porażce. Który z nich będzie na tym lepiej wychodzić?”
Matematyka trudna jest i ewolucja nas do niej nie przystosowała…
@Jarosław Masz rację(?) tylko w przypadku, gdyby porównywać pod względem liczby gier. Raczej będziemy porównywać w okresie czasu i wtedy już tak fajnie nie jest.
Gracz 1 ma zawsze:
1/2 szansy na wygraną
1/2 szansy na przegraną i „pauzę” w grze
Gracz 2 ma zawsze:
1/2 szansy na wygraną i „pauzę” w grze
1/2 szansy na przegraną
Jeśli zatrzymujemy grę po zadanym okresie czasu, na przykład po dwóch tygodniach, oczekiwana ilość zakładów jakie obstawili obaj gracze jest taka sama dla obu graczy, gdyż obaj po każdym zakładzie mają taką samą szansę na pauzę, równą 1/2. Ponieważ każdy pojedynczy zakład z równym prawdopodobieństwem jest wygraną lub przegraną, wartość oczekiwana różnicy pomiędzy wynikami obu graczy dla zadanego okresu czasu jest również równa zero.
Moje ostatnie wytłumaczenie nie przekonuje nawet mnie samego :) Zatrzymując gre po jednym dniu, wartość oczekiwana różnicy pomiędzy liczbą wygranych a liczbą przegranych jest dla pierwszego, „biednego” gracza równa:
(Z pr. 1/2 natychmiastowa przegrana, z pr. 1/4 wygrana+przegrana, …)
Dla drugiego, „bogatego” gracza jest równa:
Odejmując pierwsze wyrażenie od drugiego mamy:
Suma w nawiasie jest zbieżna i równa jeden:
http://www.wolframalpha.com/input/?i=1%2F4+%2B+2%2F8+%2B+3%2F16+%2B+..
Wobec tego oczekiwana wartość różnicy pomiędzy wynikami obu graczy jest równa 0 i żaden z graczy nie uzyskuje przewagi po jednym dniu. Dla większej liczby dni te wartości oczekiwane trzeba po prostu pomnożyć przez stałą, więc po każdej ustalonej liczbie dni żaden z graczy nie jest na uprzywilejowanej pozycji
No, ale ciągle zakładasz, że przegrana i wygrana to równe prawdopodobieństwo. Według mnie tak nie będzie, bo kasyno poszło by z torbami. No i ciągle rozpatrujesz to w kategoriach „panowie grają według tych reguł do wieczności”.
Można sobie wyobrazić kasyno działające na p=1/2. Wystarczy, aby wymagało wpłaty przelewem na konto i takoż wypłacało wygrane – pomiędzy sesjami bankowymi na koncie kasyna cały czas by spoczywała kupa kasy, która by procentowała odsetkami.
No i zarabiałoby na drinkach, bo przecież gra o wyskokie stawki bez martini z wódką (wstrząśniętego nie zmieszanego) się nie liczy.
Pewnie, że można zastanawiać się nad p innym niż 1/2, albo skończonym budżetem graczy/kasyna itp., ale zadanie jest jednak dosyć jasno sformułowane, m. in. jest powiedziane, że „wynik jest całkowicie losowy”, a więc p=1/2.
Nie rozpatruje tylko „grania do wieczności”, tak jak napisałem jeśli przerywamy grę po danej z góry liczbie dni panowie też statystycznie wychodzą na remis – szereg owszem jest nieskończony, bo w zadaniu nie ma mowy o przerywaniu gry po konkretnej liczbie zakładów, ale wyrazy mają coraz mniejsze prawdopodbieństwo więc „ogon” szeregu można od pewnego momentu po prostu zignorować. Gra np. do 20 zakładów skutkuje w tym samym szeregu dla gracza 1 i gracza 2, tylko obciętym po 20 wyrazie – „oczekiwana” różnica wyników dalej wynosi 0.
Jest grupa twierdzeń rachunku prawdopodbieństwa które wykazują nieistnienie „systemu” dla w pełni losowych gier przy określonych założeniach, m. in. takich jak w tej zagadce:
http://en.wikipedia.org/wiki/Optional_stopping_theorem
http://en.wikipedia.org/wiki/Impossibility_of_a_gambling_system
Rzut kością nie jest całkowicie losowy?
Czyżby definicja losowości się zmieniła jak byłem za granicą?
Kiedy przyjmiemy – całkiem rozsądnie, że prawdopodobieństwo wygranej jest niższe niż przegranej i jakiś przedział czasu, nagle będzie różnica pomiędzy strategią jaką przyjmiesz.
Zgodzę się, że przy 1/2 nie ma różnicy.
Oczywiście lepiej by było gdyby zagadka była bardziej precyzyjnie sformułowana, ale przeważnie kiedy w takich zadaniach się mówi, że coś jest „całkowicie losowe” chodzi o rozkład który daje wszystkim możliwościom jednakowe prawdopodobieństwo. W takim sensie, rzut kostką sam w sobie jest całkowicie losowy, bo jest sześć możliwości i każda ma p=1/6, ale gra w której wyrzucenie kostką 6 jest wygraną, a czegokolwiek innego przegraną, nie jest całkowicie losowa, bo szansę są w jakiś sposób „ustawione” przeciwko grającemu. Ma to pewne uzasadnienie w tym, że jakąś miarą losowości jest entropia, a najwyższą entropie spośród wszystkich rozkładów prawdopodobieństwa ma właśnie rozkład dający wszystkim możliwościom takie samo prawdopodobieństwo.
O ile czegoś nie pomieszałem, dla p różnego od 1/2 wydaje się zawsze wygrywać gracz pierwszy tak jak to było powiedziane. Wartość oczekiwana różnicy wyników wygląda wtedy tak (q=1-p jest prawdopodobieństwem porażki):
Numerycznie policzone pierwsze 10000 wyrazów (kolejne wyrazy są oczywiście coraz mniejsze więc wyniki są dokładne do kilku miejsc po przecinku) dla różnych p:
(pierwsza cyfra różna od zera na trzysta którymś miejscu po przecinku)
p=0.6 -> 0.1666666666666666
p=0.7 -> 0.7619047619047614
p=0.8 -> 2.25
p=0.9 -> 7.11111111111111
Czyli np. przy p=0.9 gracz pierwszy średnio ma końcowy bilans (wygrane-przegrane) lepszy o ok. 7 niż gracz drugi.
(Przy czym to tylko porównanie „bilansów” obu graczy, obaj gracze mogą mieć na koncie więcej porażek niż wygranych)
Dyskusja ustała, więc przyszedł czas na podsumowanie:
Jak słusznie zauważył Jarosław Rzeszótko w komentarzu #7, obie strategie mają zerowy wpływ na „generowany ciąg wyników”, więc są tyle samo warte, jeśli chodzi o bilans „w nieskończoności”. Sytuacja jednak się zmienia, jeśli zostaną spełnione trzy warunki:
Pierwszy warunek oznacza, że gracze będą grać w różnym tempie – np. jeśli prawdopodobieństwo wygranej wyniesie 1/3, „biedny” gracz będzie rozgrywać średnio półtorej gry dziennie (codziennie jedna porażka, dodatkowo co drugi dzień wygrana), a „bogaty” trzy gry dziennie (dwie przegrane, jedna wygrana).
(w kwestii prawdopodobieństwa wygranej – „całkowicie losowe” nie musi wcale oznaczać szansy 1/2 – gra w totolotka albo w ruletkę jest całkowicie losowa, a jednak prawdopodobieństwa wygranej i przegranej nie są równe; podobnie w przypadku gry losowej pomiędzy więcej niż dwoma graczami, jeśli wygrany może być tylko jeden)
Drugi warunek oznacza, że w powyższej sytuacji gracze będą zyskiwać lub tracić pieniądze w różnym tempie – przy dodatniej wartości opłaci się grać częściej, a przy ujemnej rzadziej. Trzeci warunek zapewnia, że różnica ta będzie mieć znaczenie – w nieskończoności bowiem obaj tak czy siak dorobiliby się nieskończenie wielkiej fortuny lub długu.
Tak więc jeśli prawdopodobieństwo wygranej jest mniejsze niż 1/2, a wartość oczekiwana mniejsza od zera, lepsza będzie strategia „biednego”, ponieważ będzie on wolniej tracić pieniądze, niż „bogaty”. Odwrócenie jednego z tych warunków oznacza przewagę „bogatego”, a odwrócenie obu znowu da przewagę „biednemu”, który tym razem będzie szybciej zarabiać.
Podsumowując – w wyidealizowanej sytuacji równych szans obaj gracze na jedno wyjdą, ale jeśli przyjmiemy realistyczne założenia, czyli niższe szanse na wygraną i ujemną wartość oczekiwaną, wówczas gra do pierwszej porażki będzie lepszą strategią niż gra do pierwszej wygranej. Co prawda lepszą tylko w tym sensie, że przyniesie mniejsze straty – no ale kto ma pojęcie o matematyce, ten i tak wie, że na hazardzie zarabia tylko kasyno.
A podasz jakieś źródło dla tej zagadki? Bardzo ogólnie to było sformułowane, a końcowe wnioski są podane jako fakty, które w zasadzie nie wiadomo skąd wynikają, a raczej nie sądzę żeby ktoś to był w stanie ot tak sobie wymyślić. Wydaje mi się, że rozwiązanie tej zagadki wymagało jednak trochę matematyki na poziomie pierwszego roku jakichś ścisłych studiów (i więcej podanych informacji), np. te liczby średnio rozgrywanych gier przy p=1/3 znowu wymagają policzenia sumy szeregu – zwróć uwagę, że wg. tego co podajesz średni dzienny bilans biednego to -0.5, a bogatego -1. To wynika właśnie z szeregu który podałem wcześniej:
Który dla p=0,(3) i q=0,(6) daje właśnie 0.5, i tu pytanie czy można to rzeczywiście rozwiązać, czy trzeba to liczyć numerycznie. A może da się to wogóle policzyć prostszą metodą? Jeżeli rozpatrywać dodatkowo wygrane i porażki konkretnej, różnej wysokości, to wartość oczekiwana ostatecznego wyniku finansowego po iluś tam dniach znowu jest dana przez dosyć podobny szereg nieskończony.
Ciekaw też jestem jak zatem wg. Was wygląda „częściowo losowy” wynik?
Paradoksalnie ta zagadka jest właśnie świetną ilustracją dlaczego gra w której rozpatrujemy tylko „zwycięstwo” i „porażkę”, i mają one różne prawdopodobieństwa, nie jest całkowicie losowa – skoro istnieją lepsze i gorsze sposoby „obstawiania” kolejnych elementów ciągu wyników, to znaczy, że gra jest częściowo „przewidywalna”. W „całkowicie losowej” grze wszelkie sposoby obstawiania dają w perspektywie nieskończonej liczby prób średnio taki sam wynik.
Tak w każdym razie jest przy jedynym znanym mi sposobie jakiegokolwiek stopniowania losowości, jakim jest użycie entropii jako miary losowości. Gra w ruletkę nie jest wtedy całkowicie losowa, tylko liczba jaka wypada w ruletce jest całkowicie losowa – nie ma strategii przewidywania jaka konkretnie wypadnie liczba, ale można nieźle przewidywać czy gracz obstawiający tylko jedną liczbę będzie częściej wygrywał czy przegrywał.
Źródła nie pamiętam, dawno to znalazłem, zresztą oryginalnie było to ograniczone właśnie do prawdopodobieństwa 1/2, więc resztę musiałem sam przemyśleć. Nie bardzo rozumiem, czemu tak kombinujesz z tymi szeregami, skoro znajomość prawdopodobieństwa wygranej pozwala i bez tego stwierdzić, co ile gier będzie ona średnio następować, a wszelkie fluktuacje w dłuższej perspektywie się wyrównają, więc dzienna liczba gier prosto z tego wynika.
Oczywiście, taki powinien być. Jeśli szansa na wygraną wynosi 1/3, a wartość wygranej to tylko dwukrotność postawionej stawki, to wartość oczekiwana jest ujemna, więc tak jak napisałem, biedny będzie wolniej tracić. Gdyby wygrana dawała potrojenie wpłaty, wartość oczekiwana znowu byłaby zerowa i obaj gracze mieliby zerowy bilans (kasowy, nie mylić z bilansem wygranych i przegranych gier).
Wynik gry w pokera na przykład jest częściowo losowy, bo zależy w pewnym stopniu od graczy. Dlatego poczyniłem zastrzeżenie o „całkowitej losowości”, żeby było jasne, że nie chodzi tu o takie rzeczy jak zmęczenie grą, tylko o sam rachunek prawdopodobieństwa.
Wiesz, przy prawdopodobieństwie 1/2 też można nieźle przewidzieć, jaka będzie proporcja wygranych i przegranych, więc trzymając się tego podejścia stwierdzimy w końcu, że w ogóle nie ma czegoś takiego jak całkowita losowość, bo zawsze jakieś przewidywania odnośnie uzyskiwanych wyników można poczynić. Stwierdzenie „przy prawdopodobieństwie 1/10 gracz będzie częściej przegrywać” jest przecież nie mniej i nie bardziej trywialne niż stwierdzenie „przy prawdopodobieństwie 1/2 gracz będzie wygrywać i przegrywać równie często” – jedno i drugie wynika wprost z definicji prawdopodobieństwa.
Nie bardzo rozumiem, czemu tak kombinujesz z tymi szeregami
Szeregi które podałem wynikają bezpośrednio z definicji wartości oczekiwanej i dają te same wyniki, które Ty podałeś, przy założeniu że wygrywa się tyle samo pieniędzy przy wygranej, ile się traci przy przegranej. Faktycznie można było zauważyć kto będzie wygrywał bez tego, ale za to z szeregów można wyliczyć konkretne wyniki.
Wiesz, przy prawdopodobieństwie 1/2 też można nieźle przewidzieć, jaka będzie proporcja wygranych i przegranych, więc trzymając się tego podejścia stwierdzimy w końcu, że w ogóle nie ma czegoś takiego jak całkowita losowość, bo zawsze jakieś przewidywania odnośnie uzyskiwanych wyników można poczynić. Stwierdzenie „przy prawdopodobieństwie 1/10 gracz będzie częściej przegrywać” jest przecież nie mniej i nie bardziej trywialne niż stwierdzenie „przy prawdopodobieństwie 1/2 gracz będzie wygrywać i przegrywać równie często” – jedno i drugie wynika wprost z definicji prawdopodobieństwa.
Chodzi o to, czy daną jedną konkretną sekwencje wyników można przewidzieć, zanim ona nastąpi i do jakiego stopnia. Powiedzmy, że mamy do przewidzenia wynik 10 gier typu wygrana/porażka. Przy p=1/2 można owszem powiedzieć, że gracz prawdopodobnie przegra w około połowie gier, ale przy 10 grach jest 252 różnych sekwencji wyników składających się z 5 przegranych i 5 wygranych. Przy p=1/2 tak czy inaczej każda sekwencja jest tak samo prawdopodobna, więc każdy „zakład” jest tak samo dobry – w najlepszym razie będziemy „trafiać” średnio połowe wyników i znajomość p w niczym nam nie pomaga. Jest to pod tym względem „najgorsze” p, dla każdego innego p istnieje lepsza strategia przewidywania.
Na przykład przy p=1/10 stwierdzenie, że na jedną wygraną przypada 9 przegranych opisuje już tylko 10 różnych możliwych sekwencji, a ktoś przewidujący ciągłą przegraną będzie mylił się tylko przez 10% czasu. W miarę jak p się zbliża do 0 (albo do 1), sekwencja staje się coraz bardziej deterministyczna, więc naturalnym jest przyjąć że jest to ciągły proces, ugólnić na cały zakres między 0 a 1, przy maksimum niepewności w p=1/2 i minimach w p=0 i p=1, jak na obrazku tutaj:
http://en.wikipedia.org/wiki/Binary_entropy_function
Można by na to spojrzeć jak na uogólnienie wyniku Twojej zagadki. Jak już wspominałem, jest to znany sposób stopniowania losowości:
http://pl.wikipedia.org/wiki/Entropia_%28teoria_informacji%29#Przyk.C5.82ad
Rozumiem, że miałeś na myśli coś zupełnie innego mówiąc o całkowitej losowości.