Teorija igara 2: Ajde da ga merimo, kukavice

Čovek je čoveku vuk čak i kad treba zajedno da sagrade sklonište od vukova u nekoj vukojebini. To smo mogli videti u par primera u prvom tekstu o teoriji igara. Drugi će biti posvećen situacijama kad je bitka za sopstvenu guzicu prvi i jedini cilj.

Papir-kamen-makaze

Iliti rock, paper, scissors, lizard, spock ukoliko ste ljubitelj ne naročito duhovite američke serije o nerdovima. Elementi igre: 3 entiteta od kojih je svaki ponaosob od jednog jači a od jednog slabiji (papir je jači od kamena, kamen od makaza, a makaze od papira). Cilj igre: Naterati protivnika da se uguši u gubitničkim suzama. Naizgled deluje da igra nema niti jednog faktora osim čiste sreće, međutim, ukoliko se igra na više dobijenih runda, određena taktika može značajno da uveća šanse za pobedu.

Kineski matematičar Zhijijan Wang se igrao sa svojim studentima (bolje reći eksperimentisao na njima)  i tražio empirijski dokaz za najbolju taktiku u ovoj igri. Premda je broj pojavljivanja svake konfiguracije bio približan njihovih prirodnim verovatnoćama učestalosti (1/3), Kinez je izvalio da postoji tendencija da pobednici zadržavaju strategiju a da je gubitnici menjaju u svakom sledećem krugu. Na primer, ako igrač A u prvom krugu izabere makaze, igrač B kamen, pobediće potonji. Pretpostavimo da se obojica na početku povinuju tendenciji da pobednik zadržava strategiju a gubitnik menja, te će u drugom krugu A pokazati papir a B zadržati kamen što će sad rezultirati pobedom A. Ukoliko je A upoznat sa uslovnim refleksom u ovoj igri, mogao bi sad da pretpostavi da će B da promeni  formaciju i time ponovo pobedi. Psihologija takođe kaže da će gubitnik češće posegnuti za onom formacijom od koje je izgubio u prethodnoj rundi, pa bi B sada pokazao papir, što znači da A u ovom slučaju menja svoju taktiku u makaze i ponovo pobeđuje. Pošto se runde odigravaju brzo, dok B skonta obrazac koji je uhvatio A, razlika bi mogla da bude već dovoljno velika u korist A. Međutim, ako B zna da A koristi datu taktiku, mogao bi da odgovori kontra strategijom; kad izgubi menja formaciju u onu koja se nije pojavila u protekloj rundi i tako nadmudri A. Lako se da primetiti da se problem nadmudrivanja svodi na broj koraka unapred koji se razmatraju.

S teorijskog stanovišta, igrač ima najviše šansi za pobedu ukoliko podjednako koristi sve formacije (Nešov ekvilibrijum).

Čiji je veći?

Najbitnije pitanje u istoriji kosmosa. Uzmimo opet Džikija i Šikija, dva ortaka iz prošlog teksta, koji su batalili drogiranje, provalili pravoslavlje i počeli zdrav sportski život – dakle, idu u teretanu 2 puta dnevno, piju steroide i izgledaju kao pokretni šifonjeri. Uz hormonalne poremećaje i upliv ziljavih klinki iz kraja koje padaju na njihova razvijena tela, javlja se i sve veći animozitet između njih dvojice. Iako bi bilo najbolje po zdravlje obojice da prestanu da se kljukaju hemijom, eventualni jednostrani prestanak bilo kog od njih bi ovom drugom dao dodatne poene (bar u tim njihovim idiotskim univerzumima) i povećao integritet u društvu a poraženog naterao da se preseli u Zuce, te stoga obojica nastavljaju istom maršrutom. Inače, ova dva idiota su samo parafraza mnogih bilateralnih državnih odnosa kroz istoriju, tipa SAD – Rusija u pogledu nuklearnog naoružanja.

Igra kukavice

Pošto je čak i idiotima kakvi su Šiki i Džiki jasno da će borba za prevlast u kraju putem bildovanja u teretani da potraje, njih dvojica su rešili da stvar okončaju na relativno jednostavan način – svako će da sedne u svoj auto i jurnuće jedan prema drugom. Ko prvi skrene – kukavica je, gubi sve privilegije u kraju i mora do kraja života da nosi roze flafičaste patofne, a onaj drugi postaje king of the seven kingoms (tačnije, ingerencije su mu u par ulica okolo, al mojne da mu kažete to). Ako obojica idu do kraja, neće preživeti. Ako obojica skrenu, džabe su krečili, kao da se ništa nije desilo, opet moraju u teretanu i da se šibaju steroidima. Šta je rešenje igre ponos vs racio gde je gubitak mnogo veći od dobitka?

Ukoliko Džiki bira da ide do kraja sa verovatnoćom p, onda je za Šikija vrednost čiste strategije bivanja neustrašivim jednaka (-1)*p + 2*(1-p), odnosno 2 – 3p, dok za izbor čiste strategije kukavice dobija 1-p. Sređivanjem jednačina dolazi se do p=1/2, što znači da se Šikiju isplati da bira da ide do kraja ako Džiki ide do kraja sa verovatnoćom manjom od jedne polovine. Ukoliko je Džiki veći hazarder (p>1/2) Šikiju se više isplati da navuče patofne. Naravno, ova Bertrand Raselova varijanta igre kukavice je skoro čisto teorijska jer je u realnom životu gotovo nemoguće dovesti Džikija i Šikija u situaciju da svoje odluke donose na odnosu poznavanje verovatnoće događaja. Stoga je futurista Herman Kan u priču uveo određeni događaj koji značajno menja mogućnost ishoda. U konkretnom primeru vožnje, šta bi se desilo da Šiki par sekundi pre sudara skine volan i baci ga (a da Džiki to primeti), tj ostavi sebi samo jedan izbor?

Dilema zatvorenika

Verovatno najpoznatiji deo o teoriji igara. Govori o tome koliko najbolje individualno rešenje nije i najbolje kolektivno, te stoga odslikava realni svet u pravoj meri. Šiki i Džiki su nekako uspeli da reše situaciju od malopre (nije poznato kako) i nastavili normalnije da žive svoje vašljive živote. Triki (zvezdarski Tuko Salamanka), koga su odrukali, izlazi s robije zbog puštanja u promet opojnih sredstava i željan je osvete. Zarobljava Šikija i Džikija i stavlja svakog u zasebnu prostoriju. Daje im 2 izbora: mogu da ćute ili da cinkare ovog drugog. Ako obojica ćute, polomiće svakom po jednu ruku i jednu nogu. Ako obojica cinkare polomiće svakom po 3 ekstremiteta. Ako jedan ćuti a drugi cinkari, ocinkarenom će biti polomljene obe ruke i obe noge a ovom što cinkari samo leva ruka (Triki je milostiv ali ipak pravedan, a i voli da sluša zvuk lomljena kostiju).

Iako je jedan slomljeni ekstremitet bolje nego dva, dva su  bolje nego tri, a tri svakako bolje nego četiri, rešenje problema uopšte nije tako jednostavno. Pretpostavimo da obojica žele da izbegnu najgoru varijantu u kojoj će ih Triki polomiti naskroz (4 komata), što znači da bi trebalo da cinkare i tako možda prođu najbolje (samo leva ruka) pod uslovom da drugi ćuti, ali s obzirom da svako zna da i ovaj drugi razmišlja tako, onda im ne gine drugo najgore rešenje – tri polomljena ekstremiteta. Dalje, iz te situacije, obojica mogu da skontaju da obostranom promenom strategije mogu da dođu do najmanje lošeg rešenja za njih kao tim, što bi za ovu igru predstavljalo Nešov ekvilibrijum. Ali nakon tog koraka se otvara nova mogućnost; šta ako Šiki pomisli „ok, to je to, siguran sam da je i on došao do toga da je najbolje da ćutimo, jebiga, može nekako da se skakuće na jednoj nozi a levu ruku ionako ne koristimo, tako da kul“ a Džiki ode korak dalje, promeni taktiku i zajebe ga. Mada opet i Šiki može u zadnjem momentu da shvati da ga je Džiki naveo da nasedne i onda ceo proces razmišljanja ispočetka.

Šta god da izaberete ja biću srećan.

Sadista kakav je Triki može zabavu da podigne i na viši nivo ukoliko igru ponovi određen broj puta a da se za konačan ishod računa samo poslednje odigrana igra. To ovoj dvojici unosi još jedan nivo za razmišljanje – rezultate iz prethodnih igara. Ideja vodilja kaže da je u ovom slučaju najbolje sarađivati u prvoj igri a u svakoj sledećoj odigrati kao protivnik u prethodnoj. Kako god teorija rekla, za Šikija i Džikija ne vidim bilo koju drugu opciju osim – ON TE ODRUKAO, NEKA PATI, tj po 3 polomljena ekstremiteta.

  • Prisoner

    Daj bre napiši lepo knjigu kad ti već dobro ide, bar bi đacima bilo zanimljivo sa slikovitim primerima.

  • admirCS1 .

    Ajde Bleki, ovo je istina. Zbog tebe sam naučio svašta što ne bih inače :D

  • Dragan

    Dilema zatvorenika-klasičan primjer:

    А
    ћути-Или 6 мјесеци или 20 година

    Б
    ћути-Или 6 мјесеци или 20 година

    А
    цинкари-5 година или ослобађање

    Б
    цинкари- 5 година или ослобађање

    За сваког
    понаособ од А и Б је почетна вероватноћа што се тиче њихових могућности 0,5
    тј.да ћуте или да цинкаре.

    Могући
    исход ријешења за сваког од њих је четверострук ,дакле ослобађање, 6 мјесеци,5
    година,20 година,што значи за свако ријешење је са тачке потенцијала могућност
    0,25 .Но пошто то ријешење зависи од двије особе,могућност сваког ријешења је
    ако исто мисле два,а ако различите мисле онда је то такође 2,значи 0,25 % или
    50 % за различито и исто размишњање (боље речено дјеловање).

    Дакле
    најпозитивније ријешење за обадвојицу = 0,25 %

    Најоптималније
    са обзиром на услове=0,25 %

    Најгоре
    за А а најбоље за Б=0,25%

    Најгоре
    за Б а најбоље за Б =0,25 %

    Узмимо у
    обзир двије јединке које се не познају,дакле не знају ниста једно о другом у смислу општих поставки (ни род,ни године,ни
    националну припадност) тада је одлучивање у првој рунди чисто срећа а касније свака рунда зависи од
    оне претходне и од ранијих тако да варијабле расту.Тада би се већина одлучила
    на најоптималнију варијаблу.

    Имамо
    другу ситуацију да се кажу неке опште ствари једно о другом (истините или
    различите) и тада прва варијабла у првој рунди скаче више него овамо можда 4
    или 5 рунда.Ове би се вјероватно опет већина одлучила за најсигурнију опцију.

    Трећа
    ситуација имамо неке специфичне карактеристике које су једне другима речене и
    тада варијабле још више скачу,што се тиче размишљања и шансе су још мање.Овде
    би већ дошло до комбинација и вјерујем да би опет дошло до најсигурније
    тј.најопитмалније опције али кроз дужи период размишљања и на други начин
    размишљања.

    Четвта
    ситуација –особе се познају,тада варијабле зависе од њиховог познанства и
    поузданости једно у друго.Овде су по мени све варијабле отворене једнако.

    Било би
    занимљиво посматрати мозак на неком апарату у оваквим ситуацијама.

  • Dragan

    Piši Blek sledeći put malo o EPR paradoksu,mada je njega teško ili gotovo nemoguće prenjeti na papir u klasičnom smislu priče.

  • goran

    Opa. Gledao se film „A beautiful mind” …

  • preljepi um

    za film o john nash-u dosta su lose objasnili nash equilibrium…da ne kazem potpuno su ga sjebali :D