Teorie her a ekonomické rozhodování 2. Maticové hry
2.1 Maticová hra Teorie her = ekonomická vědní disciplína, která se zabývá studiem konfliktních situací pomocí matematických modelů Hra v normálním tvaru hráči provedou jediné rozhodnutí a to všichni najednou v rozvinutém tvaru řada po sobě následujících tahů, přičemž hráči se v tazích střídají 2
2.1 Maticová hra Hra v normálním tvaru je dána: množinou hráčů {1, 2,, N} předpokládejme pro jednoduchost, že N = 2 množinou prostorů strategií {X1, X2,, XN}, kde Xi označuje prostor strategií i-tého hráče předpokládejme pro jednoduchost prostory X a Y, strategie x a y množinou výplatních funkcí {f1(x1, x2,, xn), f2(x1, x2,, xn),, fn(x1, x2,, xn)} předpokládejme pro jednoduchost f1(x,y) a f2(x,y) 3
2.1 Maticová hra Hráči jsou inteligentní: Maximalizují užitek (hodnotu své výplatní funkce) Mají dokonalé informace o hře, tzn. znají Množinu hráčů Svůj prostor strategií a svou výplatní funkci Prostory strategií a výplatní funkce ostatních hráčů Všichni provádí rozhodnutí najednou 4
2.1 Maticová hra Antagonistický konflikt = co jeden získá, to druhý ztratí (spolupráce nemá smysl) Hra s konstantním součtem: f 1 x, y + f 2 x, y = K Hra s nulovým součtem (ekvivalentní): f 1 x, y + f 2 x, y = 0, a tedy f 1 x, y = f 2 x, y f x, y 5
2.1 Maticová hra Konečný prostor strategií obou hráčů 1. hráč X = {x1, x2,, xm} 2. hráč Y = {y1, y2,, yn} Celkem tedy existuje m x n možných kombinací strategií a každé lze přiřadit výhru f(x,y) Všechny tyto výhry lze uspořádat do matice 6
2.1 Maticová hra A = a 11 a 1n a m1 a mn 1. hráč xi 2. hráč yj 1. hráč získá aij 2. hráč získá aij (ztratí aij) 7
2.2 Dominování Příklad 1 1 5 2 A = 2 1 1 5 4 3 1. hráč volí řádek: X = {x1, x2, x3} 2. hráč volí sloupec: Y = {y1, y2, y3} Kterou strategii 1. hráč určitě nezvolí? Kterou strategii 2. hráč určitě nezvolí? Optimální strategie (x3, y3) 8
2.2 Dominování 1. hráč nebude volit řádek se všemi prvky menšími, než jsou odpovídající prvky v jiném řádku (měl by s jistotou nižší zisk) 2. hráč nebude volit sloupec se všemi prvky většími, než jsou odpovídající prvky v jiném sloupci (měl by s jistotou vyšší ztrátu) Hráč nikdy nezvolí silně dominovanou strategii silná dominovanost 9
2.2 Dominování Slabá dominovanost: Prvky v odpovídajícím řádku jsou menší nebo rovny prvkům v jiném řádku (1. hráč) či Prvky v odpovídajícím sloupci jsou větší nebo rovny prvkům v jiném sloupci (2. hráč) Využívat budeme pouze silnou dominovanost 10
2.2 Dominování Pomocí silné dominovanosti lze redukovat rozměr matice hry najít ve speciálních případech optimální strategii (jen zřídka viz předchozí případ) 11
2.3 Nashova rovnováha Nashova rovnováha = návod, jak najít optimální strategie hráčů ve hře (maticové) John F. Nash, Jr. 1994 Nobelova cena za ekonomii 12
2.3 Nashova rovnováha Pokud se některý z hráčů odchýlí od své optimální strategie (zatímco soupeř se své optimální strategie držet bude), nepolepší si Tzn. pokud se hráč nedrží optimální strategie, pohorší si (a v nejlepším případě na tom bude stejně) 13
2.3 Nashova rovnováha Nashova rovnováha: x o X, y o Y f 1 (x, y o ) f 1 (x o, y o ) a f 2 (x o, y) f 2 (x o, y o ) Pro hru s nulovým součtem: f 1 (x, y) f(x, y) a f 2 x, y f(x, y o ) f(x o, y o ) a f x o, y f x o, y o f(x, y), a tedy f x o, y f x o, y o 14
2.3 Nashova rovnováha Pro hru s nulovým součtem: f(x, y o ) f(x o, y o ) a f x o, y f x o, y o Neboli: f x, y o f x o, y o f x o, y Nashova rovnováha (Nashovo rovnovážné řešení, rovnovážné strategie) 15
2.3 Nashova rovnováha Nashovu rovnováhu získáme nalezením Sedlového prvku (sedlového bodu) Sedlový prvek = číslo největší ve svém sloupci a nejmenší ve svém řádku Vysvětlení: ve hře s nulovým součtem chce 2. hráč minimalizovat výhru prvého hráče a 1. hráč chce maximalizovat ztrátu druhého 16
2.3 Nashova rovnováha Pokud aij je sedlový prvek xi je optimální strategie prvého hráče yj je optimální strategie druhého hráče aij je cena hry Toto řešení nazýváme Nashova rovnováha (Nashovo rovnovážné řešení) v ryzích strategiích optimální strategii hrajeme ve 100 % případů 17
2.3 Nashova rovnováha Příklad 2 1 4 2 2 1 1 3 3 4 1 sedlový bod (x o, y o ) = (x 3, y 1 ) 18
2.3 Nashova rovnováha Příklad 3 1 4 2 2 3 2 2 3 4 2 sedlové body (x o, y o ) = (x 2, y 1 ) (x o, y o ) = (x 3, y 1 ) 19
2.3 Nashova rovnováha Příklad 4 1 4 2 3 1 1 2 3 4 žádný sedlový bod 20
2.3 Nashova rovnováha Maticová hra může mít: 1 sedlový prvek rovnovážné strategie přímo více sedlových prvků všechny mají stejnou cenu hry a jako optimální strategii mohu volit kteroukoliv navrženou žádný sedlový prvek neexistuje Nashova rovnováha v ryzích strategiích Pro hráče neexistují žádné rovnovážné strategie? 21
Příklad 5 Kámen nůžky papír K N P K N P 0 +1 1 1 0 +1 +1 1 0 22
Hra Kámen nůžky papír nemá sedlový prvek Tzn. nemá Nashovu rovnováhu v ryzích strategiích Přesto známe optimální strategii hráčů Jak vyhrát? hrát každou z možností s pravděpodobností 1/3 23
Pro každého hráče je tedy rovnovážnou strategií vektor (1/3, 1/3, 1/3) Čísla představují pravděpodobnosti, se kterými hráč hraje jednotlivé strategie Takto formulované strategie se nazývají smíšené (pravděpodobnostní) strategie 24
Základní věta maticových her: Každá maticová hra má Nashovo rovnovážné řešení (ve smíšených strategiích) 25
Postup hledání Nashova rovnovážného řešení ve smíšených strategiích se nazývá smíšené rozšíření maticové hry Smíšené rozšíření použijeme, neexistuje-li řešení v ryzích strategiích (tj. neexistuje-li sedlový prvek) 26
X = {x; x T = (x 1 ; x 2 ; ; x m ); m i=1 x i = 1; x 0} Y = {y; y T = (y 1 ; y 2 ; ; y n ); n j=1 y j = 1; y 0} 27
Hodnota výplatní funkce 1. hráče: f x, y = m i=1 n j=1 x i a ij y j = x T Ay Hodnota výplatní funkce 2. hráče má pouze opačné znaménko (hra s nulovým součtem) Ryzí strategie = speciální případ smíšených strategií (jednotkové vektory) 28
Podle ZVMH existují optimální strategie (x o, y o ) ve smíšeném rozšíření, neboli existuje Nashova rovnováha Musí tedy platit: x T Ay o x ot Ay o x ot Ay Hledáme tedy (x o, y o ) splňující uvedené nerovnosti 29
Označme cenu hry v = x ot Ay o Přičtení konstanty c ke všem prvkům v matici nezmění optimální strategie strategicky ekvivalentní hry Změní však cenu hry na v + c Tento trik umožňuje např. převést hru s konstantním součtem na hru s nulovým součtem 30
Pokud jsou všechny prvky matice A kladné, můžeme pokračovat v řešení Jsou-li některé prvky nekladné, je třeba přičíst vhodnou konstantu tak, aby se všechny prvky staly kladnými 31
Příklad 6 1 1 2 0 2 1 1 2 1 1 1 2 0 2 1 1 2 1 + 3 = 4 2 5 3 5 4 2 1 4 A co dál? Jak najít optimální strategie? 32
Hledáme Nashovu rovnováhu ve smíšených strategiích: x T Ay o x ot Ay o x ot Ay Uvedené vztahy ale musí platit i pro ryzí strategie x T = 1,0,, 0, x T = 0,1,, 0,, x T = 0,0,, 1 x T Ay o v + c: a 11 y o 1 + a 12y o 2 + + a 1ny o n v + c a m1 y o 1 + a m2y o 2 + + a mny o v + c n 33
a 11 y o 1 + a 12y o 2 + + a 1ny o v + c n a m1 y o 1 + a m2y o 2 + + a mny o v + c n Zajistili jsme, že v + c > 0, můžeme tedy všechny nerovnice vydělit výrazem v + c Substituce q j = yo j v+c q j 0 34
a 11 q 1 + a 12 q 2 + + a 1n q n 1 a m1 q 1 + a m2 q 2 + + a mn q n 1 q j 0 Omezující podmínky úloha lineárního programování Obdobný postup pro druhou nerovnost 35
Hledáme Nashovu rovnováhu ve smíšených strategiích: x T Ay o x ot Ay o x ot Ay Uvedené vztahy ale musí platit i pro ryzí strategie y T = 1,0,, 0, y T = 0,1,, 0,, y T = 0,0,, 1 v + c x ot Ay: x o 1a 11 + x o 2a 21 + + x o ma m1 v + c x o 1a 1n + x o 2a 2n + + x o ma mn v + c 36
x o 1a 11 + x o 2a 21 + + x o ma m1 v + c x o 1a 1n + x o 2a 2n + + x o ma mn v + c Zajistili jsme, že v + c > 0, můžeme tedy všechny nerovnice vydělit výrazem v + c Substituce p i = xo i v+c p i 0 37
a 11 p 1 + a 21 p 2 + + a m1 p m 1 a 1n p 1 + a 2n p 2 + + a mn p n 1 p i 0 Omezující podmínky úloha lineárního programování Uvedené úlohy = duálně sdružené (vhodná formulace účelových funkcí) 38
Primární problém Duální problém n j=1 q j 0, j a ij q j 1, i i=1 m p i 0, i a ij p i 1, j n max j=1 q j min i=1 m p i 39
Řešíme tedy klasickou úlohu LP (např. simplexovou metodou) Oba sdružené problémy mají stejnou hodnotu účelové funkce 1 v+c = z Primární úloha: optimum pro 2. hráče Duální úloha: optimum pro 1. hráče (stínové ceny) 40
Zpětná substituce q j = yo j v+c p i = xo i v+c y o j = v + c q j = q j z x o i = v + c p i = p i z Podobně hodnota účelové funkce 1 v+c = z v = 1 z c cena hry 41
Příklad 6 1 1 2 0 2 1 1 2 1 4 2 5 3 5 4 2 1 4 4q 1 + 2q 2 + 5q 3 1 3q 1 + 5q 2 + 4q 3 1 2q 1 + 1q 2 + 4q 3 1 q 1, q 2, q 3 0 max z = q 1 + q 2 + q 3 42
Řešení: q T = 0.21, 0.07, 0 p T = 0.14, 0.14, 0 z = 0.28 Po substituci: y T = 3, 1, 0 4 4 xt = 1, 1 2 2 1 1 2 0 2 1 1 2 1, 0 v = 0.57 43
Poznámky: prvky upravené matice A jsou kladné obě úlohy mají přípustné řešení obě úlohy mají optimální řešení řešení duální úlohy v simplexové tabulce primární úlohy pod přídatnými proměnnými (stínové ceny) 44
KONEC 45