5 ANTAGONISTICKÉ HRY 172
Antagonistický konflikt je rozhodovací situace, v níž vystupují dva inteligentní rozhodovatelé, kteří se po volbě svých rozhodnutí rozdělí o pevnou částku, jejíž výše nezávisí na tom, jaká rozhodnutí zvolili. Matematickým modelem antagonistického konfliktu je hra v normálním tvaru s konstantním součtem: {Q = {1, 2}; S, T ; u 1 (s, t), u 2 (s, t)} u 1 (s, t) + u 2 (s, t) = konst. pro každé (s, t) S T 173
Definice 1. Strategie s, t se nazývají rovnovážné ve hře (5), platí-li pro každé s S a každé t T : u 1 (s, t ) u 1 (s, t ) a zároveň u 2 (s, t) u 2 (s, t ) Je-li speciálně součet ve hře nulový, budeme používat značení model tedy bude vypadat takto: u 1 (s, t) = u 2 (s, t) = u(s, t); {Q = {1, 2}; S, T ; u(s, t)} (5.1) Pro rovnovážné strategie s, t ve hře s nulovým součtem musí platit: u(s, t ) u(s, t ) u(s, t) pro všechna s S, t T. (5.2) Hodnota u(s, t ) se nazývá cena hry. 174
Lze dokázat, že ke každé hře tvaru (5) s konstantním součtem lze přiřadit hru v normálním tvaru s nulovým součtem, která je s původní hrou strategicky ekvivalentní, tj. každá dvojice strategií s, t, které jsou rovnovážné v původní hře, představuje dvojici rovnovážných strategií i v příslušné hře s nulovým součtem a naopak. Přesněji: Věta 1. Necht (5) je hra s konstantním součtem rovným K. Potom s, t jsou rovnovážné strategie ve hře (5) tehdy a jen tehdy, jsou-li s, t rovnovážné strategie ve hře s nulovým součtem (5.1), kde u(s, t) = u 1 (s, t) u 2 (s, t). 175
MATICOVÉ HRY Hru dvou hráčů s nulovým součtem a konečnými prostory strategií S = {s 1, s 2,... s m }, T = {t 1, t 2,... t n } (5.3) lze zadat pomocí matice A = a 11 a 12... a 1n a 21 a 22... a 2n.................... a m1 a m2... a mn = u 1 (s 1, t 1 ) u 1 (s 1, t 2 )... u 1 (s 1, t l ) u 1 (s 2, t 1 ) u 1 (s 2, t 2 )... u 1 (s 2, t l )................................... u 1 (s k, t 1 ) u 1 (s k, t 2 )... u 1 (s k, t l ) jejíž prvky udávají hodnoty výplatní funkce prvního hráče (výplatní funkce druhého hráče má vždy opačnou hodnotu): prvek a ij je roven hodnotě výplatní funkce prvního hráče, zvolil-li strategii s i a protivník zvolil strategii t j. Pro takto zadané hry se používá označení maticové hry. 176
Rovnovážné strategie v maticové hře První hráč pro každou svou strategii s i, tj. pro každý řádek i {1, 2,..., m} matice, nalezne minimální prvek, který pro danou strategii představuje minimální zaručenou výhru bez ohledu na volbu protivníka. Pak vybere tu strategii, neboli ten řádek, kde je toto minimum nejvyšší a tím i nejvyšší zaručená výhra nejmenší zlo. Podobně postupuje druhý hráč. Pro něj je nejhorší možností ta nejvyšší hodnota výhry prvního hráče; proto pro každou svou strategii t i, tj. pro každý sloupec j {1, 2,..., n} matice, nalezne maximální prvek, který pro danou strategii představuje maximální zaručenou prohru bez ohledu na volbu protivníka. Potom vybere tu strategii, neboli ten sloupec, kde je toto maximum nejmenší, neboli kde je maximální prohra co nejnižší. 177
Hráč 2 Hráč 1 s 1 s 2. s k t 1 t 2... t l u 1 (s 1, t 1 ) u 1 (s 1, t 2 )... u 1 (s 1, t l ) u 1 (s 2, t 1 ) u 1 (s 2, t 2 )... u 1 (s 2, t l ).................................. u 1 (s k, t 1 ) u 1 (s k, t 2 )... u 1 (s k, t l ) Hráč 1: min tj u 1 (s i, t j ) MAX Hráč 2: max si u 1 (s i, t j ) MIN Zřejmě platí: max s i min t j u 1 (s i, t j ) min max u 1 (s i, t j ) (5.4) t j s i 178
Platí-li ve vztahu (5.4) rovnost, pak společná hodnota u(s, t ) = max s i min t j u 1 (s i, t j ) = min max u 1 (s i, t j ) (5.5) t j s i představuje cenu hry a dvojice strategií (s, t ) je rovnovážným bodem. Prvek u(s, t ) má tu vlastnost, že je současně nejmenší na řádku a největší ve sloupci, proto se nazývá sedlový prvek matice. 179
Příklad 1. Uvažujme hru s maticí Hráč 2 t 1 t 2 t 3 t 4 Hráč 1 s 1 s 2 s k 5 4 4 5 4 5 3 9 7 8 1 8 4 4 1 min max: 7 8 4 9 max s min t u 1 (s i, t j ) = 4 = min t max u 1 (s i, t j ) = u 1 (s 1, t 3 ) s Dvojice strategií (s 1, t 3 ) je rovnovážným bodem hry. 180
Bohužel, ne vždy sedlový prvek existuje: Příklad 2. Hráč 2 t 1 t 2 t 3 Hráč 1 s 1 s 2 s k 0 1 1 1 0 1 1 1 0 1 1 1 min max: 1 1 1 max s min t u 1 (s i, t j ) = 1 < min t max u 1 (s i, t j ) = 1 s 181
Podobně pro matice: A = ( 1 1 1 1 ) ( 0 5/2 2, B = 1 3 1 ). (5.6) V těchto případech nezbyde než zavést smíšené strategie. Uvažujme nový model dané rozhodovací situace, původně popsané maticovou hrou s maticí (5): 182
Definice 2. Mějme maticovou hru s prostory strategií (5.8) a maticí hry (5). Hru dvou hráčů s nulovým součtem s prostory strategií S s = {p; p = (p 1,... p m ), p 1 + + p m = 1, p o} T s = {q; q = (q 1,... q n ), q 1 + + q n = 1, q o} a s výplatní funkcí (5.7) π(p, q) = m n p i a ij q j = paq T (5.8) i=1 j=1 nazveme smíšeným rozšířením původní maticové hry. Prvky původních prostorů strategiís, T se nazývají ryzí strategie, prvky prostorů S s, T s, které udávají rozdělení pravděpodobností na prostoru ryzích strategií, se nazývají smíšené strategie. Věta 2. Základní věta maticových her. Smíšené rozšíření každé maticové hry má řešení v rovnovážných strategiích. 183
Tj. pro každou matici A existují vektory p S s, q T s : paq T p Aq T p Aq T pro všechna p S s, q T s. (5.9) Ještě jinak: Věta. Vždy existují smíšené strategie (p, q ), pro které π(p, q ) = max p min q π(s i, t j ) = min q max π(s i, t j ) p Věta 3. Rovnovážné strategie smíšeného rozšíření maticové hry se nemění, přičteme-li ke každému prvku matice hry totéž kladné nebo záporné číslo c. Cena hry s takto pozměněnou maticí je v + c, kde v je cena původní hry. 184
GRAFICKÉ ŘEŠENÍ MATICOVÝCH HER PRO MATICE TYPU (2, n) Střední hodnoty výhry hráče 1 při smíšené strategii (p, 1 p) a při ryzích strategiích hráče 2: Hledáme g j (p) = pa 1j + (1 p)a 2j, j = 1, 2,..., n. (5.10) p := arg max p 0,1 Nejprve budeme uvažovat funkci ϕ(p) := min g j(p). (5.11) j=1,2,...,n min g j(p). (5.12) j=1,2,...,n Tato funkce je konkávní, po částech lineární, snadno nalezneme bod jejího maxima. Hledaná cena hry je potom rovna v = ϕ(p ) := max ϕ(p) (5.13) p 0,1 a hledaná smíšená rovnovážná strategie hráče 1 je (p, 1 p ). Nastává-li extrém v bodě p, kde g j (p ) = g k (p ) = v pro jednoznačně určené strategie j, k pak složky smíšené rovnovážné 185
strategie hráče 2 s indexy různými od j, k jsou rovny nule. Složky, které mohou být nenulové, získáme vyřešením soustavy a 1j q j + a 1k q k = v, q j + q k = 1, q j 0, q k 0, nebo a 2j q j + a 2k q k = v, q j + q k = 1, q j 0, q k 0. 186
Příklad 3. Určení rovnovážných strategií pro hru s maticí ( 5 5/2 3 4 8 6 ). g 1 (p) = 5p + 4(1 p) = p + 4 g 2 (p) = 5 p + 8(1 p) = 11 2 2 p + 8 g 3 (p) = 3p + 6(1 p) = 3p + 6 ϕ(p) nabývá maxima v bodě p = 1, hodnota tohoto maxima je 2 Vyřešením soustavy rovnic v(m) = 4.5. 5q 1 + 3q 3 = 4.5, q 1 + q 3 = 1, q 1 0, q 3 0, získáme q 1 = 0.75, q 2 = 0.25. Rovnovážný bod je tedy p = ( 1, ) 1 2 2, q = ( 3, 1 4 4). 187
188
OBECNÉ ŘEŠENÍ MATICOVÝCH HER LINEÁRNÍ PROGRAMOVÁNÍ Uvažujme maticovou hru s maticí a 11 a 12... a 1n a A = 21 a 22... a 2n................... a m1 a m2... a mn (5.14) a smíšené strategie p = (p 1,..., p m ), p 1 + + p m = 1, p i 0 i {1,..., m}, q = (q 1,..., q n ), q 1 + + q n = 1, q j 0 j {1,..., n}. Předpokládejme, že všechny prvky matice A jsou kladné (Pokud by nebyly, mohli bychom ke všem prvkům matice přičíst dostatečně vysokou kladnou konstantu c, čímž se podle věty 3 z hlediska strategií nic nezmění). 189
Postup je podobný, jako v případě hledání ryzích rovnovážných strategií. První hráč hledá pro libovolné, ale v tuto chvíli pevné p svou minimální zaručenou výhru h. Uvažujme Zřejmě je h = min j {a 1jp 1 + a 2j p 2 + + a mj p m }. (5.15) h a 1j p 1 + a 2j p 2 + + a mj p m pro všechna j {1, 2,..., n}. m (q 1 + q 2 + + q n ) } {{ } h 1 q 1 h q 1 (a 11 p 1 + a 21 p 2 + + a m1 p m ) q 2 h q 2 (a 12 p 1 + a 22 p 2 + + a m2 p m )...................................... q n h q n (a 1n p 1 + a 2n p 2 + + a mn p m ) i=1 n p i a ij q j = π(p, q) j=1 h π(p, q) 190
Hodnota h je proto minimální zaručenou výhrou hráče 1, at již jeho protivník zvolí jakoukoli ryzí či smíšenou strategii (vzhledem k (5.15) je h největší číslo splňující poslední nerovnost). Nerovnosti h a 1j p 1 + a 2j p 2 + + a mj p m pro všechna j {1, 2,..., n}. vydělme hodnotou h a označme p 1 1 a 1j h + a p 2 2j h + + a p m mj h y i = p i h ; zřejmě platí: y 1 + y 2 + + y m = 1 h. Obdržíme nerovnost 1 a 1j y 1 + a 2j y 2 + + a mj y m. (5.16) 191
Maximalizovat minimální zaručenou výhru znamená maximalizovat h, tj. Minimalizovat při omezeních 1 h = y 1 + y 2 + + y m 1 a 1j y 1 + a 2j y 2 + + a mj y m, j = 1, 2,..., n. (5.17) To je přesně duální úloha lineárního programování, která nám jako výsledek poskytne příslušnou strategii p. 192
Pro druhého hráče je postup analogický. Hledá h a q tak, aby h a i1 q 1 + a i2 q 2 + + a in q n pro všechna i {1, 2,..., m}, přičemž opět q 1 + q 2 + + q n = 1, q j 0 pro všechna j {1, 2,..., n}. Vydělme nerovnost hodnotou h a označme 1 a i1 q 1 h + a i2 q 2 h + + a in q n h x j = q j h ; zřejmě platí: x 1 + x 2 + + x n = 1 h. Obdržíme nerovnost Minimalizovat h tedy znamená: 1 a i1 x 1 + a i2 x 2 + + a in x n. (5.18) maximalizovat při omezeních 1 h = x 1 + x 2 + + x n 1 a i1 x 1 + a i2 x 2 + + a in x n, i = 1, 2,..., m. (5.19) 193
To je odpovídající primární úloha lineárního programování (aby h byla cena hry, je třeba, aby to v obou případech bylo totéž číslo). 194
Příklad 4 Penalty Střelba penalt může být považována za antagonistickou hru s následující maticí, která udává pravděpodobnost gólu pro různé strategie střelce (1. hráč) a brankáře (2. hráč). Budeme hledat rovnovážný bod v ryzích nebo smíšených strategiích. Strategie skoč vlevo skoč vpravo čekej uprostřed Střílej vlevo 0, 6 0, 7 1 Střílej vpravo 1 0, 8 0, 7 Řešení. g 1 (p) = 0, 6 + 1 p = 1 0, 4p g 2 (p) = 0, 7p + 0, 8(1 p) = 0, 8 0, 1p g 3 (p) = p + 0, 7(1 p) = 0, 7 + 0, 3p Nejvyšší zaručená výhra pro střelce: g 2 (p) = g 3 (p) p = 1 4 Rovnovážný bod: ( 1, ) ( 3 4 4, 0, 3, 1 4 4), cena hry: v = 0, 775 195
Správnost řešení maticových her si můžete zkontrolovat pomocí appletu, který naleznete zde. Následující příklad ilustruje přechod od sedlového prvku k rovnovážnému bodu. Pro hry s nulovým a konstantním součtem se oba pojmy shodují, pro hry s nekonstantním součtem už tomu tak být nemusí: (3, 3) (2, 2) (0, 0) (1, 1) (3, 3) (2, 4) (0, 6) (1, 5) (3, 3) (2, 4) (0, 2) (4, 5) (4, 5)... vzájemně nejlepší odpovědi rovnovážný bod 196