3 ANTAGONISTICKÉ HRY 3. ANTAGONISTICKÝ KONFLIKT Antagonistický konflikt je rozhodovací situace, v níž vystupují dva inteligentní rozhodovatelé, kteří se po volbě svých rozhodnutí rozdělí o pevnou částku, jejíž výše nezávisí na tom, jaká rozhodnutí zvolili. Matematickým modelem antagonistického konfliktu je hra v normálním tvaru s konstantním součtem: {Q={,2};S,T;u (s,t),u 2 (s,t)} u (s,t)+u 2 (s,t)=konst. prokaždé(s,t) S T (3.) Definice. Strategie s,t senazývajírovnovážnévehře(3.),platí-lipro každé s Sakaždé t T: u (s,t ) u (s,t ) azároveň u 2 (s,t) u 2 (s,t ) (3.2) Je-li speciálně součet ve hře(3.) nulový, budeme používat značení model tedy bude vypadat takto: u (s,t)=u 2 (s,t)=u(s,t); {Q={,2};S,T;u(s,t)} (3.3) Prorovnovážnéstrategie s,t vehřesnulovýmsoučtemmusíplatit: u(s,t ) u(s,t ) u(s,t) provšechna s S, t T. (3.4) Hodnota u(s,t )senazývácenahry. Lze dokázat, že ke každé hře tvaru(3.) s konstantním součtem lze přiřadit hru v normálním tvaru s nulovým součtem, která je s původní hrou strategicky ekvivalentní, tj. každá dvojice strategií s, t, které jsou rovnovážné v původní hře, představuje dvojici rovnovážných strategií i v příslušné hře s nulovým součtem a naopak. Přesněji: Věta. Nechť(3.)jehraskonstantnímsoučtemrovným K.Potom s,t jsou rovnovážnéstrategievehře(3.)tehdyajentehdy,jsou-li s,t rovnovážnéstrategie vehřesnulovýmsoučtem(3.3),kde u(s,t)=u (s,t) u 2 (s,t).
3.2 MATICOVÉ HRY Hru dvou hráčů s nulovým součtem a konečnými prostory strategií lze zadat pomocí matice A, A=................. S= {s,s 2,...s m }, T= {t,t 2,...t n } (3.5) = u (s,t ) u (s,t 2 )... u (s,t l ) u (s 2,t ) u (s 2,t 2 )... u (s 2,t l ).................................. u (s k,t ) u (s k,t 2 )... u (s k,t l ) (3.6) jejíž prvky udávají hodnoty výplatní funkce prvního hráče(výplatní funkce druhého hráčemávždyopačnouhodnotu):prvek a ij jerovenhodnotěvýplatnífunkceprvního hráče,zvolil-listrategii s i aprotivníkzvolilstrategii t j.protaktozadanéhryse používá označení maticové hry. Rovnovážné strategie v maticové hře Základní myšlenka, jak nalézt optimální strategie obou hráčů, vychází z toho, že zvýšení zisku jednoho hráče je rovno zvýšení ztráty hráče druhého; chce-li nyní hráč pro sebe získat co nejvyšší zisk, usiluje zároveň o co nejvyšší ztrátu protivníka. Každý hráč proto nyní předpokládá, že jej jeho oponent chce co nejvíce poškodit a při volbě svých strategií postupuje následujícím způsobem. Pro každou svou strategii uvažuje všechny možné strategie oponenta a nalezne pro sebe nejhorší možný výsledek. Pak zvolí tu strategii, pro kterou je tento nejhorší výsledek co nejlepší postupuje tedy cestou nejmenšíhozla. Prvníhráčtedyprokaždousvoustrategii s i,tj.prokaždýřádek i {,2,...,m} matice, nalezne imální prvek, který pro danou strategii představuje imální zaručenou výhru bez ohledu na volbu protivníka. Pak vybere tu strategii, neboli ten řádek, kde je toto imum nejvyšší a tím i nejvyšší zaručená výhra. Podobně postupuje druhý hráč. Pro něj je nejhorší možností ta nejvyšší hodnotavýhryprvníhohráče;protoprokaždousvoustrategii t i,tj.prokaždýsloupec j {,2,...,n}matice,naleznemaximální prvek,kterýprodanoustrategii představuje maximální zaručenou prohru bez ohledu na volbu protivníka. Potom vybere tu strategii, neboli ten sloupec, kde je toto maximum nejmenší, neboli kde je maximální prohra co nejnižší: Hráč2 Hráč s s 2. s k t t 2... t l u (s,t ) u (s,t 2 )... u (s,t l ) u (s 2,t ) u (s 2,t 2 )... u (s 2,t l ).................................. u (s k,t ) u (s k,t 2 )... u (s k,t l ) Hráč: tj u (s i,t j ) MAX Hráč2: max si u (s i,t j ) MIN 2
Zřejmě platí: max s i t j u (s i,t j ) max u (s i,t j ) (3.7) t j s i Platí-li ve vztahu(3.7) rovnost, pak společná hodnota u(s,t )=max s i t j u (s i,t j )=max u (s i,t j ) (3.8) t j s i představujecenuhryadvojicestrategií(s,t )jerovnovážnýmbodem. Prvek u(s,t )mátuvlastnost,žejesoučasněnejmenšínařádkuanejvětší ve sloupci, proto se nazývá sedlový prvek matice. Příklad. Uvažujme hru s maticí Hráč2 t t 2 t 3 t 4 Hráč s s 2 s k 5 4 4 5 4 5 3 9 7 8 8 4 4 max: 7 8 4 9 max s t u (s i,t j )=4= t Dvojicestrategií(s,t 3 )jerovnovážnýmbodemhry. Bohužel, ne vždy sedlový prvek existuje: Příklad. maxu (s i,t j )=u (s,t 3 ) s Hráč2 t t 2 t 3 Hráč s s 2 0 0 s k 0 max: max s t Podobně pro matice: ( A= u (s i,t j )= < t maxu (s i,t j )= s ) ( 0 5/2 2, B= 3 ). (3.9) 3
V těchto případech nezbyde než zavést smíšené strategie. Uvažujme nový model dané rozhodovací situace, původně popsané maticovou hrou s maticí(3.6): Definice 2. Mějme maticovou hru s prostory strategií(3.) a maticí hry(3.6). Hru dvou hráčů s nulovým součtem s prostory strategií S s = {p; p=(p,p 2,...p m ), p + p 2 + +p m =, p o} T s = {q; q=(q,q 2,...q n ), q + q 2 + +q n =, q o} (3.0) a s výplatní funkcí m n π(p,q)= p i a ij q j = paq T (3.) i= j= nazveme smíšeným rozšířením původní maticové hry. Prvky původních prostorů strategií S, T se nazývají ryzí strategie, prvky prostorů S s,t s,kteréudávajírozdělenípravděpodobnostínaprostoruryzíchstrategií, se nazývají smíšené strategie. Věta 2. Základní věta maticových her. Smíšené rozšíření každé maticové hry má řešení v rovnovážných strategiích. Jinýmislovy,prokaždoumatici Aexistujívektory p S s,q T s,prokteré platí: paq T p Aq T p Aq T provšechna p S s, q T s. (3.2) Ještě jinak: Věta. Vždyexistujísmíšenéstrategie(p,q ),prokteré π(p,q )=max p q π(s i,t j )=max π(s q i,t j ) p Věta 3. Rovnovážné strategie smíšeného rozšíření maticové hry se nemění, přičtemelikekaždémuprvkumaticehrytotéžkladnénebozápornéčíslo c.cenahrystakto pozměněnoumaticíje v+ c,kde vjecenapůvodníhry. 4
3.3 GRAFICKÉ ŘEŠENÍ MATICOVÝCH HER PROMATICETYPU(2, n) Středníhodnotyvýhryhráčepřismíšenéstrategii(p, p)apřiryzíchstrategiích hráče 2: Hledáme Nejprve budeme uvažovat funkci g j (p)=pa j +( p)a 2j, j=,2,...,n. (3.3) p :=arg max p 0, g j(p). (3.4) j=,2,...,n ϕ(p):= j=,2,...,n g j(p). (3.5) Tato funkce je konkávní, po částech lineární, snadno nalezneme bod jejího maxima. Hledaná cena hry je potom rovna v= ϕ(p ):= max ϕ(p) (3.6) p 0, ahledanásmíšenárovnovážnástrategiehráčeje(p, p ). Nastává-liextrémvbodě p,kde g j (p )=g k (p )=vprojednoznačněurčené strategie j, k pak složky smíšené rovnovážné strategie hráče 2 s indexy různými od j, k jsou rovny nule. Složky, které mohou být nenulové, získáme vyřešením soustavy a j q j + a k q k = v, q j + q k =, q j 0, q k 0, (3.7) nebo a 2j q j + a 2k q k = v, q j + q k =, q j 0, q k 0. (3.8) 5
Příklad. Grafické určení rovnovážných strategií pro hru s maticí ( ) 5 5/2 3. 4 8 6 g(p) g (p) = 5p+4( p)=p+4 g 2 (p) = 5 p+8( p)= 2 2 p+8 g 3 (p) = 3p+6( p)= 3p+6 8 g 2 (p)= 2 p+8 6 g 3 (p)= 3p+6 g (p)=p+4 4 ϕ(p)= j=,2,...,n g j(p) 0 2 p Grafické řešení antagonistické hry Funkce ϕ(p)nabývásvéhomaximavbodě p= 2,hodnotatohotomaximaje Vyřešením soustavy rovnic získáme q =0.75, q 2 =0.25. Rovnovážný bod je tedy v(m)=4.5. 5q +3q 3 =4.5, q + q 3 =, q 0, q 3 0, p = ( ) ( ) 3 2,, q = 2 4,. 4 6
3.4 OBECNÉ ŘEŠENÍ MATICOVÝCH HER LINEÁRNÍ PROGRAMOVÁNÍ Uvažujme maticovou hru s maticí a smíšené strategie A=................. (3.9) p=(p,p 2,...,p m ), p + p 2 + +p m =, p i 0 i {,2,...,m}, q=(q,q 2,...,q n ), q + q 2 + +q n =, q j 0 j {,2,...,n}. Předpokládejme, že všechny prvky matice A jsou kladné(pokud by nebyly, mohli bychom ke všem prvkům matice přičíst dostatečně vysokou kladnou konstantu c, čímž se podle věty 3 z hlediska strategií nic nezmění). Postup je podobný, jako v případě hledání ryzích rovnovážných strategií. Prvníhráčhledáprolibovolné,alevtutochvílipevné psvouimálnízaručenou výhru h. Uvažujme Zřejmě je h= j {a jp + a 2j p 2 + +a mj p m }. (3.20) h a j p + a 2j p 2 + +a mj p m provšechna j {,2,...,n}. (3.2) Pro každé j udává výraz vpravo očekávanou výhru prvního hráče při jeho smíšené strategii paryzístrategii t j druhéhohráče.očekávanáhodnotavýhry π(p,q)pro smíšenou strategii q druhého hráče je pak lineární kombinací těchto hodnot s koeficienty q,q 2,...,q n,jejichžsoučetjeroven.snadnosimůžemeuvědomit,že nerovnost(3.2) zůstane zachována, bude-li na pravé straně uvedená lineární kombinace: m (q + q 2 + +q n ) } {{ } h q h q (a p + a 2 p 2 + +a m p m ) q 2 h q 2 (a 2 p + a 22 p 2 + +a m2 p m )...................................... q n h q n (a n p + a 2n p 2 + +a mn p m ) i= n p i a ij q j = π(p,q) j= h π(p, q) Hodnota h je proto imální zaručenou výhrou hráče, ať již jeho protivník zvolí jakoukoli ryzí či smíšenou strategii(vzhledem k(3.20) je h největší číslo splňující poslední nerovnost). 7
Nerovnosti(3.2) vydělme hodnotou h p a j h + a p 2 2j h + +a p m mj h aoznačme y i = p i h ; zřejměplatí: y + y 2 + +y m = h. Obdržíme nerovnost a j y + a 2j y 2 + +a mj y m. (3.22) Maximalizovat imální zaručenou výhru znamená maximalizovat h, tj. Minimalizovat při omezeních h = y + y 2 + +y m a j y + a 2j y 2 + +a mj y m, j=,2,...,n. (3.23) To je přesně duální úloha lineárního programování, která nám jako výsledek poskytne příslušnou strategii p. Prodruhéhohráčejepostupanalogický.Druhýhráčhledá haqtak,aby h a i q + a i2 q 2 + +a in q n provšechna i {,2,...,m}, (3.24) přičemžopět q + q 2 + +q n =,q j 0provšechna j {,2,...,n}. Vydělme nerovnost(3.24) hodnotou h q a i h + a q 2 i2 h + +a n inq h aoznačme x j = q j h ; zřejměplatí: x + x 2 + +x n = h. Obdržíme nerovnost a i x + a i2 x 2 + +a in x n. (3.25) Minimalizovat h tedy znamená: maximalizovat při omezeních h = x + x 2 + +x n a i x + a i2 x 2 + +a in x n, i=,2,...,m. (3.26) To je odpovídající primární úloha lineárního programování(aby h byla cenahry,jetřeba,abytovoboupřípadechbylototéžčíslo). 8