ANTAGONISTICKE HRY 172



Podobné dokumenty
3. ANTAGONISTICKÉ HRY

{Q={1,2};S,T;u(s,t)} (3.3) Prorovnovážnéstrategie s,t vehřesnulovýmsoučtemmusíplatit:

Teorie her a ekonomické rozhodování. 2. Maticové hry

Operační výzkum. Teorie her. Hra v normálním tvaru. Optimální strategie. Maticové hry.

Operační výzkum. Teorie her cv. Hra v normálním tvaru. Optimální strategie. Maticové hry.

Teorie her a ekonomické rozhodování. 3. Dvoumaticové hry (Bimaticové hry)

Úvod do teorie her

KOOPERATIVNI HRY DVOU HRA CˇU

TGH13 - Teorie her I.

Kapitola 11: Vektory a matice:

fakulty MENDELU v Brně (LDF) s ohledem na disciplíny společného základu (reg. č. CZ.1.07/2.2.00/28.

LDF MENDELU. Simona Fišnarová (MENDELU) Základy lineárního programování VMAT, IMT 1 / 25

Soustava m lineárních rovnic o n neznámých je systém

Kapitola 4: Extrémy funkcí dvou proměnných 1/5

Úvod do lineární algebry

Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace

0.1 Úvod do lineární algebry

Kapitola 11: Vektory a matice 1/19

IB112 Základy matematiky

Obsah. Lineární rovnice. Definice 7.9. a i x i = a 1 x a n x n = b,

Úlohy nejmenších čtverců

1 Linearní prostory nad komplexními čísly

Operační výzkum. Teorie her. Řešení maticových her převodem na úlohu LP.

7. Důležité pojmy ve vektorových prostorech

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic

5. Lokální, vázané a globální extrémy

Základy matematiky pro FEK

0.1 Úvod do lineární algebry

Matematika B101MA1, B101MA2

Determinanty. Obsah. Aplikovaná matematika I. Pierre Simon de Laplace. Definice determinantu. Laplaceův rozvoj Vlastnosti determinantu.

10. Soustavy lineárních rovnic, determinanty, Cramerovo pravidlo

Lineární programování

Dokažte Větu 2(Minimax) ze třetího dílu seriálu pro libovolnou hru s nulovým součtem, ve kterémákaždýhráčnavýběrprávězedvoustrategií.

KOOPERATIVNÍ HRY FORMULACE, KONCEPCE ŘEŠENÍ, JÁDRO HRY, HRA VE TVARU CHARAKTERISTICKÉ FUNKCE, SHAPLEYOVA HODNOTA CO JE TO TEORIE HER A ČÍM SE ZABÝVÁ?

Fakt. Každou soustavu n lineárních ODR řádů n i lze eliminací převést ekvivalentně na jednu lineární ODR

1 Vektorové prostory.

MATICOVÉ HRY MATICOVÝCH HER

1 Determinanty a inverzní matice

Základy matematiky pro FEK

Matice lineárních zobrazení

1/10. Kapitola 12: Soustavy lineárních algebraických rovnic

Teorie her. RNDr. Magdalena Hykšová, Ph.D. online prostředí, Operační program Praha Adaptabilita, registrační číslo CZ.2.17/3.1.00/31165.

12. Lineární programování

Teorie her a ekonomické rozhodování 5. Opakované hry

THE: Nekooperativní hry s nulovým součtem Non-Cooperative Zero-sum Games

1 Báze a dimenze vektorového prostoru 1

DEFINICE Z LINEÁRNÍ ALGEBRY


Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:

2 Vektorové normy. Základy numerické matematiky - NMNM201. Definice 1 (Norma). Norma je funkcionál splňující pro libovolné vektory x a y a pro

Vlastní (charakteristická) čísla a vlastní (charakteristické) Pro zadanou čtvercovou matici A budeme řešit maticovou

Extrémy funkce dvou proměnných

Greenova funkce pro dvoubodové okrajové úlohy pro obyčejné diferenciální rovnice

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.

TEORIE HER. Základní pojmy teorie her. buď racionální (usiluje o optimální výsledek hry) nebo indiferentní (výsledek hry je mu lhostejný)

Symetrické a kvadratické formy

PROSTORY SE SKALÁRNÍM SOUČINEM. Definice Nechť L je lineární vektorový prostor nad R. Zobrazení L L R splňující vlastnosti

12 HRY S NEÚPLNOU INFORMACÍ

Matice. Předpokládejme, že A = (a ij ) je matice typu m n: diagonálou jsou rovny nule.

Základy maticového počtu Matice, determinant, definitnost

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

VI. Maticový počet. VI.1. Základní operace s maticemi. Definice. Tabulku

Ekonomická formulace. Matematický model

(Cramerovo pravidlo, determinanty, inverzní matice)

Matematika I, část I. Rovnici (1) nazýváme vektorovou rovnicí roviny ABC. Rovina ABC prochází bodem A a říkáme, že má zaměření u, v. X=A+r.u+s.

MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]

Státnicová otázka 6, okruh 1

Uspořádanou n-tici reálných čísel nazveme aritmetický vektor (vektor), ā = (a 1, a 2,..., a n ). Čísla a 1, a 2,..., a n se nazývají složky vektoru

Učební texty k státní bakalářské zkoušce Matematika Základy lineárního programování. študenti MFF 15. augusta 2008

Teorie her a ekonomické rozhodování 6. Kooperativní hry více hráčů

Lineární algebra. Matice, operace s maticemi

Operace s maticemi

3. Grafy a matice. Definice 3.2. Čtvercová matice A se nazývá rozložitelná, lze-li ji napsat ve tvaru A =

Dva podniky vedou mezi sebou spor, k jehož vyřešení může každý z nich podniknout jednu

Univerzita Karlova v Praze Matematicko-fyzikální fakulta. Teorie her v praxi. Katedra pravděpodobnosti a matematické statistiky

Simplexová metoda. Simplexová tabulka: Záhlaví (účelová funkce) A ~ b r βi. z j c j. z r

MATEMATICKÁ TEORIE ROZHODOVÁNÍ

Soustavy lineárních rovnic

7. přednáška Systémová analýza a modelování. Přiřazovací problém

Lineární zobrazení. 1. A(x y) = A(x) A(y) (vlastnost aditivity) 2. A(α x) = α A(x) (vlastnost homogenity)

Úvod do teorie her ZVYŠOVÁNÍ ODBORNÝCH KOMPETENCÍ AKADEMICKÝCH PRACOVNÍKŮ OSTRAVSKÉ UNIVERZITY V OSTRAVĚ A SLEZSKÉ UNIVERZITY V OPAVĚ

Matice. Modifikace matic eliminační metodou. α A = α a 2,1, α a 2,2,..., α a 2,n α a m,1, α a m,2,..., α a m,n

a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:

Parametrické programování

Průvodce studiem. do bodu B se snažíme najít nejkratší cestu. Ve firmách je snaha minimalizovat

Dvou-maticové hry a jejich aplikace

FIT ČVUT MI-LOM Lineární optimalizace a metody. Dualita. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

[1] samoopravné kódy: terminologie, princip

9 Kolmost vektorových podprostorů

Obecná úloha lineárního programování. Úloha LP a konvexní množiny Grafická metoda. Jiří Neubauer. Katedra ekonometrie FEM UO Brno

Soustavy lineárních rovnic a determinanty

Funkce v ıce promˇ enn ych Extr emy Pˇredn aˇska p at a 12.bˇrezna 2018

3. přednáška 15. října 2007

a + b + c = 2 b + c = 1 a b = a 1 2a 1 + a a 3 + a 5 + 2a 2 + a 2 + a

Matematika 1 MA1. 2 Determinant. 3 Adjungovaná matice. 4 Cramerovo pravidlo. 11. přednáška ( ) Matematika 1 1 / 29

Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru

Učební texty k státní bakalářské zkoušce Matematika Diferenciální rovnice. študenti MFF 15. augusta 2008

8.3). S ohledem na jednoduchost a názornost je výhodné seznámit se s touto Základní pojmy a vztahy. Definice

2 Spojité modely rozhodování

Operace s maticemi. 19. února 2018

Transkript:

5 ANTAGONISTICKÉ HRY 172

Antagonistický konflikt je rozhodovací situace, v níž vystupují dva inteligentní rozhodovatelé, kteří se po volbě svých rozhodnutí rozdělí o pevnou částku, jejíž výše nezávisí na tom, jaká rozhodnutí zvolili. Matematickým modelem antagonistického konfliktu je hra v normálním tvaru s konstantním součtem: {Q = {1, 2}; S, T ; u 1 (s, t), u 2 (s, t)} u 1 (s, t) + u 2 (s, t) = konst. pro každé (s, t) S T 173

Definice 1. Strategie s, t se nazývají rovnovážné ve hře (5), platí-li pro každé s S a každé t T : u 1 (s, t ) u 1 (s, t ) a zároveň u 2 (s, t) u 2 (s, t ) Je-li speciálně součet ve hře nulový, budeme používat značení model tedy bude vypadat takto: u 1 (s, t) = u 2 (s, t) = u(s, t); {Q = {1, 2}; S, T ; u(s, t)} (5.1) Pro rovnovážné strategie s, t ve hře s nulovým součtem musí platit: u(s, t ) u(s, t ) u(s, t) pro všechna s S, t T. (5.2) Hodnota u(s, t ) se nazývá cena hry. 174

Lze dokázat, že ke každé hře tvaru (5) s konstantním součtem lze přiřadit hru v normálním tvaru s nulovým součtem, která je s původní hrou strategicky ekvivalentní, tj. každá dvojice strategií s, t, které jsou rovnovážné v původní hře, představuje dvojici rovnovážných strategií i v příslušné hře s nulovým součtem a naopak. Přesněji: Věta 1. Necht (5) je hra s konstantním součtem rovným K. Potom s, t jsou rovnovážné strategie ve hře (5) tehdy a jen tehdy, jsou-li s, t rovnovážné strategie ve hře s nulovým součtem (5.1), kde u(s, t) = u 1 (s, t) u 2 (s, t). 175

MATICOVÉ HRY Hru dvou hráčů s nulovým součtem a konečnými prostory strategií S = {s 1, s 2,... s m }, T = {t 1, t 2,... t n } (5.3) lze zadat pomocí matice A = a 11 a 12... a 1n a 21 a 22... a 2n.................... a m1 a m2... a mn = u 1 (s 1, t 1 ) u 1 (s 1, t 2 )... u 1 (s 1, t l ) u 1 (s 2, t 1 ) u 1 (s 2, t 2 )... u 1 (s 2, t l )................................... u 1 (s k, t 1 ) u 1 (s k, t 2 )... u 1 (s k, t l ) jejíž prvky udávají hodnoty výplatní funkce prvního hráče (výplatní funkce druhého hráče má vždy opačnou hodnotu): prvek a ij je roven hodnotě výplatní funkce prvního hráče, zvolil-li strategii s i a protivník zvolil strategii t j. Pro takto zadané hry se používá označení maticové hry. 176

Rovnovážné strategie v maticové hře První hráč pro každou svou strategii s i, tj. pro každý řádek i {1, 2,..., m} matice, nalezne minimální prvek, který pro danou strategii představuje minimální zaručenou výhru bez ohledu na volbu protivníka. Pak vybere tu strategii, neboli ten řádek, kde je toto minimum nejvyšší a tím i nejvyšší zaručená výhra nejmenší zlo. Podobně postupuje druhý hráč. Pro něj je nejhorší možností ta nejvyšší hodnota výhry prvního hráče; proto pro každou svou strategii t i, tj. pro každý sloupec j {1, 2,..., n} matice, nalezne maximální prvek, který pro danou strategii představuje maximální zaručenou prohru bez ohledu na volbu protivníka. Potom vybere tu strategii, neboli ten sloupec, kde je toto maximum nejmenší, neboli kde je maximální prohra co nejnižší. 177

Hráč 2 Hráč 1 s 1 s 2. s k t 1 t 2... t l u 1 (s 1, t 1 ) u 1 (s 1, t 2 )... u 1 (s 1, t l ) u 1 (s 2, t 1 ) u 1 (s 2, t 2 )... u 1 (s 2, t l ).................................. u 1 (s k, t 1 ) u 1 (s k, t 2 )... u 1 (s k, t l ) Hráč 1: min tj u 1 (s i, t j ) MAX Hráč 2: max si u 1 (s i, t j ) MIN Zřejmě platí: max s i min t j u 1 (s i, t j ) min max u 1 (s i, t j ) (5.4) t j s i 178

Platí-li ve vztahu (5.4) rovnost, pak společná hodnota u(s, t ) = max s i min t j u 1 (s i, t j ) = min max u 1 (s i, t j ) (5.5) t j s i představuje cenu hry a dvojice strategií (s, t ) je rovnovážným bodem. Prvek u(s, t ) má tu vlastnost, že je současně nejmenší na řádku a největší ve sloupci, proto se nazývá sedlový prvek matice. 179

Příklad 1. Uvažujme hru s maticí Hráč 2 t 1 t 2 t 3 t 4 Hráč 1 s 1 s 2 s k 5 4 4 5 4 5 3 9 7 8 1 8 4 4 1 min max: 7 8 4 9 max s min t u 1 (s i, t j ) = 4 = min t max u 1 (s i, t j ) = u 1 (s 1, t 3 ) s Dvojice strategií (s 1, t 3 ) je rovnovážným bodem hry. 180

Bohužel, ne vždy sedlový prvek existuje: Příklad 2. Hráč 2 t 1 t 2 t 3 Hráč 1 s 1 s 2 s k 0 1 1 1 0 1 1 1 0 1 1 1 min max: 1 1 1 max s min t u 1 (s i, t j ) = 1 < min t max u 1 (s i, t j ) = 1 s 181

Podobně pro matice: A = ( 1 1 1 1 ) ( 0 5/2 2, B = 1 3 1 ). (5.6) V těchto případech nezbyde než zavést smíšené strategie. Uvažujme nový model dané rozhodovací situace, původně popsané maticovou hrou s maticí (5): 182

Definice 2. Mějme maticovou hru s prostory strategií (5.8) a maticí hry (5). Hru dvou hráčů s nulovým součtem s prostory strategií S s = {p; p = (p 1,... p m ), p 1 + + p m = 1, p o} T s = {q; q = (q 1,... q n ), q 1 + + q n = 1, q o} a s výplatní funkcí (5.7) π(p, q) = m n p i a ij q j = paq T (5.8) i=1 j=1 nazveme smíšeným rozšířením původní maticové hry. Prvky původních prostorů strategiís, T se nazývají ryzí strategie, prvky prostorů S s, T s, které udávají rozdělení pravděpodobností na prostoru ryzích strategií, se nazývají smíšené strategie. Věta 2. Základní věta maticových her. Smíšené rozšíření každé maticové hry má řešení v rovnovážných strategiích. 183

Tj. pro každou matici A existují vektory p S s, q T s : paq T p Aq T p Aq T pro všechna p S s, q T s. (5.9) Ještě jinak: Věta. Vždy existují smíšené strategie (p, q ), pro které π(p, q ) = max p min q π(s i, t j ) = min q max π(s i, t j ) p Věta 3. Rovnovážné strategie smíšeného rozšíření maticové hry se nemění, přičteme-li ke každému prvku matice hry totéž kladné nebo záporné číslo c. Cena hry s takto pozměněnou maticí je v + c, kde v je cena původní hry. 184

GRAFICKÉ ŘEŠENÍ MATICOVÝCH HER PRO MATICE TYPU (2, n) Střední hodnoty výhry hráče 1 při smíšené strategii (p, 1 p) a při ryzích strategiích hráče 2: Hledáme g j (p) = pa 1j + (1 p)a 2j, j = 1, 2,..., n. (5.10) p := arg max p 0,1 Nejprve budeme uvažovat funkci ϕ(p) := min g j(p). (5.11) j=1,2,...,n min g j(p). (5.12) j=1,2,...,n Tato funkce je konkávní, po částech lineární, snadno nalezneme bod jejího maxima. Hledaná cena hry je potom rovna v = ϕ(p ) := max ϕ(p) (5.13) p 0,1 a hledaná smíšená rovnovážná strategie hráče 1 je (p, 1 p ). Nastává-li extrém v bodě p, kde g j (p ) = g k (p ) = v pro jednoznačně určené strategie j, k pak složky smíšené rovnovážné 185

strategie hráče 2 s indexy různými od j, k jsou rovny nule. Složky, které mohou být nenulové, získáme vyřešením soustavy a 1j q j + a 1k q k = v, q j + q k = 1, q j 0, q k 0, nebo a 2j q j + a 2k q k = v, q j + q k = 1, q j 0, q k 0. 186

Příklad 3. Určení rovnovážných strategií pro hru s maticí ( 5 5/2 3 4 8 6 ). g 1 (p) = 5p + 4(1 p) = p + 4 g 2 (p) = 5 p + 8(1 p) = 11 2 2 p + 8 g 3 (p) = 3p + 6(1 p) = 3p + 6 ϕ(p) nabývá maxima v bodě p = 1, hodnota tohoto maxima je 2 Vyřešením soustavy rovnic v(m) = 4.5. 5q 1 + 3q 3 = 4.5, q 1 + q 3 = 1, q 1 0, q 3 0, získáme q 1 = 0.75, q 2 = 0.25. Rovnovážný bod je tedy p = ( 1, ) 1 2 2, q = ( 3, 1 4 4). 187

188

OBECNÉ ŘEŠENÍ MATICOVÝCH HER LINEÁRNÍ PROGRAMOVÁNÍ Uvažujme maticovou hru s maticí a 11 a 12... a 1n a A = 21 a 22... a 2n................... a m1 a m2... a mn (5.14) a smíšené strategie p = (p 1,..., p m ), p 1 + + p m = 1, p i 0 i {1,..., m}, q = (q 1,..., q n ), q 1 + + q n = 1, q j 0 j {1,..., n}. Předpokládejme, že všechny prvky matice A jsou kladné (Pokud by nebyly, mohli bychom ke všem prvkům matice přičíst dostatečně vysokou kladnou konstantu c, čímž se podle věty 3 z hlediska strategií nic nezmění). 189

Postup je podobný, jako v případě hledání ryzích rovnovážných strategií. První hráč hledá pro libovolné, ale v tuto chvíli pevné p svou minimální zaručenou výhru h. Uvažujme Zřejmě je h = min j {a 1jp 1 + a 2j p 2 + + a mj p m }. (5.15) h a 1j p 1 + a 2j p 2 + + a mj p m pro všechna j {1, 2,..., n}. m (q 1 + q 2 + + q n ) } {{ } h 1 q 1 h q 1 (a 11 p 1 + a 21 p 2 + + a m1 p m ) q 2 h q 2 (a 12 p 1 + a 22 p 2 + + a m2 p m )...................................... q n h q n (a 1n p 1 + a 2n p 2 + + a mn p m ) i=1 n p i a ij q j = π(p, q) j=1 h π(p, q) 190

Hodnota h je proto minimální zaručenou výhrou hráče 1, at již jeho protivník zvolí jakoukoli ryzí či smíšenou strategii (vzhledem k (5.15) je h největší číslo splňující poslední nerovnost). Nerovnosti h a 1j p 1 + a 2j p 2 + + a mj p m pro všechna j {1, 2,..., n}. vydělme hodnotou h a označme p 1 1 a 1j h + a p 2 2j h + + a p m mj h y i = p i h ; zřejmě platí: y 1 + y 2 + + y m = 1 h. Obdržíme nerovnost 1 a 1j y 1 + a 2j y 2 + + a mj y m. (5.16) 191

Maximalizovat minimální zaručenou výhru znamená maximalizovat h, tj. Minimalizovat při omezeních 1 h = y 1 + y 2 + + y m 1 a 1j y 1 + a 2j y 2 + + a mj y m, j = 1, 2,..., n. (5.17) To je přesně duální úloha lineárního programování, která nám jako výsledek poskytne příslušnou strategii p. 192

Pro druhého hráče je postup analogický. Hledá h a q tak, aby h a i1 q 1 + a i2 q 2 + + a in q n pro všechna i {1, 2,..., m}, přičemž opět q 1 + q 2 + + q n = 1, q j 0 pro všechna j {1, 2,..., n}. Vydělme nerovnost hodnotou h a označme 1 a i1 q 1 h + a i2 q 2 h + + a in q n h x j = q j h ; zřejmě platí: x 1 + x 2 + + x n = 1 h. Obdržíme nerovnost Minimalizovat h tedy znamená: 1 a i1 x 1 + a i2 x 2 + + a in x n. (5.18) maximalizovat při omezeních 1 h = x 1 + x 2 + + x n 1 a i1 x 1 + a i2 x 2 + + a in x n, i = 1, 2,..., m. (5.19) 193

To je odpovídající primární úloha lineárního programování (aby h byla cena hry, je třeba, aby to v obou případech bylo totéž číslo). 194

Příklad 4 Penalty Střelba penalt může být považována za antagonistickou hru s následující maticí, která udává pravděpodobnost gólu pro různé strategie střelce (1. hráč) a brankáře (2. hráč). Budeme hledat rovnovážný bod v ryzích nebo smíšených strategiích. Strategie skoč vlevo skoč vpravo čekej uprostřed Střílej vlevo 0, 6 0, 7 1 Střílej vpravo 1 0, 8 0, 7 Řešení. g 1 (p) = 0, 6 + 1 p = 1 0, 4p g 2 (p) = 0, 7p + 0, 8(1 p) = 0, 8 0, 1p g 3 (p) = p + 0, 7(1 p) = 0, 7 + 0, 3p Nejvyšší zaručená výhra pro střelce: g 2 (p) = g 3 (p) p = 1 4 Rovnovážný bod: ( 1, ) ( 3 4 4, 0, 3, 1 4 4), cena hry: v = 0, 775 195

Správnost řešení maticových her si můžete zkontrolovat pomocí appletu, který naleznete zde. Následující příklad ilustruje přechod od sedlového prvku k rovnovážnému bodu. Pro hry s nulovým a konstantním součtem se oba pojmy shodují, pro hry s nekonstantním součtem už tomu tak být nemusí: (3, 3) (2, 2) (0, 0) (1, 1) (3, 3) (2, 4) (0, 6) (1, 5) (3, 3) (2, 4) (0, 2) (4, 5) (4, 5)... vzájemně nejlepší odpovědi rovnovážný bod 196