3. ANTAGONISTICKÉ HRY

Podobné dokumenty
ANTAGONISTICKE HRY 172

{Q={1,2};S,T;u(s,t)} (3.3) Prorovnovážnéstrategie s,t vehřesnulovýmsoučtemmusíplatit:

Teorie her a ekonomické rozhodování. 2. Maticové hry

Operační výzkum. Teorie her. Hra v normálním tvaru. Optimální strategie. Maticové hry.

Operační výzkum. Teorie her cv. Hra v normálním tvaru. Optimální strategie. Maticové hry.

Teorie her a ekonomické rozhodování. 3. Dvoumaticové hry (Bimaticové hry)

Úvod do teorie her

KOOPERATIVNI HRY DVOU HRA CˇU

fakulty MENDELU v Brně (LDF) s ohledem na disciplíny společného základu (reg. č. CZ.1.07/2.2.00/28.

TGH13 - Teorie her I.

LDF MENDELU. Simona Fišnarová (MENDELU) Základy lineárního programování VMAT, IMT 1 / 25

Kapitola 11: Vektory a matice:

Úvod do lineární algebry

Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace

IB112 Základy matematiky

0.1 Úvod do lineární algebry

Operační výzkum. Teorie her. Řešení maticových her převodem na úlohu LP.

5. Lokální, vázané a globální extrémy

Obsah. Lineární rovnice. Definice 7.9. a i x i = a 1 x a n x n = b,

1 Linearní prostory nad komplexními čísly

Soustava m lineárních rovnic o n neznámých je systém

7. Důležité pojmy ve vektorových prostorech

1 Vektorové prostory.

0.1 Úvod do lineární algebry

Úlohy nejmenších čtverců

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic

Základy matematiky pro FEK

1/10. Kapitola 12: Soustavy lineárních algebraických rovnic

Lineární programování

Dokažte Větu 2(Minimax) ze třetího dílu seriálu pro libovolnou hru s nulovým součtem, ve kterémákaždýhráčnavýběrprávězedvoustrategií.

Fakt. Každou soustavu n lineárních ODR řádů n i lze eliminací převést ekvivalentně na jednu lineární ODR

Kapitola 4: Extrémy funkcí dvou proměnných 1/5

Determinanty. Obsah. Aplikovaná matematika I. Pierre Simon de Laplace. Definice determinantu. Laplaceův rozvoj Vlastnosti determinantu.

1 Determinanty a inverzní matice

Kapitola 11: Vektory a matice 1/19

Základy matematiky pro FEK

Vlastní (charakteristická) čísla a vlastní (charakteristické) Pro zadanou čtvercovou matici A budeme řešit maticovou

Matice lineárních zobrazení

Matematika B101MA1, B101MA2

10. Soustavy lineárních rovnic, determinanty, Cramerovo pravidlo

PROSTORY SE SKALÁRNÍM SOUČINEM. Definice Nechť L je lineární vektorový prostor nad R. Zobrazení L L R splňující vlastnosti

Základy maticového počtu Matice, determinant, definitnost

KOOPERATIVNÍ HRY FORMULACE, KONCEPCE ŘEŠENÍ, JÁDRO HRY, HRA VE TVARU CHARAKTERISTICKÉ FUNKCE, SHAPLEYOVA HODNOTA CO JE TO TEORIE HER A ČÍM SE ZABÝVÁ?

MATICOVÉ HRY MATICOVÝCH HER

1 Báze a dimenze vektorového prostoru 1

Teorie her. RNDr. Magdalena Hykšová, Ph.D. online prostředí, Operační program Praha Adaptabilita, registrační číslo CZ.2.17/3.1.00/31165.

2 Vektorové normy. Základy numerické matematiky - NMNM201. Definice 1 (Norma). Norma je funkcionál splňující pro libovolné vektory x a y a pro

Extrémy funkce dvou proměnných

VI. Maticový počet. VI.1. Základní operace s maticemi. Definice. Tabulku

12 HRY S NEÚPLNOU INFORMACÍ

TEORIE HER. Základní pojmy teorie her. buď racionální (usiluje o optimální výsledek hry) nebo indiferentní (výsledek hry je mu lhostejný)

12. Lineární programování

Matice. Předpokládejme, že A = (a ij ) je matice typu m n: diagonálou jsou rovny nule.

THE: Nekooperativní hry s nulovým součtem Non-Cooperative Zero-sum Games

Teorie her a ekonomické rozhodování 5. Opakované hry

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

Ekonomická formulace. Matematický model

Matematika I, část I. Rovnici (1) nazýváme vektorovou rovnicí roviny ABC. Rovina ABC prochází bodem A a říkáme, že má zaměření u, v. X=A+r.u+s.

Učební texty k státní bakalářské zkoušce Matematika Základy lineárního programování. študenti MFF 15. augusta 2008

DEFINICE Z LINEÁRNÍ ALGEBRY

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:

Uspořádanou n-tici reálných čísel nazveme aritmetický vektor (vektor), ā = (a 1, a 2,..., a n ). Čísla a 1, a 2,..., a n se nazývají složky vektoru

Operace s maticemi

3. Grafy a matice. Definice 3.2. Čtvercová matice A se nazývá rozložitelná, lze-li ji napsat ve tvaru A =

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.

Dva podniky vedou mezi sebou spor, k jehož vyřešení může každý z nich podniknout jednu

7. přednáška Systémová analýza a modelování. Přiřazovací problém

Soustavy lineárních rovnic

Ohraničená Hessova matice ( bordered hessian ) je. Sestrojíme posloupnost determinantů (minorů):

Lineární zobrazení. 1. A(x y) = A(x) A(y) (vlastnost aditivity) 2. A(α x) = α A(x) (vlastnost homogenity)

(Cramerovo pravidlo, determinanty, inverzní matice)

a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:

Parametrické programování

4EK213 LINEÁRNÍ MODELY

Průvodce studiem. do bodu B se snažíme najít nejkratší cestu. Ve firmách je snaha minimalizovat

Greenova funkce pro dvoubodové okrajové úlohy pro obyčejné diferenciální rovnice

FIT ČVUT MI-LOM Lineární optimalizace a metody. Dualita. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Funkce v ıce promˇ enn ych Extr emy Pˇredn aˇska p at a 12.bˇrezna 2018

Státnicová otázka 6, okruh 1

Simplexová metoda. Simplexová tabulka: Záhlaví (účelová funkce) A ~ b r βi. z j c j. z r


a + b + c = 2 b + c = 1 a b = a 1 2a 1 + a a 3 + a 5 + 2a 2 + a 2 + a

Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru

8.3). S ohledem na jednoduchost a názornost je výhodné seznámit se s touto Základní pojmy a vztahy. Definice

Úvod do teorie her ZVYŠOVÁNÍ ODBORNÝCH KOMPETENCÍ AKADEMICKÝCH PRACOVNÍKŮ OSTRAVSKÉ UNIVERZITY V OSTRAVĚ A SLEZSKÉ UNIVERZITY V OPAVĚ

Operace s maticemi. 19. února 2018

Univerzita Karlova v Praze Matematicko-fyzikální fakulta. Teorie her v praxi. Katedra pravděpodobnosti a matematické statistiky

1. července 2010

VĚTY Z LINEÁRNÍ ALGEBRY

4EK213 Lineární modely. 4. Simplexová metoda - závěr

Determinanty. Determinanty. Přednáška MATEMATIKA č. 3. Jiří Neubauer

4 DVOJMATICOVÉ HRY. Strategie Stiskni páku Sed u koryta. Stiskni páku (8, 2) (5, 3) Sed u koryta (10, 2) (0, 0)

15 Maticový a vektorový počet II

MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]

MATEMATICKÁ TEORIE ROZHODOVÁNÍ

Obecná úloha lineárního programování. Úloha LP a konvexní množiny Grafická metoda. Jiří Neubauer. Katedra ekonometrie FEM UO Brno

Jiří Neubauer. Katedra ekonometrie FEM UO Brno

Soustavy lineárních rovnic a determinanty

Dvou-maticové hry a jejich aplikace

Vektorový prostor. Př.1. R 2 ; R 3 ; R n Dvě operace v R n : u + v = (u 1 + v 1,...u n + v n ), V (E 3 )...množina vektorů v E 3,

Transkript:

3. ANTAGONISTICKÉ HRY ANTAGONISTICKÝ KONFLIKT Antagonistický konflikt je rozhodovací situace, v níž vystupují dva inteligentní rozhodovatelé, kteří se po volbě svých rozhodnutí rozdělí o pevnou částku, jejíž výše nezávisí na tom, jaká rozhodnutí zvolili. Matematickým modelem antagonistického konfliktu je hra v normálním tvaru s konstantním součtem: {Q = {1, 2}; S, T ; u 1 (s, t), u 2 (s, t)} u 1 (s, t) + u 2 (s, t) = konst. pro každé (s, t) S T

Definice. Strategie s, t se nazývají rovnovážné ve hře (3), platí-li pro každé s S a každé t T : u 1 (s, t ) u 1 (s, t ) a zároveň u 2 (s, t) u 2 (s, t ) Je-li speciálně součet ve hře nulový, budeme používat značení model tedy bude vypadat takto: u 1 (s, t) = u 2 (s, t) = u(s, t); {Q = {1, 2}; S, T ; u(s, t)} (3.1) Pro rovnovážné strategie s, t ve hře s nulovým součtem musí platit: u(s, t ) u(s, t ) u(s, t) pro všechna s S, t T. (3.2) Hodnota u(s, t ) se nazývá cena hry. 2

3 Lze dokázat, že ke každé hře tvaru (3) s konstantním součtem lze přiřadit hru v normálním tvaru s nulovým součtem, která je s původní hrou strategicky ekvivalentní, tj. každá dvojice strategií s, t, které jsou rovnovážné v původní hře, představuje dvojici rovnovážných strategií i v příslušné hře s nulovým součtem a naopak. Přesněji: Věta. Necht (3) je hra s konstantním součtem rovným K. Potom s, t jsou rovnovážné strategie ve hře (3) tehdy a jen tehdy, jsouli s, t rovnovážné strategie ve hře s nulovým součtem (3.1), kde u(s, t) = u 1 (s, t) u 2 (s, t).

4 MATICOVÉ HRY Hru dvou hráčů s nulovým součtem a konečnými prostory strategií S = {s 1, s 2,... s m }, T = {t 1, t 2,... t n } (3.3) lze zadat pomocí matice A = a 11 a 12... a 1n a 11 a 12... a 1n................. a 11 a 12... a 1n = u 1 (s 1, t 1 ) u 1 (s 1, t 2 )... u 1 (s 1, t l ) u 1 (s 2, t 1 ) u 1 (s 2, t 2 )... u 1 (s 2, t l ).................................. u 1 (s k, t 1 ) u 1 (s k, t 2 )... u 1 (s k, t l ) jejíž prvky udávají hodnoty výplatní funkce prvního hráče (výplatní funkce druhého hráče má vždy opačnou hodnotu): prvek a ij je roven hodnotě výplatní funkce prvního hráče, zvolil-li strategii s i a protivník zvolil strategii t j. Pro takto zadané hry se používá označení maticové hry.

5 Rovnovážné strategie v maticové hře První hráč pro každou svou strategii s i, tj. pro každý řádek i {1, 2,..., m} matice, nalezne minimální prvek, který pro danou strategii představuje minimální zaručenou výhru bez ohledu na volbu protivníka. Pak vybere tu strategii, neboli ten řádek, kde je toto minimum nejvyšší a tím i nejvyšší zaručená výhra nejmenší zlo. Podobně postupuje druhý hráč. Pro něj je nejhorší možností ta nejvyšší hodnota výhry prvního hráče; proto pro každou svou strategii t i, tj. pro každý sloupec j {1, 2,..., n} matice, nalezne maximální prvek, který pro danou strategii představuje maximální zaručenou prohru bez ohledu na volbu protivníka. Potom vybere tu strategii, neboli ten sloupec, kde je toto maximum nejmenší, neboli kde je maximální prohra co nejnižší.

6 Hráč 2 Hráč 1 s 1 s 2. s k t 1 t 2... t l u 1 (s 1, t 1 ) u 1 (s 1, t 2 )... u 1 (s 1, t l ) u 1 (s 2, t 1 ) u 1 (s 2, t 2 )... u 1 (s 2, t l )................................. u 1 (s k, t 1 ) u 1 (s k, t 2 )... u 1 (s k, t l ) Hráč 1: min tj u 1 (s i, t j ) MAX Hráč 2: max si u 1 (s i, t j ) MIN Zřejmě platí: max s i min t j u 1 (s i, t j ) min max u 1 (s i, t j ) (3.4) t j s i

7 Platí-li ve vztahu (3.4) rovnost, pak společná hodnota u(s, t ) = max s i min t j u 1 (s i, t j ) = min max u 1 (s i, t j ) (3.5) t j s i představuje cenu hry a dvojice strategií (s, t ) je rovnovážným bodem. Prvek u(s, t ) má tu vlastnost, že je současně nejmenší na řádku a největší ve sloupci, proto se nazývá sedlový prvek matice.

8 Příklad. Uvažujme hru s maticí Hráč 2 t 1 t 2 t 3 t 4 Hráč 1 s 1 s 2 s k 5 4 4 5 4 5 3 9 7 8 1 8 4 4 1 min max: 7 8 4 9 max s min t u 1 (s i, t j ) = 4 = min t max u 1 (s i, t j ) = u 1 (s 1, t 3 ) s Dvojice strategií (s 1, t 3 ) je rovnovážným bodem hry.

9 Bohužel, ne vždy sedlový prvek existuje: Příklad. Hráč 2 t 1 t 2 t 3 Hráč 1 s 1 s 2 s k 0 1 1 1 0 1 1 1 0 1 1 1 min max: 1 1 1 max s min t u 1 (s i, t j ) = 1 < min t max u 1 (s i, t j ) = 1 s

10 Podobně pro matice: A = ( 1 1 1 1 ) ( 0 5/2 2, B = 1 3 1 ). (3.6) V těchto případech nezbyde než zavést smíšené strategie. Uvažujme nový model dané rozhodovací situace, původně popsané maticovou hrou s maticí (3):

Definice. Mějme maticovou hru s prostory strategií (3.8) a maticí hry (3). Hru dvou hráčů s nulovým součtem s prostory strategií S s = {p; p = (p 1,... p m ), p 1 + + p m = 1, p o} T s = {q; q = (q 1,... q n ), q 1 + + q n = 1, q o} (3.7) a s výplatní funkcí π(p, q) = m n p i a ij q j = paq T (3.8) i=1 j=1 nazveme smíšeným rozšířením původní maticové hry. Prvky původních prostorů strategií S, T se nazývají ryzí strategie, prvky prostorů S s, T s, které udávají rozdělení pravděpodobností na prostoru ryzích strategií, se nazývají smíšené strategie. 11

Věta. Základní věta maticových her. Smíšené rozšíření každé maticové hry má řešení v rovnovážných strategiích. Tj. pro každou matici A existují vektory p S s, q T s : paq T p Aq T p Aq T pro všechna p S s, q T s. (3.9) Ještě jinak: Věta. Vždy existují smíšené strategie (p, q ), pro které π(p, q ) = max p min q π(s i, t j ) = min q max π(s i, t j ) p Věta. Rovnovážné strategie smíšeného rozšíření maticové hry se nemění, přičteme-li ke každému prvku matice hry totéž kladné nebo záporné číslo c. Cena hry s takto pozměněnou maticí je v + c, kde v je cena původní hry. 12

GRAFICKÉ ŘEŠENÍ MATICOVÝCH HER PRO MATICE TYPU (2, n) Střední hodnoty výhry hráče 1 při smíšené strategii (p, 1 p) a při ryzích strategiích hráče 2: g j (p) = pa 1j + (1 p)a 2j, j = 1, 2,..., n. (3.10) Hledáme p := arg max p 0,1 Nejprve budeme uvažovat funkci ϕ(p) := min g j(p). (3.11) j=1,2,...,n min g j(p). (3.12) j=1,2,...,n Tato funkce je konkávní, po částech lineární, snadno nalezneme bod jejího maxima. Hledaná cena hry je potom rovna v = ϕ(p ) := max p 0,1 ϕ(p) (3.13) 13

14 a hledaná smíšená rovnovážná strategie hráče 1 je (p, 1 p ). Nastává-li extrém v bodě p, kde g j (p ) = g k (p ) = v pro jednoznačně určené strategie j, k pak složky smíšené rovnovážné strategie hráče 2 s indexy různými od j, k jsou rovny nule. Složky, které mohou být nenulové, získáme vyřešením soustavy a 1j q j + a 1k q k = v, q j + q k = 1, q j 0, q k 0, nebo a 2j q j + a 2k q k = v, q j + q k = 1, q j 0, q k 0.

Příklad. Určení rovnovážných strategií pro hru s maticí ( 5 5/2 3 4 8 6 ). g 1 (p) = 5p + 4(1 p) = p + 4 g 2 (p) = 5 2 p + 8(1 p) = 11 2 p + 8 g 3 (p) = 3p + 6(1 p) = 3p + 6 ϕ(p) nabývá maxima v bodě p = 1, hodnota tohoto maxima je 2 Vyřešením soustavy rovnic v(m) = 4.5. 5q 1 + 3q 3 = 4.5, q 1 + q 3 = 1, q 1 0, q 3 0, získáme q 1 = 0.75, q 2 = 0.25. Rovnovážný bod je tedy p = ( 1, ) 1 2 2, q = ( 3, 1 4 4). 15

16

OBECNÉ ŘEŠENÍ MATICOVÝCH HER LINEÁRNÍ PROGRAMOVÁNÍ Uvažujme maticovou hru s maticí a 11 a 12... a 1n a A = 11 a 12... a 1n................ a 11 a 12... a 1n (3.14) a smíšené strategie p = (p 1,..., p m ), p 1 + + p m = 1, p i 0 i {1,..., m} q = (q 1,..., q n ), q 1 + + q n = 1, q j 0 j {1,..., n}. Předpokládejme, že všechny prvky matice A jsou kladné (Pokud by nebyly, mohli bychom ke všem prvkům matice přičíst dostatečně vysokou kladnou konstantu c, čímž se podle věty 3 z hlediska strategií nic nezmění). 17

Postup je podobný, jako v případě hledání ryzích rovnovážných strategií. První hráč hledá pro libovolné, ale v tuto chvíli pevné p svou minimální zaručenou výhru h. Uvažujme Zřejmě je h = min j {a 1jp 1 + a 2j p 2 + + a mj p m }. (3.15) h a 1j p 1 +a 2j p 2 + +a mj p m pro všechna j {1, 2,..., n}. q 1 h q 1 (a 11 p 1 + a 21 p 2 + + a m1 p m ) q 2 h q 2 (a 12 p 1 + a 22 p 2 + + a m2 p m )...................................... q n h q n (a 1n p 1 + a 2n p 2 + + a mn p m ) m (q 1 + q 2 + + q n ) }{{} h 1 i=1 j=1 h π(p, q) n p i a ij q j = π(p, q) 18

19 Hodnota h je proto minimální zaručenou výhrou hráče 1, at již jeho protivník zvolí jakoukoli ryzí či smíšenou strategii (vzhledem k (3.15) je h největší číslo splňující poslední nerovnost). Nerovnosti h a 1j p 1 +a 2j p 2 + +a mj p m pro všechna j {1, 2,..., n}. vydělme hodnotou h a označme p 1 1 a 1j h + a p 2 2j h + + a p m mj h y i = p i h ; zřejmě platí: y 1 + y 2 + + y m = 1 h. Obdržíme nerovnost 1 a 1j y 1 + a 2j y 2 + + a mj y m. (3.16)

20 Maximalizovat minimální zaručenou výhru znamená maximalizovat h, tj. Minimalizovat při omezeních 1 h = y 1 + y 2 + + y m 1 a 1j y 1 + a 2j y 2 + + a mj y m, j = 1, 2,..., n. (3.17) To je přesně duální úloha lineárního programování, která nám jako výsledek poskytne příslušnou strategii p.

Pro druhého hráče je postup analogický. Hledá h a q tak, aby h a i1 q 1 +a i2 q 2 + +a in q n pro všechna i {1, 2,..., m}, přičemž opět q 1 + q 2 + + q n = 1, q j 0 pro všechna j {1, 2,..., n}. Vydělme nerovnost hodnotou h a označme q 1 1 a i1 h + a q 2 i2 h + + a q n in h x j = q j h ; zřejmě platí: x 1 + x 2 + + x n = 1 h. Obdržíme nerovnost 1 a i1 x 1 + a i2 x 2 + + a in x n. (3.18) Minimalizovat h tedy znamená: 21

22 maximalizovat při omezeních 1 h = x 1 + x 2 + + x n 1 a i1 x 1 + a i2 x 2 + + a in x n, i = 1, 2,..., m. (3.19) To je odpovídající primární úloha lineárního programování (aby h byla cena hry, je třeba, aby to v obou případech bylo totéž číslo).

23 (3, 3) (2, 2) (0, 0) (1, 1) (3, 3) (2, 4) (0, 6) (1, 5) (3, 3) (2, 4) (0, 2) (4, 5) (4, 5)... vzájemně nejlepší odpovědi rovnovážný bod

1979 B. A. Baldwin, G. B. Meese: Skinnerův chlívek 24

1979 B. A. Baldwin, G. B. Meese: Skinnerův chlívek 25

1979 B. A. Baldwin, G. B. Meese: Skinnerův chlívek 26

27

28

29

30

31

32

33

34

35

36

37

38

39 Strategie Stiskni páku Sed u koryta Stiskni páku (8, 2) (5, 3) Sed u koryta (10, 2) (0, 0)