MATICOVÉ HRY MATICOVÝCH HER



Podobné dokumenty
Teorie her a ekonomické rozhodování. 2. Maticové hry

3. Lineární diferenciální rovnice úvod do teorie

OKRUŽNÍ A ROZVOZNÍ ÚLOHY: OBCHODNÍ CESTUJÍCÍ. FORMULACE PŘI RESPEKTOVÁNÍ ČASOVÝCH OKEN

Lineární programování

Teorie her a ekonomické rozhodování. 3. Dvoumaticové hry (Bimaticové hry)

12. N á h o d n ý v ý b ě r

3. ANTAGONISTICKÉ HRY

ANTAGONISTICKE HRY 172

1.3. POLYNOMY. V této kapitole se dozvíte:

1. ZÁKLADY VEKTOROVÉ ALGEBRY 1.1. VEKTOROVÝ PROSTOR A JEHO BÁZE

Kapitola 5 - Matice (nad tělesem)

Matematika 1. Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D / 13. Posloupnosti

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

Pravděpodobnost a aplikovaná statistika

Vzorový příklad na rozhodování BPH_ZMAN

8. Analýza rozptylu.

je konvergentní, právě když existuje číslo a R tak, že pro všechna přirozená <. Číslu a říkáme limita posloupnosti ( ) n n 1 n n n

8.2.1 Aritmetická posloupnost

Odhady parametrů 1. Odhady parametrů

Iterační metody řešení soustav lineárních rovnic

IAJCE Přednáška č. 12

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

Budeme pokračovat v nahrazování funkce f(x) v okolí bodu a polynomy, tj. hledat vhodné konstanty c n tak, aby bylo pro malá x a. = f (a), f(x) f(a)

14. B o d o v é o d h a d y p a r a m e t r ů

6. Posloupnosti a jejich limity, řady

Sekvenční logické obvody(lso)

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

je konvergentní, právě když existuje číslo a R tak, že pro všechna přirozená <. Číslu a říkáme limita posloupnosti ( ) n n 1 n n n

Užití binomické věty

8.2.1 Aritmetická posloupnost I

VLASTNOSTI ÚLOH CELOČÍSELNÉHO PROGRAMOVÁNÍ

1. Číselné obory, dělitelnost, výrazy

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n

2.4. INVERZNÍ MATICE

f x a x DSM2 Cv 9 Vytvořující funkce Vytvořující funkcí nekonečné posloupnosti a0, a1,, a n , reálných čísel míníme formální nekonečnou řadu ( )

Operační výzkum. Teorie her. Řešení maticových her převodem na úlohu LP.

množina všech reálných čísel

4. B o d o v é o d h a d y p a r a m e t r ů

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Přednáška 7, 14. listopadu 2014

Tento materiál vznikl díky Operačnímu programu Praha Adaptabilita CZ.2.17/3.1.00/33254

S polynomy jste se seznámili již v Matematice 1. Připomeňme definici polynomické

Přednáška 7: Soustavy lineárních rovnic

5. Posloupnosti a řady

Posloupnosti a číselné řady. n + 1. n n n n. n n n. = lim. n2 sin n! lim. = 0, je lim. lim. lim. 1 + b + b b n) = 1 b

PRAVDĚPODOBNOST A STATISTIKA

4EK311 Operační výzkum. 4. Distribuční úlohy LP část 2

Komplexní čísla. Definice komplexních čísel

Permutace s opakováním

4EK212 Kvantitativní management 4. Speciální úlohy lineárního programování

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

Znegujte následující výroky a rozhodněte, jestli platí výrok, nebo jeho negace:

definované pro jednotlivé řády takto: ) řádu n nazýváme číslo A = det( A) a a a11 a12

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

procesy II Zuzana 1 Katedra pravděpodobnosti a matematické statistiky Univerzita Karlova v Praze

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Deskriptivní statistika 1

Přijímací řízení akademický rok 2013/2014 Bc. studium Kompletní znění testových otázek matematika

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

Matematika I, část II

1. Zjistěte, jestli následující formule jsou tautologie. V případě záporné odpovědi určete k dané formuli konjunktivní a disjunktivní normální formu.

Přijímací řízení akademický rok 2012/2013 Kompletní znění testových otázek matematické myšlení

Vyšší mocniny. Předpoklady: Doplň místo obdélníčků správné číslo. a) ( 2) 3. = c) ( ) = 1600 = e) ( 25) 2 0,8 0, 64.

Spojitost a limita funkcí jedné reálné proměnné

STUDIUM MAXWELLOVA ZÁKONA ROZDĚLENÍ RYCHLSOTÍ MOLEKUL POMOCÍ DERIVE 6

Funkce. RNDr. Yvetta Bartáková. Gymnázium, SOŠ a VOŠ Ledeč nad Sázavou

DIFERENCIÁLNÍ POČET FUNKCE JEDNÉ PROMĚNNÉ. 1) Pojem funkce, graf funkce

SEMESTRÁLNÍ PRÁCE Z PŘEDMĚTU

FUNKCÍ JEDNÉ REÁLNÉ PROMĚNNÉ PRVNÍ DIFERENCIÁL

Operační výzkum. Teorie her cv. Hra v normálním tvaru. Optimální strategie. Maticové hry.

n=1 ( Re an ) 2 + ( Im a n ) 2 = 0 Im a n = Im a a n definujeme předpisem: n=1 N a n = a 1 + a a N. n=1

PRAVDĚPODOBNOST A STATISTIKA

Petr Šedivý Šedivá matematika

Náhodný výběr 1. Náhodný výběr

8.1.3 Rekurentní zadání posloupnosti I

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

Intervalové odhady parametrů některých rozdělení.

Generování dvojrozměrných rozdělení pomocí copulí

jsou reálná a m, n jsou čísla přirozená.

1. Nakreslete všechny kostry následujících grafů: nemá žádnou kostru, roven. roven n,

POLYNOM. 1) Základní pojmy. Polynomem stupně n nazveme funkci tvaru. a se nazývají koeficienty polynomu. 0, n N. Čísla. kde

IV-1 Energie soustavy bodových nábojů... 2 IV-2 Energie elektrického pole pro náboj rozmístěný obecně na povrchu a uvnitř objemu tělesa...

MATEMATICKÁ INDUKCE. 1. Princip matematické indukce

Aritmetická posloupnost, posloupnost rostoucí a klesající Posloupnosti

V. Normální rozdělení

5. Lineární diferenciální rovnice n-tého řádu

Definice obecné mocniny

KONEČNĚ ROZDĚLENÁ ZPOŽDĚNÍ. POLYNOMICKY ROZDĚLENÉ ZPOŽDĚNÍ.

Vyhledávání v tabulkách

1.1. Definice Reálným vektorovým prostorem nazýváme množinu V, pro jejíž prvky jsou definovány operace sčítání + :V V V a násobení skalárem : R V V

Vlastnosti posloupností

Správnost vztahu plyne z věty o rovnosti úhlů s rameny na sebe kolmými (obr. 13).

Matematika 1. Ivana Pultarová Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D Posloupnosti

Nalezení výchozího základního řešení. Je řešení optimální? ne Změna řešení

1 Uzavřená Gaussova rovina a její topologie

8.1.2 Vzorec pro n-tý člen

Transkript:

MATICOVÉ HRY FORMULACE, KONCEPCE ŘEŠENÍ, SMÍŠENÉ ROZŠÍŘENÍ MATICOVÝCH HER, ZÁKLADNÍ VĚTA MATICOVÝCH HER CO JE TO TEORIE HER A ČÍM SE ZABÝVÁ? Teorie her je ekoomická vědí disciplía, která se zabývá studiem kofliktích situací. Koflikty bychom mohli zjedodušeě rozdělit takto: JAK SI PORADIT S ANTAGONISTICKÝM KONFLIKTEM? Hra v ormálím tvaru je dáa: - možiou hráčů {1, 2,, N}, - možiou prostorů strategií {X 1, X 2,, X N}, kde X i ozačuje prostor strategií i-tého hráče, - možiou výplatích fukcí {f 1(x 1, x 2,, x N), f 2(x 1, x 2,, x N),, f N(x 1, x 2,, x N)}. Předpokládáme, že tito hráči jsou iteligetí: saží se maximalizovat svůj užitek (hodotu výplatí fukce) a mají dokoalé iformace o hře, tedy zají možiu hráčů, svůj prostor strategií a výplatí fukci a prostor strategií a výplatí fukci ostatích hráčů. V ásledujících příkladech půjde pro zjedodušeí o hru dvou hráčů: prostor strategií prvího hráče budeme začit X, prostor strategií druhého hráče pak Y, výplatí fukce prvího hráče bude f 1(x,y), výplatí fukce druhého hráče bude f 2(x,y). Jde o hru v ormálím tvaru a o atagoistický koflikt: hráči tedy udělají své rozhodutí ajedou, a to, co jede získá, druhý ztratí, takže emá smysl spolupracovat. Proto se teto typ hry azývá také hra s kostatím součtem (f 1 (x, y) + f 2 (x, y) = K), ebo hra s ulovým součtem ( f 1 (x, y) + f 2 (x, y) = 0 ). Každou hru s kostatím součtem můžeme totiž převést a hru s ulovým součtem, protože přičteím libovolé kostaty ke všem hodotám

výplatích fukcí se ezměí řešeí hry. Z toho plye, že f 1 (x, y) = f 2 (x, y) f(x, y). Budeme tedy sledovat výhru prvího hráče, a to bude zároveň i prohra druhého hráče. Hru můžeme uspořádat do matice: a 11 a 1 A = ( ) a m1 a m Prví hráč (X) volí řádek, má tedy m možých strategií x 1 až x m a získá a ij. Druhý hráč (Y) volí sloupec, má tedy možých strategií y 1 až y a ztratí a ij. Prostor strategií je koečý, celkem existuje m růzých kombiací. Každé kombiaci strategií lze přiřadit výhru f(x, y). DOMINOVANOST Žádý z hráčů určitě ezvolí silě domiovaou strategii. Prví hráč ebude volit řádek se všemi prvky mešími, ež jsou odpovídající prvky v jiém řádku (měl by s jistotou ižší zisk), druhý hráč ebude volit sloupec se všemi prvky většími, ež jsou odpovídající prvky v jiém sloupci (měl by s jistotou vyšší ztrátu). Výjimečě lze vypuštěím silě domiovaých strategií ajít i řešeí hry, většiou se ám však tímto způsobem pouze podaří redukovat rozměr matice hry. Slabá domiovaost zameá, že prvky v odpovídajícím řádku jsou meší ebo rovy prvkům v jiém řádku (1. hráč) či prvky v odpovídajícím sloupci jsou větší ebo rovy prvkům v jiém sloupci (2. hráč). Například v ásledující matici by prví hráč určitě ezvolil třetí řádek, získal by totiž určitě méě ež při volbě jiých řádků, ehledě a to, jakou strategii by zvolil druhý hráč. Druhý hráč aopak určitě ebude volit prví sloupec, ztratil by totiž určitě více ež při volbě jiých sloupců, ehledě a to, co by zvolil prví hráč. Když tyto strategie vypustíme, zbude ám matice 2x2, ve které by prví hráč určitě ezvolil druhou strategii a druhý hráč by určitě ezvolil prví strategii. Optimálími strategiemi jsou tedy x 1, y 3, kdy prví hráč získá 3 a druhý hráč ztratí 3. ROVNOVÁHA V RYZÍCH STRATEGIÍCH 5 4 3 5 4 3 ( 4 3 2) ( 4 3 2) 3 1 1 3 1 1 Návod, jak ajít optimálí strategii hráčů v maticové hře, dává tzv. Nashova rovováha. Ta říká, že pokud se ěkterý z hráčů odchýlí od své optimálí strategie (zatímco soupeř se své optimálí strategie bude držet), epolepší si, eboli pokud se hráč edrží optimálí strategie, pohorší si a v ejlepším případě a tom bude stejě. Pro optimálí strategie x o X, y o Y tedy platí: f 1 (x, y o ) f 1 (x o, y o ) = když se prví odchýlí optimálí strategie x o a volí místo toho strategii x, zatímco druhý se své optimálí strategie drží, tak získá méě či ejvýše stejě, jako kdyby se jí také držel f 2 (x o, y) f 2 (x o, y o ) = když se druhý odchýlí optimálí strategie y o a volí místo toho strategii y, zatímco prví se své optimálí strategie drží, tak získá méě či ejvýše stejě, jako kdyby se jí také držel Pro hru s ulovým součtem platí, že f 1 (x, y) f(x, y) a f 2 (x, y) f(x, y), a tedy f(x, y o ) f(x o, y o ) a f(x o, y) f (x o, y o ) f(x, y o ) f(x o, y o ) f(x o, y)

Tomuhle se říká Nashovo rovovážé řešeí (Nashova rovováha). Získáme jej alezeím sedlového prvku (sedlového bodu), což je číslo ejvětší ve svém sloupci (protože prví hráč chce maximalizovat prohru druhého hráče) a ejmeší ve svém řádku (protože druhý hráč chce miimalizovat výhru prvího hráče). Jak to může dopadout? Hra může mít: 5 1 3 (a) jede sedlový prvek: ( 6 5 4) 2 6 4 Sedlový prvek je a 23. Optimálí strategie prvího hráče je x 2, druhého hráče y 3, a 23 = 4 je cea hry. 4 1 3 (b) dva sedlové prvky: ( 5 5 4) 6 6 4 Všechy mají stejou ceu hry a jako optimálí strategii mohu volit kteroukoliv avržeou. 4 1 3 (c) žádý sedlový prvek: : ( 5 5 4) 4 6 5 Pokud má hra sedlový prvek, azýváme takové řešeí Nashova rovováha v ryzích strategiích a optimálí strategii hrajeme ve 100 % případů. Pokud hra emá sedlový prvek, hledáme řešeí pomocí smíšeého rozšířeí. Základí věta maticových her totiž říká, že: Každá maticová hra má Nashovo rovovážé řešeí (ve smíšeých strategiích). V í zjišťujeme, s jakou pravděpodobostí budou hráč hrát jedotlivé strategie. Takto formulovaé strategie se azývají smíšeé (pravděpodobostí) strategie. SMÍŠENÉ ROZŠÍŘENÍ Úlohu smíšeého rozšířeí maticové hry řešíme ásledově: Prví hráč bude hrát každou ze svých strategií s pravděpodobostí 0 a součet pravděpodobostí musí být rove 1. Totéž platí pro druhého hráče X = {x; x T m = (x 1 ; x 2 ; ; x m ); i=1 x i = 1; x 0} Y = {y; y T = (y 1 ; y 2 ; ; y ); j=1 y j = 1; y 0} Hodota výplatí fukce prvího hráč je rova: m f(x, y) = x i a ij y j = x T Ay i=1 j=1 Podle ZVMH existují optimálí strategie (x o, y o ) ve smíšeém rozšířeí, eboli existuje Nashova rovováha, kdy prví hráč získá x ot Ay o a druhý hráč totéž ztratí. Tomu říkáme cea hry. Ceu hry x ot Ay o ozačme písmeem v.

Problém povede a úlohu lieárího programováí. Jaké budou její omezující podmíky? Víme, že pro optimálí řešeí musí platit: x T Ay o x ot Ay o x ot Ay. Hledáme tedy (x o, y o ) splňující uvedeé erovosti. Nejprve se zaměříme a erovost x T Ay o x ot Ay o, tz. x T Ay o v. Protože v úloze pracujeme s erovicemi, hodilo by se mít v í je kladá čísla, abychom si emuseli dělat starosti, jestli eí áhodou třeba obrátit zaméko erovosti. Takže pokud jsou všechy prvky matice A kladé, můžeme pokračovat v řešeí, ale jsou-li ěkteré prvky ekladé, je třeba přičíst vhodou kostatu tak, aby se všechy prvky staly kladými. Přičteí kostaty c ke všem prvkům v matici ezměí optimálí strategie, změí však ceu hry a v + c, a bude tedy platit vztah: x T Ay o v + c K tomu, aby uvedeý vztah platil pro všecha x T, stačí, když bude platit pro všechy ryzí strategie x T = (1,0,,0), x T = (0,1,,0),, x T = (0,0,,1). Smíšeé strategie jsou totiž je lieárí kombiací ryzích strategií. Ryzí strategie jsou je speciálí případ smíšeých strategií (jedotkové vektory), kdy určitou strategii hrajeme s pravděpodobostí 100 %. Takže to můžeme rozepsat: a 11 y o 1 + a 12y o 2 + + a 1y o v + c a m1 y o 1 + a m2y o 2 + + a my o v + c Abychom se zbavili v + c apravo, vydělíme uvedeé erovice výrazem v + c a substituujeme q j = yo j v+c, q j 0, čímž dostaeme soustavu ve tvaru: a 11 q 1 + a 12 q 2 + + a 1 q 1 a m1 q 1 + a m2 q 2 + + a m q 1 q j 0 Tohle jsou omezující podmíky úlohy lieárího programováí. Z takto formulovaé úlohy můžeme zjistit, s jakou pravděpodobostí bude hrát druhý hráč jedotlivé strategie. Druhý hráč chce miimalizovat v + c, takže se saží maximalizovat Celá úloha má tvar: Účelová fukce z: max j=1 q j za podmíek: j=1 a ij q j 1, i q j 0, j 1 v+c, takže bude chtít maximalizovat a q Stejým postupem lze formulovat úlohu pro prvího hráče, čímž dojdeme k úloze ve tvaru: m Účelová fukce z: mi i=1 p i za podmíek: a ij p i 1, j m i=1 p i 0, i j=1 j.

To jsou duálě sdružeé úlohy: primárí úloha (maximalizačí) pro druhého hráče a druhá úloha (miimalizačí) pro prvího hráče. Tyto úlohy můžeme vyřešit simplexovou metodou a jakožto duálě sdružeé úlohy budou mít i stejou hodotu účelové fukce. Řešeí duálí úlohy ajdeme v simplexové tabulce primárí úlohy pod přídatými proměými (jsou to stíové cey). Protože ale výstupem budou hodoty q j a p i, zatímco ás zajímají hodoty y o j a x o i, musíme provést zpětou substituci: q j = yo j v+c y o j = (v + c)q j = q j z p i = xo i x o v+c i = (v + c)p i = p i z 1 = z v = 1 c cea hry v+c z Tím tedy zjistíme, s jakou pravděpodobostí by měli hráči hrát jedotlivé strategie. ZDROJE Mgr. Jaa Sekičková, Ph. D.: prezetace k předmětu 4EK421 Teorie her a ekoomického rozhodováí, 2013.