Repeated Games; Correlated Equilibrium
|
|
- Pavel Tobiška
- před 6 lety
- Počet zobrazení:
Transkript
1 THE: Opakované hry; Korelované ekvilibrium Repeated Games; Correlated Equilibrium Brno University of Technology Brno Czech Republic November 13, 2018
2 Úvod Čerpáno z: Myerson, R. B.: Game Theory, Analysis of conflict, Cambridge, Harvard University Press (1991) Mailath, G. J., Samuelson, L.: Repeated Games and Reputation, Oxford University Press, 2006 Osborne, M. J.: An Introduction to Game Theory, Oxford University Press, 2004 Osborne, M., Rubinstein, A.: A Course in Game Theory, The MIT Press, 1994 Hrubý, M.: Algorithmic Approaches in Game-Theoretical Modeling and Simulation, AUCO Czech Economic Review, 2(3), on-line: auco.cuni.cz Asu Ozdaglar: přednášky Repeated Games Ratliff, J.: A Folk Theorem Sampler
3 War and peace (R. Aumann, Nobel prize lecture) Teorie her není schopna dodat magickou formuli, která vyřeší všechny konflikty. Neexistuje akademická discipĺına, která by toto dokázala. Cílem je porozumět konfliktu. Když konfliktu porozumíme, jsme schopni hledat jeho řešení. Je to jako s rakovinou: A) konvenční léčba (řešit konkrétní projevy/následky), B) snaha pochopit vnitřní principy (DNA, procesy v těle). Na válku se pohĺıží jako na iracionální chování a to je chyba. Válka není iracionální. Jedinec je racionální, pokud koná to nejlepší dle jeho informací. Hraje zřejmě nekooperativní ekvilibrium. Kooperace předpokládáme, že ve hře existuje efektivnější profil než je NE. Profil je kooperativní, pokud žádný hráč není schopen pro sebe garantovat lepší výsledek. Repetition Enables Cooperation. Folk theorem.
4 Opakované hry, úvod Zatím známe hry: Nekooperativní s nulovým/nenulovým součtem v normální (maticové) formě hráči chápou situaci (jednotahovost) a strategicky analyzují množinu profilů. Nekooperativní hry v rozšířené formě hráči se v tazích střídají, existuje víc tahů. Velmi záleží na stavu informace ve hře (dokonalá/nedokonalá informace o historii hry). Kooperativní hry definované charakteristickou funkcí hráči hledají optimální rozložení koalic a optimální dělbu zisku přisouzené koalici (imputace). Čím je podmíněna kooperativnost (garance, že protivník dodrží dohodu)? Opakujeme tzv. base game (stage game) základní hru. Co je strategie v opakované hře? Návaznost na ESS.
5 Příhoda s Hodžou Nasredinem Hodža Nasredin byl známý muslimský filosof a humorista. Jednou přišel do lázní, ale lazebník ho odbyl špatnými službami. Při odchodu z lázní Hodža zaplatil velkou mincí. Při příští návštěvě se lazebník překonával, ale Hodža při odchodu zaplatil malou mincí. Lazebník se divil: Hodžo, posledně jsi zaplatil hodně za... služby a za dnešní (lepší) služby málo. Proč?. Hodža odpověděl: Posledně jsem platil za dnes a dnes jsem platil za posledně.. Pokud lazebník pochopil Hodžovu strategii v opakované hře návštěva lázní, pak budou od toho okamžiku oba hrát kooperativní profil. Opakované hry nám umožňují modelovat sociální normy, vliv trestu na další opakování hry a přirozeně vnucenou spolupráci.
6 Opakované hry, úvod Dále na úrovni nekooperativních her: Konfliktní situace se může opakovat. Pokud si hráči fakt opakování uvědomují, mluvíme o opakovaných hrách. Hráči se mohou poučit o chování protihráče, tzn. mají paměť. Je prostor pro vyjednávání. Je možno trestat. Rozlišujeme dle opakování: Konečné opakování hra se opakuje T-krát, kde T je konkrétní předem známé číslo. Pravděpodobnostní opakování s pravděpodobností p se hra znovu zopakuje. Nekonečné opakování hra se opakuje bez ukončení. Je jasné, že všechno má konec. Spíše tím modelujeme situaci, kdy se o ukončení neuvažuje (hraje se doživotně ) nebo T je neznámé. Hráč na počátku hry ví o opakování a přizpůsobí tomu svůj první tah. Navazujeme tímto na sekvenční hry. Hráč bere v úvahu, že jeho tah ovlivní bezprostřední výsledek hry, ale i budoucnost hry (vnímá svoji reputaci ).
7 Opakované vězňovo dilema C D C 1,1-1,2 D 2,-1 0,0 Předpokládejme nyní strategii (nazvanou grim trigger strategy): Hraju C tak dlouho, dokud druhý hraje C. Pokud druhý zahraje D, od této doby hraju navždy D (trest). Pokud někdo zahraje D, krátkodobě získá zisk 2, ale v dalších hrách už jenom 0 (namísto kooperativního 1). To znamená, že pro racionálně (citlivě k budoucnosti) uvažujícího hráče je zisk (1,1,1,1,...) dominující nad (...,2,0,0,...). Strategie C je tedy best-response na grim trigger strategy. Tato strategie je NE v opakovaném Vězňově dilematu. Strategie (D, D) ovšem taky.
8 Strategie v opakované hře Je nutno odlišovat dva pohledy na opakovou hru: Bázová (základní) hra má strategie dle Γ = (Q;{S i } i Q ;{U i } i Q ). Opakovaná hra má strategie definované nad celou posloupností opakování bázové hry. Situaci opakované hry modelujeme jako rozhodnutí hráče, jak se bude v rámci opakování her konzistentně chovat. Příklady strategíı v opakované hře: Vždy budu hrát... Budu hrát strategii, kterou v předešlém kole hrál soupeř. Budu hrát kooperativní strategii, pokud mě soupeř zradí, budu ho trestat po dobu k kol hraním nekoop. strategie, a pak budu hrát opět kooperativní strategii (trest a pozdější odpuštění). Soutěž v opakovaném Vězňově dilematu (Iterated P.D. Competition, R. Axelrod, 1979).
9 Preference v opakované hře, ohodnocovací faktor δ Každý hráč má v každém kole t hry užitek U i (s t ),s t S a definuje ohodnocovací faktor (discounting factor) δ i 0,1), kterým ohodnocuje postupné výhry při hraní profilů (s 1,s 2,...,s T ), tedy s j S: U i (s 1 )+δ i U i (s 2 )+...+δ T 1 i U i (s T ) = Pozor, δ t i je t mocnina δ i. T t=1 δ t 1 i U i (s t ) Pokud je δ i bĺızko 0, hráč i je velmi necitlivý k budoucnosti a naopak. Pokud je δ i = 0, pak hráč i neví o budoucnosti (jednotahová hra). Př.: δ i = 1 2, pak dnešních 100 CZK je ekvivalentní zítřejším 200 CZK Budeme nadále klást δ i = δ; i Q.
10 Preference v opakované hře Chceme ohodnotit posloupnost zisků a vyjádřit ji jedním číslem. Pomocí něho budeme porovnávat posloupnosti zisků (preference nad posloupnostmi). Posloupnost W = (w 1,w 2,...,w T ) má sumu V = T t=1 δt 1 i w t. Existuje nyní takové číslo c, že by byl hráč indiferentní mezi W a (c,c,...)? c Suma pro (c,c,...) je 1 δ (suma geometrické řady). Hráč je indiferentní mezi W a (c,c,...), pokud c = (1 δ)v. Proto nazýváme (1 δ)v průměrným ziskem, tzn. π i = (1 δ) T t=1 δ t 1 i w t
11 Definice hry v rozšířené formě (opakování) Definition Konečná sekvenční hra s dokonalou informací je Γ E je čtveřice (Q,H,p,U), kde: Q je množina hráčů, H je množina historíı (kontextů, uzlů). H T označuje množinu terminálních historíı. H 0 = označuje počáteční uzel. p(h) : H \H T Q přiřazuje každé neterminální historii h hráče, který je aktuálně na tahu. U je vektor užitkových funkcí U i (h) : H T R 1 pro všechny i Q. Pozn.: Miminum pro definici hry s dokonalou informací je (Q,H,p). Pozn.: Zavedeme: A(h) je množina akcí pro každé h H \H T, tzn. množina proveditelných akcí po dosažení historie h.
12 Definice opakované hry Definition Mějme Γ = (Q;{S i } i Q ;{U i } i Q ). T-krát opakovaná hra Γ T s bázovou hrou Γ a ohodnocovacím faktorem δ je hra v rozšířené formě s dokonalou informací a současnými tahy hráčů, kde: množina terminálních historíı je množina sekvencí (s 1,s 2,...,s T ) profilů hry Γ. p(h) = Q pro všechny historie h = (s 1,s 2,...,s t ) ( t {1,...,T 1}). A i (h) = S i pro všechny historie h = (s 1,s 2,...,s t ) ( t {1,...,T 1}). každý hráč i ohodnocuje každou terminální historii (s 1,s 2,...,s T ) dle svého průměrného zisku (1 δ) T t=1 δt 1 U i (s t ).
13 Poznámka k definici: nekonečně opakované hry V případě nekonečně opakované hry Γ : Terminální historie jsou nekonečné sekvence (s 1,s 2,...). Průměrný zisk je (1 δ) t=1 δt 1 U i (s t ). V obou případech (konečné, nekonečné opakování) je terminální historie nazývána taky outcome path (výsledková posloupnost). Path ve smyslu cesta grafem hry v rozšířené formě.
14 Zpátky k vězňům Hraje se T-krát: T = 1, pak je NE = (D,D) C D C 1,1-1,2 D 2,-1 0,0 T > 1 a T je konečné, zpětnou indukcí získáme SPNE (Subgame Perfect NE), které je opět NE = (D,D) T = 2 - v druhém kole mě zradí. Mám důvod věřit tomu, že při mé strategii C hra v prvním kole skončí v (C,C)?
15 Zpátky k vězňům Hraje se -krát: Proposition Je-li δ 1 2, pak má -krát opakované Vězňovo dilema (dle předchozího zadání) SPNE (C,C), které se hraje v každém tahu. Proof. Předpokládejme grim trigger strategii. Pokud hráč i bude hrát stále C, je jeho průměrný zisk (1 δ)[1+δ +δ ] = 1. Zahraje-li D v libovolném, např. prvním, tahu, pak je jeho zisk (1 δ)[ ] = 2(1 δ). Pokud je δ = 1 2, pak je to srovnatelný zisk, pokud δ > 1 2, pak je horší.
16 Co je Nashovo ekvilibrim v opakovaných hrách? Obecný význam NE známe (je to profil, kde žádný hráč změnou své strategie nezíská pro sebe lepší výsledek). Definice strategie v opakovaných hrách byla dána (je to chování hráče přes všechna opakování hry). Zisk hráče v opakované hře je suma všech dosažených zisků přes všechna opakování. Hráči hledají dlouhodobou strategii, která jim přinese optimální zisk v NE. Vytvoříme superhru (supergame), která je pro nás obvyklá nekooperativní hra v normální formě.
17 Ukázka superhry nad Vězňovým dilematem Uvažujeme superhru Γ nad Vězňovým dilematem, které bude T-krát/ -krát opakováno, kde S i = {trigger,c,d}. Průměrné užitky jsou: A/B trigger C D trigger (1,1) (1,1) (0,0) C (1,1) (1,1) (-1,2) D (0,0) (2,-1) (0,0)
18 Folk theorems (General feasibility theorems, R. Myerson) Forma solution concept v opakovaných hrách. Folk theorémy jsou třída vět, které v opakovaných hrách ukazují, že kterýkoliv výsledek hry je přijatelné řešení, jestli je pro hráče alespoň tak dobrý jako jejich minimax zisk. Definition Mějme hru Γ = (Q;{S i } i Q ;{U i } i Q ). Minimax zisk hráče i Q ve hře Γ je: ( ) v i = min max[u i (s i,s i )] s i S i s i S i v i je tedy nejnižší BR i. Předpokládáme, že hráči jsou schopni si kolektivně uvědomit míru přijatelného výsledku hry (feasible outcome). Ten představuje jakousi sociální normu.
19 Minimax strategie Důkaz je založen na použití grim trigger strategie. Definition Řekneme, že výplatní vektor v je striktně individuálně racionální, pokud platí pro všechny hráče i Q : v i > v i. Definition Minimax strategíı proti hráči i nazveme sub-profil m i i (ve dvouhráčové hře strategii protivníka), která mu přinese v i. Je to: m i i = arg min s i S i [ max s i S i U i (s i,s i ) ] Plyne z toho, že BR i (m i i ) = s i taková, že U i (s i,mi i ) = v i.
20 Folk theorem Doplňme, že V R N je množina přijatelných (stejných jako v i ) a striktně individuálně racionálních zisků. Folk theorems ukazují, že pokud jsou hráči dostatečně citliví k budoucnosti (mají dostatečně vysoké δ i ), pak jsou schopni dosáhnout libovolného dosažitelného stritně individuálně racionálního zisku formou NE. Theorem Pro všechny v = (v 1,v 2,...,v N ) V existuje δ < 1 takové, že pro všechny δ > δ, existuje NE v Γ (δ) s vektorem zisků v. Když hrajete s člověkem, jehož δ i 0, nemá smysl doufat v trestání.
21 Folk theorem, důkaz Předpokládejme nejdříve, že existuje profil s = (s i ) i Q takový, že U i (s) = v i, (v i ) i Q V (jinak bychom museli zavést smíšené strategie, jde to, ale to bychom si to značně zkomplikovali). Zavedeme si trigger strategii: 1. Hrej od nultého kola s i tak dlouho, dokud protihráč hraje s i. Pokud protihráč(i) vybočí, přesuň se do stavu Hrej už jenom m j i (strategie, která garantuje v i ). Pokud hráči hrají kooperativně, mají ve hře zisk v. Hráč i, který vybočí v kole t, aby získal v i = BR i (s i ), získá maximálně: (1 δ) [ v i +δv i + +δ t 1 v i +δ t v i +δ t+1 v i +δ t+2 v i + ]
22 (1 δ) [ v i +δv i + +δ t 1 v i +δ t v i +δ t+1 v i +δ t+2 v i + ] = (1 δ)[v i +δv i + +δ t 1 v i +δ t v i + δt+1 v i 1 δ ] = = (1 δ)v i +(1 δ)[δv i + +δ t 1 v i ]+(1 δ)δ t v i +δ t+1 v i Druhý člen: (1 δ)[δv i + +δ t 1 v i ] = v i (δ+ +δ t 1 δ 2 +δ t ) = v i (δ δ t ) První a druhý člen: (1 δ)v i +v i (δ δ t ) = v i δv i +δv i v i δ t = v i (1 δ t )
23 Celkově (zisk hráče i, který v kole t vybočil z kooperativního profilu): = (1 δ t )v i +δ t (1 δ)v i +δ t+1 v i Aby navrhovaná strategie (tzn. hrát kooperativně) byla optimální, musí platit: v i (1 δ t )v i +δ t (1 δ)v i +δ t+1 v i v i v i δ t [v i v i +δv i δv i ] To bude platit, pokud: v i v i δ t [v i +(δ 1)v i δv i ] v i +(δ 1)v i δv i 0
24 Přelomová je hodnota [ ] vi v i δ = max i Q v i v i v i < v i < v i v i v i < v i v i δ < 1 Pro všechny δ δ je racionální hrát zvolenou strategii a neuhýbat. Resp. při δ = δ je deviující hráč na stejném zisku, jako by kooperoval, při δ > δ má striktně horší zisk. Tento Folk theorem ukazuje, že pro jistou míru paměti (nebo citlivosti k budoucnosti) je protihráč racionálně nucen ke kooperativní strategii.
25 Příklad L R U 6,6 0,-100 D 7,1 0,-100 NE = (D,L), v 1 = 0, v 2 = 1. Minimax strategie hráče 2 je hrát R. Nash Folk Theorem připouští hraní (U,L) (6,6), ovšem hráč 2 musí hrát R kdykoliv hráč 1 uhne (a to je značně bolestivé). δ i = v i v i v i v i = = 1 7 Další Folk Theoremy v rámci projektů.
26 Jak lidé hrají v opakovaných hrách Podle laboratorních experimentů (Asu Ozdaglar): Lidé hrají v opakovaných vězňových dilematech kooperativněji, než by se očekávalo. Dokonce i u konečně opakovaných hrách. Lidé jsou konfrontováni s maticí zisků, ale to není jejich veškerý užitek. Další složky užitku pramení ze sociálních preferencí. Typy sociálních preferencí lidí: Altruismus mají užitek z toho být hodní na druhé. Férovost mají užitek z toho být fair na druhé. Pomstichtivost lidé rádi trestají ty, co vybočí z férovosti nebo jiných sociálních norem.
27 Korelované ekvilibrium Korelované ekvilibrium je herní koncept, který zobecňuje Nashovo ekvilibrium. Poprvé definováno Robertem Aumannem (Nobel. cena, 2005) v článku Aumann, R. (1974) Subjectivity and correlation in randomized strategies. Journal of Mathematical Economics 1:67-96.
28 Korelované ekvilibrium Korelované ekvilibrium (CE) je založeno na myšlence, že hráč voĺı svou strategii na základě pozorování nějakého veřejně známého signálu (signál je common knowledge). NE předpokládá, že hráč se rozhoduje pouze dle specifikace hry. Signál hráči napoví tah. Pokud hráč uvěří, že všichni protihráči hrají dle CE a vidí, že by si pohoršil hraním jiného tahu (než je ten napovězený), pak je profil tvořený těmito nápovědami korelované ekvilibrium. Existuje množina takových profilů. Budeme dále předpokládat racionalitu hráčů a volbu pareto dominantního profilu. Co je to ta nápověda? Nečekáme, že existuje centrální autorita, která by hráčům vyřešila jejich problém a navrhla jim řešení. Spíše tím modelujeme fakt, že hráči žijí ve společném informačním kontextu (čtou stejné noviny).
29 Příklad Uvažujme hru: MNEs: (A,b) zisk (6,10) (B,a) zisk (10,6) a b A 9,9 6,10 B 10,6 0,0 (( 6 7, 1 7 ),(6 7, 1 7 )) zisk (8.57,8.57) CE = (0.75,0.125,0.125,0) zisk (8.75,8.75)
30 Příklad Přepodpokládejme, že někdo hodí mincí (padne H nebo T) veřejně pozorovatelný signál. Hráči souhlasí, že budou hrát (A,b) v případě H (B,a) v případě T očekávaný zisk na (8,8) Co Best-response? Padne-li H, hráč 1 ví, že hráč 2 bude hrát b (A je tedy Best-response) Padne-li T, hráč 1 ví, že hráč 2 bude hrát a (B je tedy Best-response) Očekávané zisky nyní mohou výt vyšší než v MNE (pokud např. změníme v (A,a) zisky na (8,8)).
31 Příklad - další experiment Signál nemusí být až tak informačně úplný. Požádáme arbitra, aby hodil kostkou (výsledek n žádný z hráčů nevidí). Oznámíme hráči 1, zda-li n padlo do {1,2} nebo do {3,4,5,6}. Oznámíme hráči 2, zda-li n padlo do {1,2,3,4} nebo do {5,6}. Hráč 1 hraje B, pokud n {1,2} nebo A při n {3,4,5,6}. Hráč 2 hraje a, pokud n {1,2,3,4} nebo b při n {5,6}. očekávaný zisk je (8.333, 8.333). BR 1 : pokud n {1,2}, hráč 2 bude hrát a, pak BR 1 je hrát B pokud n {3,4,5,6}, hráč 2 bude hrát ( 1 2, 1 2 ), BR 1 je hrát A π 1 = ( ) = 8.333
32 Definice korelovaného ekvilibria Mějme hru Γ = (Q;{S i } i Q ;{U i } i Q ). CE přiřazuje každému profilu s S pravděpodobnostní ohodnocení π(s). Řešením je tedy vektor π = (π(s)) s S. Definition Mějme hru Γ = (Q;{S i } i Q ;{U i } i Q ) a vektor π = (π(s)) s S takový, že: 1. π(s) 0,1 s S 2. s S π(s) = 1 Vektor π je korelovaným ekvilibriem ve hře Γ, pokud platí pro všechny hráče i Q a každé dvě strategie s i,d i S i,d i s i : s i S i π(s)(u i (s i,s i ) U i (d i,s i )) 0
33 Příklad a b A 9,9 6,10 B 10,6 0,0 a b A π 1 π 2 B π 3 π 4 1π 1 +6π 2 0 π 3 6π 4 0 Pravděpodobnosti π(s) společně s nerovnicemi modelují co hráči nikdy neudělají. Těleso vymezené nerovnicemi modeluje přípustná řešení CE. Zřejmě budeme hledat paretovské optimum.
34 Kompatibilita Korelovaného ekvilibria V čem spočívá korelovanost? Signálem (společnou znalostí) je fakt, že všichni hráči akceptují racionalitu CE. Potom očekávají chování z množiny korelovaných ekvilibríı, potažmo pareto optimální CE. Theorem Je-li σ MNE, pak π = ( Π N i=1 σ (s i ) ) s S je korelované ekvilibrium. Důkaz jako domácí příprava (odkaz na perchta.fit ).
35 Výpočet Korelovaného ekvilibria Dobré zprávy o CE: CE je nadmnožina MNE, tzn. všechny MNE jsou současně CE. Plyne z toho, že CE vždy existuje (důvod: Nash dokázal, že MNE vždy existuje). Ch. Papadimitriou dokázal (článek Computing correlated equilibria in multi-player games, In: 37th ACM Symposium on Theory of computing), že výpočet CE je v polynomické časové složitostní třídě. M. Hrubý navrhl algoritmus efektivního výpočtu CE se zapojením paralelismu (článek Algorithmic Approaches to Game-Theoretical Modeling and Simulation, In: AUCO Czech Ecomomic Review, on-line: auco.cuni.cz). Nástroj CE-Solver, Výpočet CE je založen na lineárním programování.
36 Výpočet CE obecně (LP-úloha) Budeme hledat Pareto efektivní profil, který má CE vlastnost. To znamená, že maximalizujeme souhrnný užitek Z(s) v CE profilu Z: MAX : Z = s S π(s)z(s) Z(s) = i Qw i U i (s) Váhování (w i ) i Q : Na to v literatuře není moc názor... Nejjednodušší je nastavit w i = 1; i Q. Váhování vybírá Pareto optimální CE mezi všemi CE.
37 Výpočet CE obecně (LP-úloha) Proměnné: π(s) 0,1 ; s S Omezující podmínky (constraints) jsou (dále pak matice G ): π(s) = 1 s S
38 Výpočet CE obecně (matice G) Omezení dané maticí užitků (obecně): Matice G: G π T 0 Řádky matice G jsou indexovány i,j,k, kde i Q, j,k S i. Máme tudíž N i=1 S i ( S i 1) řádků. Sloupce jsou indexovány strategickými profily, je tudíž S sloupců v matici. Prvek matice G i,j,k v profilu s S je dán: { U i (s i,s i ) U i (k,s i ) s i = j G i,j,k (s) = 0 jinak
39 Výpočet CE obecně Řešíme LP-úlohu s proměnnými π(s) a omezujícími podmínkami ( s S π(s) = 1,G πt 0). Maximalizujeme Z. Výsledkem je naplnění proměnných π(s) pravděpodobnostmi profilů. Důležité je si uvědomit, že tento postup výpočtu vyhodnocuje jedno Pareto efektivní CE. Není tudíž pravda, že existuje pouze jedno CE a to je jednoznačnou odpovědí na otázku co hráči udělají?. Tento algoritmus nijak není omezen počtem hráčů nebo jejich strategíı pouze výslednou časovou a paměťovou složitostí.
40 Demo A/B c d a 10,2 8,4 b 5,4 7,3 S = {(a,c),(a,d),(b,c),(b,d)} G-matice (řádky modelují možné deviace hráčů, sloupce jsou všechny profily ve hře): j k/s ac ad bc bd a b 5 1 b a 5 1 c d 2 1 d c 2 1
41 Vede na LP-úlohu Maximalizace Z = s S π(s)z(s). 5π(ac)+π(ad) 0 5π(bc) π(bd) 0 2π(ac)+π(bc) 0 2π(ad) π(bd) 0 Druhá nerovnice jasně vede k π(bc) = π(bd) = 0. Z toho plyne: 2π(ac) 0 platí pouze pro π(ac) = 0. Zbývá π(ad) 0 π(s) = 1, tzn. π(ad) = 1.
42 Princip CE obecně analytický efekt G-matice Množina nerovnic G π T 0 modeluje hráčovy tendence přecházet mezi strategiemi. Pokud je řádek G i,j,k celý záporný (resp. G i,j,k (s) 0; s S), pak strategie k striktně dominuje nad j. Pokud je řádek nulový, pak jsou strategie ekvivalentní. Takový řádek může být z LP-constraints vypuštěn, neboť nemá žádný efekt. Pokud existují kladné i záporné koeficienty G i,j,k (s), pak nelze nic o strategíıch j,k říct. Pokud existují pouze kladné a nulové koeficienty, pak strategie j slabě dominuje nad k (nelze říct, že dominuje striktně). Matice G zde vystupuje jako zajímavý analytický nástroj s velmi jednoduchou datovou strukturou.
43 Optimalizovaný výpočet CE ve hře (Hrubý, 2008) Aplikovatelnost CE-Solveru: Redukce prostoru profilů hry na menší hru vede na menší LP-úlohu. V případě zatím nevyhodnocených U(s) redukujeme počet profilů, které musí mít vyhodnocený užitek. Mějme hru Γ = (Q;{S i } i Q ;{U i } i Q ) a počítačový model (proceduru) cellmodel : S R N pro výpočet užitků U(s) := cellmodel(s). Předpokládejme, že výpočet cellmodel(s) je hlavní časovou zátěží na výpočet. Chceme omezit počet invokací cellmodel na minimum, tzn. hledáme minimální S r S potřebnou pro vyhodnocení CE. Sestavujeme redukovanou hru, tzn. redukovanou S r S.
44 Redukce G-matice v našem příkladě ac ad bc bd a b 5 1 b a 5 1 c d 2 1 d c 2 1 5π(bc) π(bd) 0 ab ad a b 5 1 c d 2 d c 2 ad a b 1 d c 2
45 CE-Solver: Parallel algorithm solving CE 1. For all players i Q: 2. For all j S i : 3. For all k S i,j k: 4. Compute G ijk in parallel 5. If negative, disable related profiles and propagate backwards in G. Result: Remaining profiles determine S i, i Q G is already computed LP-task can be generated
46 Data types and structures valid : S Boolean is a boolean array displaying what profiles are valid or non-valid (zero/non-zero probability). Initially, all profiles are valid. umap : S R N is a dynamic dictionary (items can be added and removed during the computation) assigning payoff vectors to particular profiles. Initially, umap is empty. dominated : Q S i Boolean is a boolean array displaying what strategies are already found to be dominated. Initially, all are set False. type proflist is a list of tuples (S,R). type grow = (pos : proflist,neg : proflist) G[i,j,k] is a dynamic list of grow indexed by (i,j,k). G represents the G-matrix.
47 Gsolve main part for i in Q: for j in S[i]: for k in S[i]: if (j!=k): if (not(dominated[i][j] or dominated[i][k])): row = solverow(i,j,k); if (row!= ([],[])): if (row.pos!= []): G[i,j,k] := row; else: dominated[i][k] := true for (s,r) in row.neg: disableprof(i,s);
48 Smysl CE (versus NE) CE na věc nahĺıží jinak než (M)NE. NE je stavební kámen celé Teorie her (ve všech jejích podoborech). CE je obecnější a snadno spočitatelné ekvilibrium. Přesto není jaksi bráno v komunitě herních teoretiků vážně. Pochopení pozadí definice CE není snadné. Z algoritmického simulačního hlediska: Pokud je více NE (MNE), pak nikdo neví, jaké hráči budou hrát. Obvykle je pravděpodobné, že to Pareto optimální. U CE, vyhodnocením soustavy lineárních rovnic získáme podprostor smíšených profilů, kde každé z nich je splňuje CE. U CE není počet hráčů implementačně omezující jako u MNE. CE na rozdíl od MNE dává odpovědi.
49 CE versus NE Bylo řečeno, že CE je obecnější než NE. Co to znamená? CE je vymezeno řešením lineárních nerovnic. Ty tvoří mnohoúhelník (polytope). Všechny body mnohoúhelníku jsou CE. Můžeme pak najít optimum na mnohoúhelníku. Podstata MNE: smíšená strategie σ i je best-response na σ i. MNE je diskrétní množina. Nalezení smíšených profilů tvoří algoritmickou náročnost MNE. Theorem V nedegenerované dvouhráčové hře, MNE jsou vrcholy CE mnohoúhelníku. Neznamená to ovšem, že všechny vrcholy CE mnohoúhelníku jsou MNE (minimálně však jeden).
50 Příklad a b A 9,9 6,10 B 10,6 0,0 Pareto optimální CE je: CE = (0.75,0.125,0.125,0) se ziskem (8.75, 8.75) Strategie A se hraje s pravděpodobností 0.875, další podobně.
51 CE versus NE R. Nau, S.G. Canovas and P. Hansen: On the geometry of Nash equilibria and correlated equilibria, IJGT F O F 3,4 0,0 O 0,0 4,3
52 Výpočet herních ekvilibríı, optimalizace heuristikami Mějme hru Γ = (Q;{S i } i Q ;{U i } i Q ) a počítačový model (proceduru) cellmodel : S R N pro výpočet užitků U(s) := cellmodel(s). cellmodel(s) modeluje důsledky akcí hráčů (s i ) i Q. Nechceme hru zkoumat analyticky, ale simulačně (výpočet U(s) = {cellmodel(s) s S}, výpočet ekvilibria). Nechceme zkoumat podobu cellmodel. Hledáme mechanismus (algoritmus), který při minimálním počtu kroků a s použitím minimální paměti najde ekvilibrium pouze při znalosti Γ = (Q;{S i } i Q ;{U i } i Q ) a dostupnosti cellmodel(s). Zajímavé zadání algoritmického problému. FDDS Fast Detection of Dominant Strategies.
53 Příště Máme uzavřenu část definice her, herních konceptů a ekvilibríı. Následují aplikace a druhá strana THE: Mechanism design teorie veřejné volby a aukce. Evoluční teorie her. Rozbor rozsáhlého modelu z elektroenergetiky. Závěrečné opakování (???).
Contents. 1 Repeated games Úvod Definice opakované hry Folk theorems Jak lidé hrají v opakovaných hrách...
Contents 1 Repeated games 2 1.1 Úvod.......................................... 2 1.2 Opakované vězňovo dilema............................... 4 1.3 Preference a očekávaný užitek v opakované hře....................
THE: Smíšené Nashovo ekvilibrium ve strategických hrách (Mixed Nash Equilibria in Normal-Form Games)
THE: Smíšené Nashovo ekvilibrium ve strategických hrách (Mixed Nash Equilibria in Normal-Form Games) Brno University of Technology Brno Czech Republic October 9, 2014 Úvod Čerpáno z: Fudenberg, D., Tirole,
Úvod do teorie her
Úvod do teorie her 2. Garanční řešení, hry s nulovým součtem a smíšené strategie Tomáš Kroupa http://staff.utia.cas.cz/kroupa/ 2017 ÚTIA AV ČR Program 1. Zavedeme řešení, které zabezpečuje minimální výplatu
Teorie her a ekonomické rozhodování. 2. Maticové hry
Teorie her a ekonomické rozhodování 2. Maticové hry 2.1 Maticová hra Teorie her = ekonomická vědní disciplína, která se zabývá studiem konfliktních situací pomocí matematických modelů Hra v normálním tvaru
3. ANTAGONISTICKÉ HRY
3. ANTAGONISTICKÉ HRY ANTAGONISTICKÝ KONFLIKT Antagonistický konflikt je rozhodovací situace, v níž vystupují dva inteligentní rozhodovatelé, kteří se po volbě svých rozhodnutí rozdělí o pevnou částku,
Teorie her a ekonomické rozhodování. 3. Dvoumaticové hry (Bimaticové hry)
Teorie her a ekonomické rozhodování 3. Dvoumaticové hry (Bimaticové hry) 3.1 Neantagonistický konflikt Hra v normálním tvaru hráči provedou jediné rozhodnutí a to všichni najednou v rozvinutém tvaru řada
TGH13 - Teorie her I.
TGH13 - Teorie her I. Jan Březina Technical University of Liberec 19. května 2015 Hra s bankéřem Máte právo sehrát s bankéřem hru: 1. hází se korunou dokud nepadne hlava 2. pokud hlava padne v hodu N,
ANTAGONISTICKE HRY 172
5 ANTAGONISTICKÉ HRY 172 Antagonistický konflikt je rozhodovací situace, v níž vystupují dva inteligentní rozhodovatelé, kteří se po volbě svých rozhodnutí rozdělí o pevnou částku, jejíž výše nezávisí
Úvod do teorie her
Úvod do teorie her. Formy her a rovnovážné řešení Tomáš Kroupa http://staff.utia.cas.cz/kroupa/ 208 ÚTIA AV ČR Program. Definujeme 2 základní formy pro studium různých her: rozvinutou, strategickou. 2.
Stručný úvod do teorie her. Michal Bulant
Stručný úvod do teorie her Michal Bulant Čím se budeme zabývat Alespoň 2 hráči (osoby, firmy, státy, biologické druhy apod.) Každý hráč má určitou množinu strategií, konkrétní situace (outcome) ve hře
Teorie her a ekonomické rozhodování 5. Opakované hry
Teorie her a ekonomické rozhodování 5. Opakované hry (chybějící či chybná indexace ve skriptech) 5.1 Opakovaná hra Hra až dosud hráči hráli hru jen jednou v reálu se konflikty neustále opakují (firmy nabízí
Operační výzkum. Teorie her cv. Hra v normálním tvaru. Optimální strategie. Maticové hry.
Operační výzkum Teorie her cv. Hra v normálním tvaru. Optimální strategie. Maticové hry. Operační program Vzdělávání pro konkurenceschopnost Název projektu: Inovace magisterského studijního programu Fakulty
1 Linearní prostory nad komplexními čísly
1 Linearní prostory nad komplexními čísly V této přednášce budeme hledat kořeny polynomů, které se dále budou moci vyskytovat jako složky vektorů nebo matic Vzhledem k tomu, že kořeny polynomu (i reálného)
Úvod do teorie her. 6. Koaliční hry
Úvod do teorie her 6. Koaliční hry Tomáš Kroupa http://staff.utia.cas.cz/kroupa/ 2018 ÚTIA AV ČR Různé formy her Známé formy her jsou: rozvinutá, strategická, koaliční. Pro danou množinu hráčů N = {1,...,
Operační výzkum. Teorie her. Hra v normálním tvaru. Optimální strategie. Maticové hry.
Operační výzkum Hra v normálním tvaru. Optimální strategie. Maticové hry. Operační program Vzdělávání pro konkurenceschopnost Název projektu: Inovace magisterského studijního programu Fakulty ekonomiky
Teorie her a ekonomické rozhodování. 7. Hry s neúplnou informací
Teorie her a ekonomické rozhodování 7. Hry s neúplnou informací 7.1 Informace Dosud hráči měli úplnou informaci o hře, např. znali svou výplatní funkci, ale i výplatní funkce ostatních hráčů často to tak
Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice
Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice Vektorové podprostory K množina reálných nebo komplexních čísel, U vektorový prostor nad K. Lineární kombinace vektorů u 1, u 2,...,u
THE: Cournotův model oligopolu Existence Nashova ekvilibria
THE: Cournotův model oligopolu Existence Nashova ekvilibria Brno University of Technology Brno Czech Republic October 23, 2018 Úvod Čerpáno z: Fudenberg, D., Tirole, J.: Game Theory, The MIT Press, 1991
4EK201 Matematické modelování. 10. Teorie rozhodování
4EK201 Matematické modelování 10. Teorie rozhodování 10. Rozhodování Rozhodování = proces výběru nějaké možnosti (varianty) podle stanoveného kritéria za účelem dosažení stanovených cílů Rozhodovatel =
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.0141 Báze vektorových prostorů, transformace souřadnic Michal Botur Přednáška
Teorie her a ekonomické rozhodování. 4. Hry v rozvinutém tvaru
Teorie her a ekonomické rozhodování 4. Hry v rozvinutém tvaru 4.1 Hry v rozvinutém tvaru Hra v normálním tvaru hráči provedou jediné rozhodnutí a to všichni najednou v rozvinutém tvaru řada po sobě následujících
Obecná úloha lineárního programování
Obecná úloha lineárního programování Úloha Maximalizovat hodnotu c T x (tzv. účelová funkce) za podmínek Ax b (tzv. omezující podmínky) kde A je daná reálná matice typu m n a c R n, b R m jsou dané reálné
Lineární programování
Lineární programování Petr Tichý 19. prosince 2012 1 Outline 1 Lineární programování 2 Optimalita a dualita 3 Geometrie úlohy 4 Simplexová metoda 2 Lineární programování Lineární program (1) min f(x) za
4EK212 Kvantitativní management. 2. Lineární programování
4EK212 Kvantitativní management 2. Lineární programování 1.7 Přídatné proměnné Přídatné proměnné jsou nezáporné Mají svoji ekonomickou interpretaci, která je odvozena od ekonomické interpretace omezení
FIT ČVUT MI-LOM Lineární optimalizace a metody. Dualita. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti
FIT ČVUT MI-LOM Lineární optimalizace a metody Dualita Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Michal Černý, 2011 FIT ČVUT, MI-LOM, M. Černý, 2011: Dualita 2/5 Dualita Evropský
4EK213 LINEÁRNÍ MODELY
4EK213 LINEÁRNÍ MODELY Úterý 11:00 12:30 hod. učebna SB 324 Mgr. Sekničková Jana, Ph.D. 2. PŘEDNÁŠKA MATEMATICKÝ MODEL ÚLOHY LP Mgr. Sekničková Jana, Ph.D. 2 OSNOVA PŘEDNÁŠKY Obecná formulace MM Množina
Teorie rozhodování (decision theory)
Umělá inteligence II Roman Barták, KTIML roman.bartak@mff.cuni.cz http://ktiml.mff.cuni.cz/~bartak Teorie pravděpodobnosti (probability theory) popisuje v co má agent věřit na základě pozorování. Teorie
Paralelní grafové algoritmy
Paralelní grafové algoritmy Značení Minimální kostra grafu Nejkratší cesta z jednoho uzlu Nejkratší cesta mezi všemi dvojicemi uzlů Použité značení Definition Bud G = (V, E) graf. Pro libovolný uzel u
4EK213 LINEÁRNÍ MODELY
4EK213 LINEÁRNÍ MODELY Úterý 11:00 12:30 hod. učebna SB 324 3. přednáška SIMPLEXOVÁ METODA I. OSNOVA PŘEDNÁŠKY Standardní tvar MM Základní věta LP Princip simplexové metody Výchozí řešení SM Zlepšení řešení
Metody lineární optimalizace Simplexová metoda. Distribuční úlohy
Metody lineární optimalizace Simplexová metoda Dvoufázová M-úloha Duální úloha jednofázová Post-optimalizační analýza Celočíselné řešení Metoda větví a mezí Distribuční úlohy 1 OÚLP = obecná úloha lineárního
(Ne)kooperativní hry
(Ne)kooperativní hry Tomáš Svoboda, svobodat@fel.cvut.cz katedra kybernetiky, centrum strojového vnímání 5. října 2015 Tomáš Svoboda, svobodat@fel.cvut.cz / katedra kybernetiky, CMP / (Ne)kooperativní
Hranová konzistence. Arc consistency AC. Nejprve se zabýváme binárními CSP. podmínka odpovídá hraně v grafu podmínek
Hranová konzistence Arc consistency AC Nejprve se zabýváme binárními CSP podmínka odpovídá hraně v grafu podmínek Hrana (V i, V j ) je hranově konzistentní, právě když pro každou hodnotu x z aktuální domény
Koaliční hry. Kooperativní hra dvou hráčů
Koaliční hry Obsah kapitoly. Koalice dvou hráčů 2. Koalice N hráčů Studijní cíle Cílem tohoto tematického bloku je získání základního přehledu o kooperativních hrách a jejich aplikovatelnosti. Student
4EK201 Matematické modelování. 2. Lineární programování
4EK201 Matematické modelování 2. Lineární programování 2.1 Podstata operačního výzkumu Operační výzkum (výzkum operací) Operational research, operations research, management science Soubor disciplín zaměřených
Přednáška #8. Základy mikroekonomie TEORIE HER
Přednáška #8 Základy mikroekonomie TEORIE HER 14.11.2012 V minulé přednášce jsme si vysvětlili, co je to oligopolistické tržní uspořádání Oligopol jako tržní uspořádání stojí mezi monopolem a režimem dokonalé
TEORIE HER - ÚVOD PŘEDNÁŠKA. OPTIMALIZACE A ROZHODOVÁNÍ V DOPRAVĚ část druhá Přednáška 2. Zuzana Bělinová
PŘEDNÁŠKA 2 TEORIE HER - ÚVOD Teorie her matematická teorie rozhodování dvou racionálních hráčů, kteří jsou na sobě závislí Naznačuje, jak by se v takové situaci chovali racionální a informovaní hráči.
KOOPERATIVNI HRY DVOU HRA CˇU
8 KOOPERATIVNÍ HRY DVOU HRÁČŮ 291 V této kapitole se budeme zabývat situacemi, kdy hráči mohou před začátkem hry uzavřít závaznou dohodu o tom, jaké použijí strategie, vygenerovaný zisk si však nemohou
1 Determinanty a inverzní matice
Determinanty a inverzní matice Definice Necht A = (a ij ) je matice typu (n, n), n 2 Subdeterminantem A ij matice A příslušným pozici (i, j) nazýváme determinant matice, která vznikne z A vypuštěním i-tého
Úvod do lineární algebry
Úvod do lineární algebry 1 Aritmetické vektory Definice 11 Mějme n N a utvořme kartézský součin R n R R R Každou uspořádanou n tici x 1 x 2 x, x n budeme nazývat n rozměrným aritmetickým vektorem Prvky
Anotace. Středník II!! 7. 5. 2010 programování her.
Anotace Středník II!! 7. 5. 2010 programování her. Teorie her Kombinatorická hra je hrou dvou hráčů. Stav hry je určen pozicí nějakých předmětů. Všechny zúčastněné předměty jsou viditelné. Jde o tzv. hru
Teorie her a ekonomické rozhodování. 8. Vyjednávací hry
Teorie her a ekonomické rozhodování 8. Vyjednávací hry 8. Vyjednávání Teorie her Věda o řešení konfliktů Ale také věda o hledání vzájemně výhodné spolupráce Teorie vyjednávání Odvětví teorie her dohoda
Rozhodovací procesy v ŽP HRY A SIMULAČNÍ MODELY
Rozhodovací procesy v ŽP HRY A SIMULAČNÍ MODELY Teorie her proč využívat hry? Hry a rozhodování varianty her cíle a vítězné strategie (simulační) Modely Operační hra WRENCH Cv. Katedra hydromeliorací a
Dynamic Games (Extensive Form Games)
THE: Dymické hry s úplnou informací Dynamic Games (Extensive Form Games) Brno University of Technology Brno Czech Republic November 1, 2013 Motivace ke zkoumání her Zpátky na začátek. Je třeba se vyrovnat
TEORIE HER Meta hry PŘEDNÁŠKA. OPTIMALIZACE A ROZHODOVÁNÍ V DOPRAVĚ část druhá Přednáška 4. Zuzana Bělinová
PŘEDNÁŠKA 4a TEORIE HER Meta hry OPTIMALIZACE A ROZHODOVÁNÍ V DOPRAVĚ část druhá Přednáška 4 Strategické hry se nenulovým součtem počet hráčů není dán, ale dále uvažujeme 2 hráče hrající racionálně Meta
Učební texty k státní bakalářské zkoušce Matematika Základy lineárního programování. študenti MFF 15. augusta 2008
Učební texty k státní bakalářské zkoušce Matematika Základy lineárního programování študenti MFF 15. augusta 2008 1 15 Základy lineárního programování Požadavky Simplexová metoda Věty o dualitě (bez důkazu)
Aplikace teorie her. V ekonomice a politice Ing. Václav Janoušek
Aplikace teorie her V ekonomice a politice Ing. Václav Janoušek Co je teorie her a její využití Teorie her obor aplikované matematiky a operační analýzy, sloužící k analýze konfliktních a strategických
Dokažte Větu 2(Minimax) ze třetího dílu seriálu pro libovolnou hru s nulovým součtem, ve kterémákaždýhráčnavýběrprávězedvoustrategií.
Teorie her º Ö ÐÓÚ Ö Ì ÖÑ Ò Ó Ð Ò º Ù Ò ¾¼½ ÐÓ ½º HráčIsitajněnapíšenapapírnějaképřirozenéčíslozrozmezíaž noznačmeho ivestejnou chvílisirovněžhráčiinapíšenapapírnějaképřirozenéčíslozrozmezíaž noznačmeho
fakulty MENDELU v Brně (LDF) s ohledem na disciplíny společného základu http://akademie.ldf.mendelu.cz/cz (reg. č. CZ.1.07/2.2.00/28.
Základy lineárního programování Vyšší matematika, Inženýrská matematika LDF MENDELU Podpořeno projektem Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem
Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague
1 / 23 Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague 2 / 23 biologové často potřebují najít často se opakující sekvence DNA tyto sekvence bývají relativně krátké,
THE: Nekooperativní hry s nulovým součtem Non-Cooperative Zero-sum Games
THE: Nekooperativní hry s nulovým součtem Non-Cooperative Brno University of Technology Brno Czech Republic October 16, 2014 Úvod Čerpáno z: Fudenberg, D., Tirole, J.: Game Theory, MIT Press, 1991 Osborne,
Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:
3 Maticový počet 3.1 Zavedení pojmu matice Maticí typu (m, n, kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru: a 11 a 12... a 1k... a 1n a 21 a 22...
VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE. Model tahové hry s finančními odměnami
VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE FAKULTA INFORMATIKY A STATISTIKY Obor: Statistika a ekonometrie Název bakalářské práce Model tahové hry s finančními odměnami Autor: Vedoucí bakalářské práce: Rok: 009 Markéta
LDF MENDELU. Simona Fišnarová (MENDELU) Základy lineárního programování VMAT, IMT 1 / 25
Základy lineárního programování Vyšší matematika, Inženýrská matematika LDF MENDELU Podpořeno projektem Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem
a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:
Řešené příklady z lineární algebry - část 1 Typové příklady s řešením Příklady jsou určeny především k zopakování látky před zkouškou, jsou proto řešeny se znalostmi učiva celého semestru. Tento fakt se
OPTIMALIZACE A MULTIKRITERIÁLNÍ HODNOCENÍ FUNKČNÍ ZPŮSOBILOSTI POZEMNÍCH STAVEB D24FZS
OPTIMALIZACE A MULTIKRITERIÁLNÍ HODNOCENÍ FUNKČNÍ ZPŮSOBILOSTI POZEMNÍCH STAVEB Optimalizace a multikriteriální hodnocení funkční způsobilosti pozemních staveb Anotace: Optimalizace objektů pozemních staveb
Mezi firmami v oligopolu dochází ke strategickým interakcím. Při zkoumání strategických interakcí používáme teorii her.
Teorie her a oligopol Varian: Mikroekonomie: moderní přístup, oddíly 26.1-9, 27.1-3 a 27.7-8 Varian: Intermediate Microeconomics, Sections 27.1-9, 28.1-3, 28.7-8 () 1 / 36 Obsah přednášky V této přednášce
Markovské metody pro modelování pravděpodobnosti
Markovské metody pro modelování pravděpodobnosti rizikových stavů 1 Markovský řetězec Budeme uvažovat náhodný proces s diskrétním časem (náhodnou posloupnost) X(t), t T {0, 1, 2,... } s konečnou množinou
Teorie her a ekonomické rozhodování 6. Kooperativní hry více hráčů
Teorie her a ekonomické rozhodování 6. Kooperativní hry více hráčů (chyby ve skriptech) 6.1 Koaliční hra Kooperativní hra hráči mají možnost před samotnou hrou uzavírat závazné dohody dva hráči (hra má
4EK311 Operační výzkum. 1. Úvod do operačního výzkumu
4EK311 Operační výzkum 1. Úvod do operačního výzkumu Mgr. Jana SEKNIČKOVÁ, Ph.D. Nová budova, místnost 433 Konzultační hodiny InSIS E-mail: jana.seknickova@vse.cz Web: jana.seknicka.eu/vyuka Garant kurzu:
Hry v rozvinutém tvaru a opakované hry. Hry v rozvinutém tvaru
Hry v rozvinutém tvaru a opakované hry Obsah kapitoly Studijní cíle Doba potřebná ke studiu Pojmy k zapamatování Úvod Výkladová část 1) Hry v rozvinutém tvaru 2) Opakované hry I. Konečně opakované hry
Formální jazyky a gramatiky Teorie programovacích jazyků
Formální jazyky a gramatiky Teorie programovacích jazyků doc. Ing. Jiří Rybička, Dr. ústav informatiky PEF MENDELU v Brně rybicka@mendelu.cz Připomenutí základních pojmů ABECEDA jazyk je libovolná podmnožina
Principy indukce a rekursivní algoritmy
Principy indukce a rekursivní algoritmy Jiří Velebil: A7B01MCS 19. září 2011: Indukce 1/20 Příklad Místností rozměru n budeme rozumět šachovnici rozměru 2 n 2 n, ze které je jedno (libovolné) pole vyjmuto.
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ107/2200/280141 Soustavy lineárních rovnic Michal Botur Přednáška 4 KAG/DLA1M: Lineární
Katedra aplikované matematiky FEI VŠB Technická univerzita Ostrava luk76/la1
Lineární algebra 5. přednáška: Báze a řešitelnost soustav Dalibor Lukáš Katedra aplikované matematiky FEI VŠB Technická univerzita Ostrava email: dalibor.lukas@vsb.cz http://homel.vsb.cz/ luk76/la1 Text
12. Lineární programování
. Lineární programování. Lineární programování Úloha lineárního programování (lineární optimalizace) je jedním ze základních problémů teorie optimalizace. Našim cílem je nalézt maximum (resp. minimum)
Zavedení předmětu "Teorie her" do výuky v magisterském studijním programu na FIT VUT v Brně
Zavedení předmětu "Teorie her" do výuky v magisterském studijním programu na FIT VUT v Brně Martin Hrubý FIT VUT v Brně, Božetěchova 2, BRNO, 612 66 hrubym@fit.vutbr.cz 21. ledna 2008 Abstrakt Článek pojednává
13. cvičení z PSI ledna 2017
cvičení z PSI - 7 ledna 07 Asymptotické pravděpodobnosti stavů Najděte asymptotické pravděpodobnosti stavů Markovova řetězce s maticí přechodu / / / 0 P / / 0 / 0 0 0 0 0 0 jestliže počáteční stav je Řešení:
Operace s maticemi. 19. února 2018
Operace s maticemi Přednáška druhá 19. února 2018 Obsah 1 Operace s maticemi 2 Hodnost matice (opakování) 3 Regulární matice 4 Inverzní matice 5 Determinant matice Matice Definice (Matice). Reálná matice
KOOPERATIVNÍ HRY FORMULACE, KONCEPCE ŘEŠENÍ, JÁDRO HRY, HRA VE TVARU CHARAKTERISTICKÉ FUNKCE, SHAPLEYOVA HODNOTA CO JE TO TEORIE HER A ČÍM SE ZABÝVÁ?
KOOPERATIVNÍ HRY FORMULACE, KONCEPCE ŘEŠENÍ, JÁDRO HRY, HRA VE TVARU CHARAKTERISTICKÉ FUNKCE, SHAPLEYOVA HODNOTA CO JE TO TEORIE HER A ČÍM SE ZABÝVÁ? Teorie her je ekonomická vědní disciplína, která se
Úvod do teorie her. David Bartl, Lenka Ploháková
Úvod do teorie her David Bartl, Lenka Ploháková Abstrakt Předložený text Úvod do teorie her pokrývá čtyři nejdůležitější, vybrané kapitoly z této oblasti. Nejprve je čtenář seznámen s předmětem studia
Obecná úloha lineárního programování. Úloha LP a konvexní množiny Grafická metoda. Jiří Neubauer. Katedra ekonometrie FEM UO Brno
Přednáška č. 3 Katedra ekonometrie FEM UO Brno Optimalizace portfolia Investor se s pomocí makléře rozhoduje mezi následujícími investicemi: akcie A, akcie B, státní pokladniční poukázky, dluhopis A, dluhopis
ÚVOD DO ROZHODOVÁNÍ PŘEDNÁŠKA. OPTIMALIZACE A ROZHODOVÁNÍ V DOPRAVĚ Přednáška 1. Zuzana Bělinová
PŘEDNÁŠKA 1 ÚVOD DO ROZHODOVÁNÍ Organizační Vyučující Ing., Ph.D. email: belinova@k620.fd.cvut.cz Doporučená literatura Dudorkin J. Operační výzkum. Požadavky zápočtu docházka zápočtový test (21.5.2015)
13. Lineární programování
Jan Schmidt 2011 Katedra číslicového návrhu Fakulta informačních technologií České vysoké učení technické v Praze Zimní semestr 2011/12 MI-PAA EVROPSKÝ SOCIÁLNÍ FOND PRAHA & EU: INVESTUJENE DO VAŠÍ BUDOUCNOSTI
V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti
Kapitola 5 Vektorové prostory V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti operací sčítání a násobení
Umělá inteligence II Roman Barták, KTIML roman.bartak@mff.cuni.cz http://ktiml.mff.cuni.cz/~bartak Úvodem Pokud agent ví, kde je (plně pozorovatelný svět), potom pro každý stav umíme doporučit akci maximalizující
Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic
Přednáška třetí (a pravděpodobně i čtvrtá) aneb Úvod do lineární algebry Matice a soustavy rovnic Lineární rovnice o 2 neznámých Lineární rovnice o 2 neznámých Lineární rovnice o dvou neznámých x, y je
MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]
MATICE Matice typu m/n nad tělesem T je soubor m n prvků z tělesa T uspořádaných do m řádků a n sloupců: a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij] a m1 a m2 a mn Prvek a i,j je prvek matice A na místě
Úvod do teorie her ZVYŠOVÁNÍ ODBORNÝCH KOMPETENCÍ AKADEMICKÝCH PRACOVNÍKŮ OSTRAVSKÉ UNIVERZITY V OSTRAVĚ A SLEZSKÉ UNIVERZITY V OPAVĚ
ZVYŠOVÁNÍ ODBORNÝCH KOMPETENCÍ AKADEMICKÝCH PRACOVNÍKŮ OSTRAVSKÉ UNIVERZITY V OSTRAVĚ A SLEZSKÉ UNIVERZITY V OPAVĚ Úvod do teorie her David Bartl, Lenka Ploháková OSNOVA Úvod (hra n hráčů ve strategickém
Úlohy nejmenších čtverců
Úlohy nejmenších čtverců Petr Tichý 7. listopadu 2012 1 Problémy nejmenších čtverců Ax b Řešení Ax = b nemusí existovat, a pokud existuje, nemusí být jednoznačné. Často má smysl hledat x tak, že Ax b.
IB112 Základy matematiky
IB112 Základy matematiky Řešení soustavy lineárních rovnic, matice, vektory Jan Strejček IB112 Základy matematiky: Řešení soustavy lineárních rovnic, matice, vektory 2/53 Obsah Soustava lineárních rovnic
Doprovodné texty ke kurzu Teorie her
Doprovodné texty ke kurzu Teorie her Martin Hrubý Fakulta informačních technologií Vysoké učení technické v Brně zimní semestr, akad. rok 2010/11 1 Contents 1 Úvod do Teorie her 4 1.1 Herní situace......................................
Modely teorie grafů, min.kostra, max.tok, CPM, MPM, PERT
PEF ČZU Modely teorie grafů, min.kostra, max.tok, CPM, MPM, PERT Okruhy SZB č. 5 Zdroje: Demel, J., Operační výzkum Jablonský J., Operační výzkum Šubrt, T., Langrová, P., Projektové řízení I. a různá internetová
Analýza Petriho sítí. Analýza Petriho sítí p.1/28
Analýza Petriho sítí Analýza Petriho sítí p.1/28 1. Základní pojmy Základní problémy analýzy bezpečnost (safeness) omezenost (boundness) konzervativnost (conservation) živost (liveness) Definice 1: Místo
Báze a dimenze vektorových prostorů
Báze a dimenze vektorových prostorů Buď (V, +, ) vektorový prostor nad tělesem (T, +, ). Nechť u 1, u 2,..., u n je konečná posloupnost vektorů z V. Existují-li prvky s 1, s 2,..., s n T, z nichž alespoň
Unbounded Model Checking
Unbounded Model Checking Stefan Ratschan Katedra číslicového návrhu Fakulta informačních technologíı České vysoké učení technické v Praze 25. října 2011 Evropský sociální fond Praha & EU: Investujeme do
Ekonomická formulace. Matematický model
Ekonomická formulace Firma balící bonboniéry má k dispozici 60 čokoládových, 60 oříškových a 85 karamelových bonbónů. Může vyrábět dva druhy bonboniér. Do první bonboniéry se dávají dva čokoládové, šest
Konstrukce relace. Postupně konstruujeme na množině všech stavů Q relace i,
[161014-1204 ] 11 2.1.35 Konstrukce relace. Postupně konstruujeme na množině všech stavů Q relace i, kde i = 0, 1,..., takto: p 0 q právě tehdy, když bud p, q F nebo p, q F. Dokud i+1 i konstruujeme p
Algoritmus pro hledání nejkratší cesty orientovaným grafem
1.1 Úvod Algoritmus pro hledání nejkratší cesty orientovaným grafem Naprogramoval jsem v Matlabu funkci, která dokáže určit nejkratší cestu v orientovaném grafu mezi libovolnými dvěma vrcholy. Nastudoval
Statistická teorie učení
Statistická teorie učení Petr Havel Marek Myslivec přednáška z 9. týdne 1 Úvod Představme si situaci výrobce a zákazníka, který si u výrobce objednal algoritmus rozpoznávání. Zákazník dodal experimentální
Třídy složitosti P a NP, NP-úplnost
Třídy složitosti P a NP, NP-úplnost Cíle přednášky: 1. Definovat, za jakých okolností můžeme problém považovat za efektivně algoritmicky řešitelný. 2. Charakterizovat určitou skupinu úloh, pro které není
Doprovodné texty ke kurzu Teorie her
Doprovodné texty ke kurzu Teorie her Martin Hrubý Fakulta informačních technologií Vysoké učení technické v Brně zimní semestr, akad. rok 2010/11 1 Contents 1 Předmluva 3 1.1 Předmět Teorie her na FIT
10. Soustavy lineárních rovnic, determinanty, Cramerovo pravidlo
0. Soustavy lineárních rovnic, determinanty, Cramerovo pravidlo (PEF PaA) Petr Gurka aktualizováno 9. prosince 202 Obsah Základní pojmy. Motivace.................................2 Aritmetický vektorový
0.1 Úvod do lineární algebry
Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Lineární rovnice o 2 neznámých Definice 011 Lineární rovnice o dvou neznámých x, y je rovnice, která může být vyjádřena ve tvaru ax + by = c, kde
Matice. Předpokládejme, že A = (a ij ) je matice typu m n: diagonálou jsou rovny nule.
Matice Definice. Maticí typu m n nazýváme obdélníkové pole, tvořené z m n reálných čísel (tzv. prvků matice), zapsaných v m řádcích a n sloupcích. Značíme např. A = (a ij ), kde i = 1,..., m, j = 1,...,
Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace
Vektory a matice Aplikovaná matematika I Dana Říhová Mendelu Brno Obsah 1 Vektory Základní pojmy a operace Lineární závislost a nezávislost vektorů 2 Matice Základní pojmy, druhy matic Operace s maticemi
9 Kolmost vektorových podprostorů
9 Kolmost vektorových podprostorů Od kolmosti dvou vektorů nyní přejdeme ke kolmosti dvou vektorových podprostorů. Budeme se zabývat otázkou, kdy jsou dva vektorové podprostory na sebe kolmé a jak to poznáme.
5.7 Kooperativní hry 5.7.1 Kooperativní hra 2 hráčů 5.7.2 Kooperativní hra N hráčů 5.8 Modely oligopolu 5.9 Teorie redistribučních systémů 5.
Mikroekonomie bakalářský kurz - VŠFS Jiří Mihola, jiri.mihola@quick.cz, www.median-os.cz, 2010 Téma 6 Teorie her, volby teorie redistribučních systémů a teorie veřejné Obsah 5.7 Kooperativní hry 5.7.1
Teorie her a ekonomické rozhodování. 11. Aukce
Teorie her a ekonomické rozhodování 11. Aukce 11. Aukce Příklady tržních mechanismů prodej s pevnou cenou cenové vyjednávání aukce Využití aukcí prodej uměleckých předmětů, nemovitostí, prodej květin,
SOUSTAVY LINEÁRNÍCH ALGEBRAICKÝCH ROVNIC
SOUSTAVY LINEÁRNÍCH ALGEBRAICKÝCH ROVNIC Pojm: Algebraická rovnice... rovnice obsahující pouze celé nezáporné mocnin neznámé, tj. a n n + a n 1 n 1 +... + a 2 2 + a 1 + a 0 = 0, kde n je přirozené číslo.
Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague
1 / 40 regula Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague regula 1 2 3 4 5 regula 6 7 8 2 / 40 2 / 40 regula Iterační pro nelineární e Bud f reálná funkce