Stručný úvod do teorie her. Michal Bulant

Podobné dokumenty
Teorie her a ekonomické rozhodování. 2. Maticové hry

TGH13 - Teorie her I.

Teorie her a ekonomické rozhodování. 3. Dvoumaticové hry (Bimaticové hry)

Operační výzkum. Teorie her cv. Hra v normálním tvaru. Optimální strategie. Maticové hry.

Teorie her a ekonomické rozhodování. 7. Hry s neúplnou informací

Úvod do teorie her. 6. Koaliční hry

Operační výzkum. Teorie her. Hra v normálním tvaru. Optimální strategie. Maticové hry.

ANTAGONISTICKE HRY 172

Úvod do teorie her

Teorie her a ekonomické rozhodování. 8. Vyjednávací hry

3. ANTAGONISTICKÉ HRY

Dva podniky vedou mezi sebou spor, k jehož vyřešení může každý z nich podniknout jednu

5.7 Kooperativní hry Kooperativní hra 2 hráčů Kooperativní hra N hráčů 5.8 Modely oligopolu 5.9 Teorie redistribučních systémů 5.

Teorie her a ekonomické rozhodování 6. Kooperativní hry více hráčů

KOOPERATIVNÍ HRY FORMULACE, KONCEPCE ŘEŠENÍ, JÁDRO HRY, HRA VE TVARU CHARAKTERISTICKÉ FUNKCE, SHAPLEYOVA HODNOTA CO JE TO TEORIE HER A ČÍM SE ZABÝVÁ?

TEORIE HER - ÚVOD PŘEDNÁŠKA. OPTIMALIZACE A ROZHODOVÁNÍ V DOPRAVĚ část druhá Přednáška 2. Zuzana Bělinová

Dokažte Větu 2(Minimax) ze třetího dílu seriálu pro libovolnou hru s nulovým součtem, ve kterémákaždýhráčnavýběrprávězedvoustrategií.

Aplikace teorie her. V ekonomice a politice Ing. Václav Janoušek

Koaliční hry. Kooperativní hra dvou hráčů

12 HRY S NEÚPLNOU INFORMACÍ

KOOPERATIVNI HRY DVOU HRA CˇU

TEORIE HER

Teorie her a ekonomické rozhodování 5. Opakované hry

Dvou-maticové hry a jejich aplikace

Úvod do teorie her

Abstrakt. V příspěvku se budeme zabývat kombinatorickými hrami s úplnou informací

Teorie her a ekonomické rozhodování. 4. Hry v rozvinutém tvaru

Rozhodovací procesy v ŽP HRY A SIMULAČNÍ MODELY

Varianty Monte Carlo Tree Search

Anotace. Středník II!! programování her.

Mezi firmami v oligopolu dochází ke strategickým interakcím. Při zkoumání strategických interakcí používáme teorii her.

Úvod do teorie her ZVYŠOVÁNÍ ODBORNÝCH KOMPETENCÍ AKADEMICKÝCH PRACOVNÍKŮ OSTRAVSKÉ UNIVERZITY V OSTRAVĚ A SLEZSKÉ UNIVERZITY V OPAVĚ

Dva kompletně řešené příklady

4EK201 Matematické modelování. 10. Teorie rozhodování

Úvod do teorie her. David Bartl, Lenka Ploháková



VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE. Model tahové hry s finančními odměnami

PŘÍKLADY DVOJMATICOVÉ HRY

Analýza jádra kooperativních her

charakteristika oligopolu kartel Cournotův model duopolu oligopol s dominantní firmou Sweezyho model (se zalomenou křivkou poptávky) Nashova


Hry v rozvinutém tvaru a opakované hry. Hry v rozvinutém tvaru

Teorie her a ekonomické rozhodování. 9. Modely nedokonalých trhů

Operační výzkum. Teorie her. Řešení maticových her převodem na úlohu LP.

TEORIE HER Meta hry PŘEDNÁŠKA. OPTIMALIZACE A ROZHODOVÁNÍ V DOPRAVĚ část druhá Přednáška 4. Zuzana Bělinová

MATICOVÉ HRY MATICOVÝCH HER

TEORIE HER. Základní pojmy teorie her. buď racionální (usiluje o optimální výsledek hry) nebo indiferentní (výsledek hry je mu lhostejný)

Teorie her a ekonomické rozhodování. Úvodní informace Obsah kursu 1. Úvod do teorie her

OBECNÉ METODY VYROVNÁNÍ

1. dílčí téma: Rozhodování při riziku, neurčitosti a hry s neúplnou informací

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

2 Vektorové normy. Základy numerické matematiky - NMNM201. Definice 1 (Norma). Norma je funkcionál splňující pro libovolné vektory x a y a pro

Charakteristika oligopolu

K vymezení hry Titanic. Jan Mertl

P 1 = P 1 1 = P 1, P 1 2 =

(Ne)kooperativní hry

Úvod Game designer Struktura hry Formální a dramatické elementy Dynamika her Konec. Úvod do game designu 1 / 37

2.2. SČÍTÁNÍ A NÁSOBENÍ MATIC

1. dílčí téma: Úvod do teorie her a historie

Chytrý medvěd učí počítat

MATEMATICKÁ TEORIE ROZHODOVÁNÍ

e erz vaná v aco rozpr

Emotion Technická charakteristika

MAGIC FOX MULTIGAME V.2.3 CZ(750)

Detektivní SAM. Seminář aplikované matematiky. Matyáš T. Mdx Theuer. 30. října Katedra aplikované matematiky VŠB -TUO

Habermaaß-hra 3616A /4717N. Zvířecí pyramida karetní hra

strategická desková hra pro dva hráče

Přednáška #8. Základy mikroekonomie TEORIE HER

8.3). S ohledem na jednoduchost a názornost je výhodné seznámit se s touto Základní pojmy a vztahy. Definice

4EK311 Operační výzkum. 2. Lineární programování

Základy maticového počtu Matice, determinant, definitnost

Kooperativní hra N hráčů

V této části se budeme věnovat nejjednoduššímu typu her, ve kterých rozhodováníprobíhávjednomkrokuakaždýhráčmáúplnouinformacijako

nutně znamenat ztrátu), ve které mají oba hráči dvě možnosti kooperovat nebo zradit.

Vektorový prostor. d) Ke každému prvku u V n existuje tzv. opačný prvek u, pro který platí, že u + u = o (vektor u nazýváme opačný vektor k vektoru u)

1 Soustavy lineárních rovnic

VŠB Technická Univerzita Ostrava. Teorie her. studijní opora. Zdeněk Sawa

B) EX = 0,5, C) EX = 1, F) nemáme dostatek informací.

PRAVIDLA HRY. Kuraki Mura Wee Yee Chong

1 Řešení soustav lineárních rovnic

Pravděpodobnost, náhoda, kostky

Teorie her. Kapitola Základní pojmy Základní pojmy

KOLÉBKA RENESANCE. (Die Wiege der Renaissance)

HERNÍ PLÁN A POPIS HRY

Doba. 1. Položte herní plán doprostřed stolu. 2. Žetony jídla roztřiďte podle hodnot a umístěte je na loviště.

OBSAH BALENÍ PREHLED ˇ A CÍL HRY. Kupujte nejlepší domy, když jsou levné, protihráče přinuťte hodně utrácet a svůj majetek prodávejte s velkým ziskem!

Dokumentace programu piskvorek

Hry a UI historie. von Neumann, 1944 algoritmy perfektní hry Zuse, Wiener, Shannon, přibližné vyhodnocování

Habermaaß-hra 5432A /4795N. Koláček nebo král

2 HRA V EXPLICITNÍM TVARU

PRAVIDLA HRY. Loris Games, s.r.o. Všechna práva vyhrazena.

Doprovodné texty ke kurzu Teorie her

BRIDGE. 7 zdvihů 1 trik 8 zdvihů 2 triky 9 zdvihů 3 triky 10 zdvihů 4 triky 11 zdvihů 5 triků 12 zdvihů 6 triků 13 zdvihů 7 triků

Osadníci z Katanu. a Monte Carlo Tree Search. David Pěgřímek. MFF UK (2013) 1 / 24

Lineární algebra. Matice, operace s maticemi

AMERICAN POKER V- 300

5. Maticová algebra, typy matic, inverzní matice, determinant.

Optimalizace provozních podmínek. Eva Jarošová

V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti

Transkript:

Stručný úvod do teorie her Michal Bulant

Čím se budeme zabývat Alespoň 2 hráči (osoby, firmy, státy, biologické druhy apod.) Každý hráč má určitou množinu strategií, konkrétní situace (outcome) ve hře určuje zisk (profit, payoff) každému hráči Základní typy her: Dva hráči s nulovým součtem (konflikt) Dva hráči s nenulovým součtem (konflikt, kooperace) N hráčů jaké koalice utvořit, jak si rozdělit zisk?

Ukázka hry a způsobu přemýšlení Radek Slávek A B A 2-3 B 0 2 C -5 10

Ukázka hry a způsobu přemýšlení Radek Slávek A B A 1,1-2,2 B 2,-2-5,-5

Hry 2 hráčů maticové hry Hry v normální formě vyzkoušejte si Radek Slávek A B C D A 12-1 1 0 B 5 1 7-20 C 3 2 4 3 D -16 0 0 16

Dominance Dominovaná strategie není proč ji hrát, proto je rušíme (I tranzitivně) Radek Slávek A B C D E A 1 1 1 2 2 B 2 1 1 1 2 C 2 2 1 1 1 D 2 2 2 1 0

Sedlový bod Sedlový bod (equilibrium, rovnovážná situace) Může být více sedlových bodů, nemusí ale existovat žádný, a to ani po redukci dominovaných strategií

Řešení v čistých strategiích Radek Slávek A B C D A 4 2 5 2 B 2 1-1 -20 C 3 2 4 2 D -16 0 6 1

Řešení v čistých strategiích Věta: Každé 2 sedlové body mají stejnou hodnotu, situace,složená ze strategíí obsahujících sedlový bod, je sedlovým bodem. Jak najít sedlové body efektivně?

Řešení v čistých strategiích Slávek A B C D Radek A 4 3 2 5 2 maximin B -10 2 0-1 -10 C 7 5 2 3 2 maximin D 0 8-4 -5-5 7 8 2 5 minimax

Hra bez sedlového bodu Radek Slávek A B A 2-3 -3 B 0 2 0 maximin C -5 10-5 2 10 minimax

Smíšené strategie Pravděpodobnostní rozšíření maticových her Umožňují se strategie jako 1/3 A + 2/3 B Očekávaná hodnota výnosů a 1,a 2,...,a k, hrajeme-li je s pravděpodobnostmi p 1,p 2,...,p k, je p 1 a 1 +p 2 a 2 +...+p k a k,

Jak hrát se smíšenými strategiemi Slávek 0.5A + 0.5B: Radek A: 0.5*2+0.5*(-3)=-0.5 Radek B: 0.5*0+0.5*3=1.5 Pokud tedy Radek ví, že si Slávek hází korunou, bude hrát strategii B. A Slávek B A 2-3 Radek B 0 3

Jak hrát se smíšenými strategiemi Slávek tedy bud hrát raději tak, aby obě Radkovy strategie měly stejný očekávaný výnos a volba kterékoliv mu tedy nepřinese žádnou výhodu: Slávek xa + (1-x)A metoda vyrovnaného očekávání x*2 + (1-x)(-3)=x*0+(1-x)*3 => x=3/4 Podobně Radek x=3/8 Radek A Slávek B A 2-3 B 0 3

Jak hrát se smíšenými strategiemi Slávek 3/4*A + 1/4*B, Radek 3/8*A + 5/8 *B Radek si zajistí očekávaný výnos aspoň 3/4, Slávek zajiistí, že Radkův výnos nebude vyšší než 3/4. => hodnota hry je ¾ Trik pro nalezení optimální smíšené strategie (rozmyslet, že platí!) A Slávek B A 2-3 B 0 3

Větší maticové hry 2xm, nx2 grafické řešení 3x3 metoda vyrovnání očekávání, předtím je třeba ověřit dominanci a sedlové body Radek Slávek A B C A 1 2 2 B 2 1 2 C 2 2 0

Minimaxová věta Každá maticová hra m x n má řešení, tj. existuje jediná hodnota v (hodnota hry) a optimální strategie (čistá nebo smíšená) pro Radka a Slávka tak, že Radek si zajistí aspoň v Slávek zajistí, že Radek nedostane víc než v Toto řešení lze vždy nalézt jako řešení nějaké podhry k x k.

Větší maticové hry 2xm, nx2 grafické řešení 3x3 metoda vyrovnání očekávání, předtím je třeba ověřit dominanci a sedlové body rozdělte se do dvojic a zkuste následující hru Radek Slávek A B C D E F A 4-4 3 2-3 3 B -1-1 -2 0 0 4 C -1 2 1-1 2-3

Aplikace: povstalci vs. policie m jednotek povstalců, n policie, 2 muniční sklady, které je třeba ochránit povstalci obsadí sklad, pokud na něj zaútočí větším počtem jednotek než, kterým je bráněn policií povstalci vítězí, pokud obsadí aspoň jeden sklad hry 2:3, 4:4, 7:9

Hry v rozšířené formě Game trees umožňují postupné tahy hráčů (hry v normální formě se hrají simultánně) Př. triviální poker velký balíček pouze z A,K (eso, král) Slávek si vezme kartu a ztrojí vklad nebo vzdá Radek vezme kartu a vyrovná nebo vzdá informační množina nakreslete si strom, každá stromová hra se dá převést do maticové formy

Hry v rozšířené formě - aplikace soutěž na trhu Zeus Music industry leader Athena Acoustics malá firma, silný výzkum nový výrobek hexaphonic sound system není znám očekávaný odbyt (malý x velký) malý trh => lépe se prodává kvalita velký trh => na odbyt jdou levnější výrobky prozkoumáme vliv různých aspektů různé informační množiny

Aplikace 1.oba výrobci tajně vyrábějí bez znalosti trhu 2.Athena je flexibilnější počká na rozhodnutí leadera trhu a podle něj se zařídí (4 strategie) 3.Zeus provede analýzu trhu, Athena o něm ví, ale nezná výsledek 4.Athena udělá vlastní výzkum hra 4 x 16 stejný výsledek jako výše 5.Zeus provede analýzu trhu tak, že se o něm Athena nedozví => každý hraje jinou hru!

2. Hry s nekonstantním součtem Soupeření, ale i možnost spolupráce dominantní strategie, equilibrium jako dříve (tzv. Nashova rovnováha) Slávek A B A (2,3) (3,2) RadekB (1,0) (0,1) rovnováha (2,3) zdánlivě symetrická hra

2. Hry s nekonstantním součtem hra bez rovnovážné situace v čistých strategiích Radek získá optimální smíšenou strategii 3/7A+4/7B ze Slávkovy hry (s nulovým součtem), podobně Slávek z Radkovy Slávek A B A (2,4) (1,0) RadekB (3,1) (0,4)

Problémy Nashovy rovnováhy nebere ohled na vlastní výnosy a produkuje tak nízký výnos rovnováhy BA, AB níže dávají pro každého různý výnos a výsledná situace BB je nejhorší pro oba Slávek A B A (1,1) (2,5) RadekB (5,2) (-1,-1)

Vězňovo dilema jediná rovnováha BB, navíc silná příslušné strategie dominují AA je ale zjevně pro oba lepší tzv. Paretovo optimum dominance individuální racionalita Pareto kolektivní racionalita A Slávek B A (3,3) (-1,5) RadekB (5,-1) (0,0)

Vězňovo dilema s opakováním obecné PD T>R>U>S, R>(S+T)/2 pravděpodobnost opakování p, kdy je výhodné spolupracovat? (spec. př. unforgiving) strategie typu Tit For Tat A RadekB A B (R,R) (S,T) (T,S) (U,U)

Vyhrožování a sliby některé hry náchylné na vyhrožování např. Chicken Aplikace: distributor vs. odběratel (hra dvojic bez znalosti soupeřovy funkce, 10-15 kol)

3. Hry N hráčů zkoumá se tvorba koalic jak rozdělit zisk (náklady)? Def.: Hra ve tvaru charakteristické funkce - množina N hráčů, funkce v: Ρ(N) Z. Funkce v obvykle superaditivní

Shapleyho hodnota Jak férově rozdělit zisk (náklady) dané koalice? Axiomy: Axiom 1: f závisí pouze na v a respektuje symetrie Axiom 2: pokud v(s)=v(s\i) pro všechny koalice S, hráč i balvan, který nic neovlivňuje a nic nedostane. Axiom 3: hodnota f v součtu her je součtem hodnot f v jednotlivých hrách

Shapleyho hodnota Věta: Pro danou hru existuje jediná f splňující dané axiomy. Důkaz: na příkladu. Věta: f(i)=1/n! Σ (s-1)!(n-s)![v(s)-v(s\i)] s= S, suma přes i z S

3. Shapleyho hodnota Př.: Shapleyho vektor síly hlasování ve sněmovně (81,74,26,13,6) Př. výstavba hydroelektrárny v jižní Indii (1970)