TGH13 - Teorie her I. Jan Březina Technical University of Liberec 19. května 2015
Hra s bankéřem Máte právo sehrát s bankéřem hru: 1. hází se korunou dokud nepadne hlava 2. pokud hlava padne v hodu N, banéř vyplatí 2 N Kolik můžete požedovat za odstoupení od hry?
řešení Přiměřená náhrada je střední hodnota vyplacené částky tj. 1 1 2 + 21 4 +... 2N 1 2 N + =
Vězňovo dilema
Vězňovo dilema - vlastnosti Předpoklad, že nedojde k další hře, např. odplata. Optimální pro oba je spolupráce (remain silent). Nicméně pokud každý hledá jen svoje optimum, skončí to pro oba nejhorším způsobem. Model pro některé reálné situace (např. reklama, doping)
Výběrové řízení tři firmy: A-comp, B-comp, C-comp 3/4 zakázky získá druhá nejlevnější nabídka, první nabídka získá 1/4 zakázky v případě shody cen se zakázka dále děĺı strategie A-comp (kolik bude její cena): 20, 40 strategie B-comp: 20, 30, 40 strategie C-comp: 10, 50
hra - výběrové řízení nabídky (A,B,C) zisky (A,B,C) 20, 20, 10 7.5, 7.5, 2.5 20, 20, 50 10, 10, 0 20, 30, 10 15, 0, 2.5 20, 30, 50 5, 22.5, 0 20, 40, 10 15, 0, 2.5 20,40, 50 5, 30, 0 40, 20, 10 0, 15, 2.5 40, 20, 50 30, 5, 0 40, 30, 10 0, 22.5, 2.5 40, 30, 50 30, 7.5, 0 40, 40, 10 15, 15, 2.5 40,40, 50 20, 20, 0
Hra v normálním tvaru Hra v normálním tvaru je trojce množin H = (U, S, F ) množina účastníků - hráčů U = {1,..., N} množina prostorů strategíı pro účastníky S = {X 1,..., X 2 } množina výplatních funkcí hráčů F = {F 1,..., F 2 }, F i : X 1 X 2... X N R F lze chápat jako vektorovou funkci, která každému vektoru strategíı přiřazuje vektor výher Průběh hry: 1. každý hráč i U vybere svou strategii x i X i 2. vznikne vektor strategíı (x 1, x 2,..., x N ) 3. Každému hráči i U se vyplatí výhra podle výplatní funkce F i (x 1, x 2, x 3 )
Součet výher Dělení her podle součtu výher všech účastníků: 1. konflikt (hra) s nekonstantním součtem = součet výher závisí na volbě strategíı (př: vězňovo dilema) 2. konflikt (hra) s konstantním součtem = součet výher nezávisí na volbě strategíı (př: výběrové řízení) 3. konflikt (hra) s nulovým součtem = součet výher je nulový (př: kamen-nůžky-papír, poker, obchodní hry) Kooperativní hry jsou popsány prvním typem.
kámen - nůžky - papír Vlastnosti: počet hráčů N = 2, hra s nulovým součtem, konečný počet strategíı X 1 = X 2 = 3 X Y K N P K 0:0 1:-1-1:1 N -1:1 0:0 1:-1 P 1:-1-1:1 0:0
Šachy řečí teorie her konečné množství možných stavů (postavení) (zanedbáme historii) úplný předpis jak v každém postavení táhnout = strategie partie - každý hráč zvoĺı svou strategii a partie probíhá automaticky vyhledáním tahu pro aktuální postavení Teoreticky lze sestavit tabulku výsledků pro každou dvojici strategíı. hra s nulovým součtem (asi) Toto dohromady dává úplný popis hry šachy i bez známosti pravidel, tabulka výsledků obsahuje všechny možné partie.
Poznámky Příklady: kámen-nůžky-papír, intervalová hra Všichni účastníci znají možné strategie a výpletní funkce všech. (jinak hra s nedokonalou informací) Frustrující je pouze v to, že každý voĺı pouze svoji složku souboru strategíı. Pokud jsou prostory strategíı stejné a výplatní funkce nazávisí na permutaci hráčů, jedná se o symetrickou hru.
Klasifikace konfliktů 1. podle počtu účastníků - 2, 3,... 2. pro více účastníků - možnost tvorby koalic ano/ne 3. podle inteligence účastníků - míra neurčitosti 4. podle součtu výher 5. symetrické/nesymetrické
Neurčitost inteligentní účastník - vybírá strategii podle výhry neinteligentní účastník - vybírá strategii náhodně s daným rozdělením pravděpodobnosti (rozhodování při riziku), nebo vybírá podle předem neznámého rozdělení (rozhodování při neurčitosti) p - inteligentní účastník - pro p = 0 je inteligentní, pro p = 1 neinteligentní, jinak při rozhodování dělá náhodný pokus a s pravděpodobností p se bude rozhodovat jako inteligentní, s pst. (1 p) jako neinteligentní Poslední typ je model pro popis situací, kdy účastník dělá chyby nebo jedná pod časovým tlakem.
Maticové hry Předpoklady: N = 2, hra s nulovým součtem, konečný počet strategíı Hráči X a Y, jejich prostory strategíı X = {1,... m}, Y = {1,... n}. Výplatní funkce Z Y = Z X stačí psát pouze jednu. zápis do matice. Příklad: kámen - nůžky - papír podruhé Každé matici přísluší nějaká hra. K N P K 0 1-1 N -1 0 1 P 1-1 0
Optimální strategie Optimální strategie jsou takové, že pokud libovolný z hráčů zvoĺı jinou sníží si výhru. Přesně: Pokud Z 1 je výplatní funkce hráče 1. Pak strategie x, ỹ jsou optimální pokud Z 1 (x, ỹ) Z 1 ( x, ỹ) Z 1 ( x, y) pro všechna x X, y Y Optimální strategie se též nazávají Nashovy rovnovážné strategie nebo Nashovo ekvilibrium. levá nerovnost - největší prvek ve slupci pravá nerovnost - nejmenší prvek v řádku
Příklad: Hráč X vybírá maximum ve sloupci (maximalizuje svůj zisk svojí volbou strategie). Hráč Y vybírá minimum v řádku (minimalizuje soupeřův zisk svojí volbou strategie). X Y 1 2 3 4 1 4 4 3 5 2 42 10 2-1 3-12 56 2 2 Takto definované Nashovo ekvilibrium existuje jen pokud má matice sedlový prvek.
Další příkady kámen - nůžky - papír - nemá sedlový bod = Nashovo ekvilibrium K N P K 0 1-1 N -1 0 1 P 1-1 0
Smíšené strategie Cíl: Popsat optimální strategie i pro maticové hry bez sedlového bodu. (např. KNP) Za smíšenou strategii ˆx označíme náhodnou veličinu s hodnotami v množině strategíı X. Každá taková náhodná veličina je určena pravděpodobnostmi ˆx i jednotlivých strategíı x i X. Přičemž ˆx i = 1. Smíšená strategie je tedy popsána vektorem pravděpodobností. Prostor smíšených strategíı ˆX je množina všech těchto náhodných veličin resp. rozdělení pravděpodobnosti. Výplatní funkce pro smíšené strategie ˆx = (ˆx 1,..., ˆx n ) T, ŷ = (ŷ 1,..., ŷ n ) T je střední hodnota: Z 1 (ˆx, ŷ) = ˆx T Aŷ = n i=1 j=1 m ˆx i A i,j ŷ j kde A je matice původní hry. Nová hra se smíšenými strategiemi se nazývá smíšené rozšíření maticové hry.
Základní věta o maticových hrách Pro každé smíšené rozšíření už Nashovo ekvilibrium existuje: Theorem Pro každou matici A existují vektory x ˆX, ỹ Ŷ takové, že x T Aỹ x T Aỹ x T Ay pro všechna x ˆX, y Ŷ.