Úvod do teorie her. druhé upravené vydání. Martin Dlouhý Petr Fiala



Podobné dokumenty
Teorie her a ekonomické rozhodování. 2. Maticové hry

Teorie her a ekonomické rozhodování. Úvodní informace Obsah kursu 1. Úvod do teorie her

Teorie her a ekonomické rozhodování. 3. Dvoumaticové hry (Bimaticové hry)

3. ANTAGONISTICKÉ HRY

ANTAGONISTICKE HRY 172

TGH13 - Teorie her I.

Operační výzkum. Teorie her. Hra v normálním tvaru. Optimální strategie. Maticové hry.

Dvou-maticové hry a jejich aplikace

Teorie her a ekonomické rozhodování. 8. Vyjednávací hry

Úvod do teorie her

Teorie her a ekonomické rozhodování. 7. Hry s neúplnou informací

4EK201 Matematické modelování. 10. Teorie rozhodování


Operační výzkum. Teorie her cv. Hra v normálním tvaru. Optimální strategie. Maticové hry.

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic

Teorie her a ekonomické rozhodování 5. Opakované hry

Teorie her a ekonomické rozhodování. 9. Modely nedokonalých trhů

KOOPERATIVNI HRY DVOU HRA CˇU

Teorie her a ekonomické rozhodování. 4. Hry v rozvinutém tvaru

TEORIE HER - ÚVOD PŘEDNÁŠKA. OPTIMALIZACE A ROZHODOVÁNÍ V DOPRAVĚ část druhá Přednáška 2. Zuzana Bělinová

Koaliční hry. Kooperativní hra dvou hráčů

0.1 Úvod do lineární algebry

5.7 Kooperativní hry Kooperativní hra 2 hráčů Kooperativní hra N hráčů 5.8 Modely oligopolu 5.9 Teorie redistribučních systémů 5.

Teorie her a ekonomické rozhodování 6. Kooperativní hry více hráčů

4EK213 LINEÁRNÍ MODELY

Stručný úvod do teorie her. Michal Bulant

12 HRY S NEÚPLNOU INFORMACÍ

1 Linearní prostory nad komplexními čísly

KOOPERATIVNÍ HRY FORMULACE, KONCEPCE ŘEŠENÍ, JÁDRO HRY, HRA VE TVARU CHARAKTERISTICKÉ FUNKCE, SHAPLEYOVA HODNOTA CO JE TO TEORIE HER A ČÍM SE ZABÝVÁ?

fakulty MENDELU v Brně (LDF) s ohledem na disciplíny společného základu (reg. č. CZ.1.07/2.2.00/28.

(Cramerovo pravidlo, determinanty, inverzní matice)

VÍCEKRITERIÁLNÍ ROZHODOVANÍ

0.1 Úvod do lineární algebry

V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti

LDF MENDELU. Simona Fišnarová (MENDELU) Základy lineárního programování VMAT, IMT 1 / 25

4EK201 Matematické modelování. 1. Úvod do matematického modelování

SEMINÁRNÍ PRÁCE Z MATEMATIKY

TEORIE HER. Základní pojmy teorie her. buď racionální (usiluje o optimální výsledek hry) nebo indiferentní (výsledek hry je mu lhostejný)

5. Náhodná veličina. 2. Házíme hrací kostkou dokud nepadne šestka. Náhodná veličina nabývá hodnot z posloupnosti {1, 2, 3,...}.

MODELY OLIGOPOLU COURNOTŮV MODEL, STACKELBERGŮV MODEL

Úvod do teorie her

4EK311 Operační výzkum. 1. Úvod do operačního výzkumu

charakteristika oligopolu kartel Cournotův model duopolu oligopol s dominantní firmou Sweezyho model (se zalomenou křivkou poptávky) Nashova

Teorie pravěpodobnosti 1

Otázky ke státní závěrečné zkoušce

Teorie her a ekonomické rozhodování. 11. Aukce

Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace

VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE. Model tahové hry s finančními odměnami

4EK213 LINEÁRNÍ MODELY

1. července 2010

8.3). S ohledem na jednoduchost a názornost je výhodné seznámit se s touto Základní pojmy a vztahy. Definice

Modely oligopolu. I. Dokonalý trh II. Nedokonalý trh 1. Modely oligopolu. Dokonalý trh. Nedokonalý trh

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

4EK201 Matematické modelování. 2. Lineární programování

5 Informace o aspiračních úrovních kritérií

12 DYNAMIKA SOUSTAVY HMOTNÝCH BODŮ

Úvod do teorie her. David Bartl, Lenka Ploháková

Diskrétní matematika. DiM /01, zimní semestr 2018/2019

1 Vektorové prostory.


Charakteristika oligopolu

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

Pravděpodobnost a statistika

{Q={1,2};S,T;u(s,t)} (3.3) Prorovnovážnéstrategie s,t vehřesnulovýmsoučtemmusíplatit:

1 Řešení soustav lineárních rovnic

Rozhodovací procesy v ŽP HRY A SIMULAČNÍ MODELY

Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru

Úvod do teorie her ZVYŠOVÁNÍ ODBORNÝCH KOMPETENCÍ AKADEMICKÝCH PRACOVNÍKŮ OSTRAVSKÉ UNIVERZITY V OSTRAVĚ A SLEZSKÉ UNIVERZITY V OPAVĚ

ANALYTICKÁ GEOMETRIE V ROVINĚ

Aplikace teorie her. V ekonomice a politice Ing. Václav Janoušek

12. Lineární programování

FIT ČVUT MI-LOM Lineární optimalizace a metody. Dualita. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

4. Aplikace matematiky v ekonomii

Lineární programování

Afinita je stručný název pro afinní transformaci prostoru, tj.vzájemně jednoznačné afinní zobrazení bodového prostoru A n na sebe.

ÚVOD DO ROZHODOVÁNÍ PŘEDNÁŠKA. OPTIMALIZACE A ROZHODOVÁNÍ V DOPRAVĚ Přednáška 1. Zuzana Bělinová

Vícekriteriální hodnocení variant úvod

Náhodné jevy. Teorie pravděpodobnosti. Náhodné jevy. Operace s náhodnými jevy

Ekonomická formulace. Matematický model

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:

6 Ordinální informace o kritériích

Úvod do lineární algebry

Matematika. Kamila Hasilová. Matematika 1/34

9 Kolmost vektorových podprostorů

Západočeská univerzita v Plzni. Fakulta aplikovaných věd. Ivana Kozlová. Modely analýzy obalu dat

Operační výzkum. Teorie her. Řešení maticových her převodem na úlohu LP.

Matice. Modifikace matic eliminační metodou. α A = α a 2,1, α a 2,2,..., α a 2,n α a m,1, α a m,2,..., α a m,n

a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:

Hry v rozvinutém tvaru a opakované hry. Hry v rozvinutém tvaru

Nejistota a rovnováha Varian: Mikroekonomie: moderní přístup, kapitoly 12 a 16 Varian: Intermediate Microeconomics, 8e, Chapters 12 and 16 1 / 42

Diskrétní matematika. DiM /01, zimní semestr 2016/2017

Derivace funkcí více proměnných

MATICOVÉ HRY MATICOVÝCH HER

M - Příprava na 1. zápočtový test - třída 3SA

1 Determinanty a inverzní matice

Báze a dimenze vektorových prostorů

příkladů do cvičení. V textu se objeví i pár detailů, které jsem nestihl (na které jsem zapomněl) a(b u) = (ab) u, u + ( u) = 0 = ( u) + u.

7. přednáška Systémová analýza a modelování. Přiřazovací problém

5. Lokální, vázané a globální extrémy

Transkript:

Úvod do teorie her druhé upravené vydání Martin Dlouhý Petr Fiala 2009

2 Teorie her: analýza konfliktů a spolupráce

Teorie her: analýza konfliktů a spolupráce 3 Obsah Předmluva... 5 1. Úvod do teorie her a rozhodování... 7 1.1 Vznik, základní pojmy... 7 1.2 Teorie užitku... 9 2. Hry s konstantním součtem... 17 2.1 Definice hry... 17 2.2 Nashova rovnováha... 20 3. Hry s nekonstantním součtem... 27 3.1 Nekooperativní hra... 27 3.2 Problémy Nashovy rovnováhy... 31 3.3 Kooperativní hra dvou hráčů... 35 4. Hry v rozvinutém tvaru... 39 4.1 Principy... 39 4.2 Salónní hry... 41 4.3 Příklad konfliktu dvou firem... 44 4.4 Cvičení... 46 5. Opakované hry... 47 5.1 Základní pojmy, principy... 47 5.2 Konečně opakované hry... 51 5.3 Nekonečně opakované hry... 52 6. Kooperace ve hře s více hráči... 57 6.1 Koaliční hry... 57 6.2 Hlasovací hry... 61 7. Hry s neúplnou informací... 73 7.1 Neúplné, nedokonalé a soukromé informace... 73 7.2 Statická Bayesovská hra... 74 8. Vyjednávání... 79 8.1 Nashovo vyjednávací řešení... 79 8.2 Příklady vyjednávacích her... 81 9. Modely nedokonalých trhů... 85 9.1 Nedokonalé trhy... 85 9.2 Modely oligopolu... 86 9.3 Modely monopolu... 96 9.4 Cvičení... 101 10. Rozhodování při riziku a neurčitosti... 103 10.1 Rozhodování při riziku... 103 10.2 Rozhodování při neurčitosti... 104 11. Aukce... 110 11.1 Typy aukcí... 110 11.2 Aukce jako Bayesovská hra... 112 Literatura... 116 Rejstřík... 118

4 Teorie her: analýza konfliktů a spolupráce

Teorie her: analýza konfliktů a spolupráce 5 Předmluva Teorie her je vědní obor, který je řazen do matematické ekonomie, ale také do teorie rozhodování a operačního výzkumu. Teorie her se zabývá rozborem širokého spektra rozhodovacích situací s více účastníky (hráči). Pojem hra má v moderní teorii her velmi obecný význam, který nezahrnuje pouze salónní hry typu šachy či poker, nýbrž v podstatě jakoukoli konfliktní situaci mezi jedinci, podniky, armádami, státy, politickými stranami, biologickými druhy. Tato různorodost aplikačních oblastí ukazuje na univerzalitu modelů vyvinutých v rámci teorie her a představuje též zdroj pro tvorbu nových modelů, které by lépe zachytily zvláštnosti určité aplikační oblasti. Teorie her využívá pro zachycení konfliktních situací matematický aparát. Matematika jasně a jednoznačně určuje předpoklady a pravidla hry, tím se vyhýbá skrytým předpokladům a vysvětluje omezení teorie. Samotná matematika však není dostatečným nástrojem, např. při analýze dynamických rozhodovacích situací s mnoha různými účastníky se musíme spoléhat na simulační řešení, neboť analytické řešení není dostupné. V jiných případech se při analýze určitých konfliktních situací pohybujeme na hranici psychologie, kognitivní vědy, biologie a ostatních disciplín. Kombinace vědních oborů obvykle nabízí nové impulsy pro další rozvoj poznání, což zajišťuje, že teorie her zůstává zajímavým a inspirativním oborem. Cílem první kapitoly je představit teorii her jako ekonomickou vědní disciplínu a poukázat na její historické kořeny. Kapitola se též zabývá teorií užitku, popisuje von Neumannovu-Morgensternovu axiomatickou teorii užitku a nejznámější paradoxy teorie užitku. Druhá a třetí kapitola jsou věnovány tzv. hrám v normálním tvaru, které popisují situace, v níž hráči provedou jediné rozhodnutí, a to všichni současně. Druhá kapitola se zabývá hrami s konstantním součtem, které popisují antagonistické konflikty co jeden hráč získá, druhý ztrácí, takže spolupráce v těchto konfliktech nemá smysl. Základním modelem tohoto druhu konfliktních situací je maticová hra. Třetí kapitola se zabývá hrami s nekonstantním součtem, ve kterých sice každý hráč sleduje své zájmy, ale tyto zájmy nemusí být v přímém protikladu se zájmy ostatních hráčů. Jde tedy o neantagonistický konflikt, jež modelujeme pomocí dvoumaticových her. Čtvrtá kapitola představuje tzv. hry v rozvinutém tvaru. V takových hrách rozumíme pod strategií hráče řadu po sobě následujících rozhodnutí (tahů), přičemž hráči se podle určitých pravidel ve svých tazích střídají. Šachová partie je typickým příkladem hry v rozvinutém tvaru. Pátá kapitola je úvodem do teorie opakovaných her, která se zabývá modelováním konečně či

6 Teorie her: analýza konfliktů a spolupráce nekonečně opakovaných rozhodovacích situací a studuje, zda opakování rozhodovací situace má vliv na chování hráčů. Šestá kapitola popisuje kooperativní hry s více hráči, kteří mohou vzájemně spolupracovat a utvářet koalice. Cílem kapitoly sedmé je ukázat základní přístupy k rozhodování v konfliktních situacích, ve kterých hráčům nejsou dostupné dokonalé informace. Kapitola osmá se zabývá studiem specifického typu kooperativních her, které modelují vyjednávání hráčů o možné, vzájemně prospěšné spolupráci. Tato část teorie her je známa jako teorie vyjednávání. Devátá kapitola je věnována základním modelům oligopolu a monopolu. Model oligopolu je tradičním příkladem hry s více hráči. V desáté kapitole si vysvětlíme, že rozhodování za rizika a neurčitosti lze dobře popsat i pomocí aparátu teorie her, který modeluje náhodný mechanismus jako dalšího hráče. Poslední, jedenáctá kapitola je úvodem do teorie aukcí.

Teorie her: analýza konfliktů a spolupráce 7 1. Úvod do teorie her a rozhodování 1.1 Vznik, základní pojmy Při studiu ekonomických rozhodovacích situací nemůžeme předpokládat, že jedinec či firma se může volně rozhodovat, aniž svým rozhodnutím vyvolá nějaké protiopatření ze strany okolí. Hypotetická firma Alfa, která zvýší či sníží rozsah výroby nebo cenu výrobku, musí počítat s tím, že konkurenční firmy budou na její rozhodnutí reagovat. Jinými slovy tím říkáme, že firma Alfa není Robinsonem Crusoem na pustém ostrově, a proto není možné hledat optimální strategii k maximalizaci zisku bez nutnosti interakce s dalšími firmami. Konkurenční firmy se tedy nacházejí v konfliktní situaci, v níž každá prosazuje své firemní zájmy. Pokud zájmy firem nejsou zcela protichůdné, může být nakonec řešením pro všechny výhodná spolupráce. Jestliže chce firma Alfa zvolit výrobní strategii, která maximalizuje její zisk, zjistí, že nemá bohužel k dispozici informaci o výrobní strategii konkurenční firmy Beta. Nejlepším způsobem, jak získat nějakou informaci o strategii firmy Beta, je podívat se na stávající situaci z pohledu firmy Beta a předpokládat, že firma Beta rovněž usiluje o maximalizaci zisku. Přitom firma Alfa dojde k poznání, že racionálně uvažující vedení firmy Beta zřejmě také došlo k závěru, že je potřeba se podívat na situaci z pohledu konkurenta, tedy firmy Alfa. Rozbor dané situace z pohledu teorie her poukazuje na to, že optimální strategie pro jednu firmu obdržíme tak, že zároveň stanovíme optimální strategii pro firmu druhou. Rozhodnutí firem je vzájemně propojeno stejně, jako když matematik vyřeší soustavu rovnic o dvou neznámých. Teorie her je ekonomická vědní disciplína, která se zabývá studiem konfliktních rozhodovacích situací. Historicky vzniklý název této disciplíny je poplatný tomu, že teorie her používá terminologii i formální aparát, které jsou založeny na zkoumání jednoduchých modelů konfliktních rozhodovacích situací, jakými jsou různé společenské hry. Mezi první příspěvky do teorie patří práce francouzského matematika A. Cournota (1838), který se zabýval stanovením rozsahu výroby na trhu, na němž existují pouze dvě konkurenční firmy (duopol). Jeho model oligopolu bychom měli nalézt v každé učebnici ekonomie. Základy současné teorie her

8 Teorie her: analýza konfliktů a spolupráce vznikaly v první polovině 20. století v pracích E. Zermela (1913), E. Borela (1921) a Johna von Neumanna (1928). Přestože některé výsledky z teorie her existovaly již dříve, do povědomí ekonomie a společenských věd vůbec se teorie her jako vědní disciplína dostala až v roce 1944. V tomto roce vyšla kniha Johna von Neumanna a Oskara Morgensterna Theory of Games and Economic Behavior (Teorie her a ekonomické chování), kterou autoři sepsali během druhé světové války v Princentonu ve Spojených státech. Jejich kniha se stala základním dílem ( biblí ) teorie her a ustanovila novou ekonomickou vědní disciplínu teorii her. Kniha se stala biblí i svým rozsahem, neboť svazek obsahoval více než šest set stran textu. Oskar Morgenstern ve svých vzpomínkách uvádí, že při rozhodování o názvu své knihy s Johnem von Neumannem uvažovali kromě názvu Teorie her a ekonomické chování též o názvu Obecná teorie racionálního chování. Dobře, že se tak nestalo, protože jinak by tato vědní disciplína zřejmě přišla o svůj atraktivní název. Ariel Rubinstein v doslovu k vydání u příležitosti šedesátin knihy Teorie her a ekonomické chování píše: Ten, kdo přišel s názvem teorie her byl génius nejen v matematice, ale také v práci s veřejností (public relations). Představte si, že by se kniha jmenovala Teorie racionality a rozhodování v interaktivních ekonomických situacích. Získala by si kniha a teorie her jako celek takovou popularitu? Slovo hra zní mladě a je důvěrně známé. Každý z nás hraje hry, ať už deskové, počítačové nebo politické. Teorie her se původně zabývala společenskými (salónními) hrami (šachy, poker atd.), což se odrazilo v poněkud odlišném názvosloví, než jsou ekonomové běžně zvyklí. Proto začneme výklad malým slovníčkem (tabulka č. 1.1), abychom si vyjasnili význam základních pojmů. Pojem hra má velmi obecný význam, který nezahrnuje pouze salónní hry typu šachy či poker, nýbrž v podstatě jakoukoli konfliktní situaci mezi dvěma a více účastníky (jedinci, podniky, armádami, státy, politickými stranami, biologickými druhy). Účastníci konfliktní rozhodovací situace jsou hráči. Každý hráč vybírá strategii ze svého prostoru strategií podle hodnot výplatní funkce. Výplatní funkce určitého hráče závisí nejen na rozhodnutí hráče samotného, ale také na rozhodnutí ostatních hráčů. Výplatní funkce daného hráče proto musí určit výhru hráče pro všechny možné kombinace rozhodnutí všech hráčů. Strategie, která hráči v dané konfliktní situaci (hře) zajišťuje nejvyšší dosažitelnou hodnotu výplatní funkce, je optimální strategií. Prohlásíme-li o

Teorie her: analýza konfliktů a spolupráce 9 účastníku konfliktu, že je inteligentním hráčem, předpokládáme, že má dokonalé informace o hře a chová se tak, aby maximalizoval hodnotu výplatní fukce (svůj užitek, zisk, výhru). Je to stejné jako kdybychom v ekonomii řekli, že je racionální. Tabulka č. 1.1: Základní pojmy teorie her hra TEORIE HER EKONOMICKÁ REALITA rozhodovací situace, konflikt hráč strategie optimální strategie prostor strategií výplatní funkce inteligentní hráč účastník konfliktu, rozhodovatel, firma, jedinec, politická strana konkrétní alternativa, kterou může hráč zvolit hráčem zvolená alternativa, která je pro něj nejvýhodnější seznam všech možných alternativ, které jsou hráči dostupné výsledek hry, tj. užitek, výhra hráče v závislosti na zvolených strategiích účastník konfliktu má dokonalé informace a maximalizuje výhru Jsou-li zájmy hráčů v přímém protikladu, tzn. jeden účastník ztrácí právě to, co druhý získává, mluvíme o antagonistickém konfliktu. Při rozhodování se často setkáváme s případy, kdy každý z účastníků sleduje své vlastní zájmy, ale tyto zájmy nemusí být v přímém protikladu, potom mluvíme o neantagonistickém konfliktu. U neantagonistických konfliktů je důležité rozlišit dva případy, zda hráči mají nebo nemají možnost uzavírat před volbou strategií závazné smlouvy o tom, jakou volbu učiní. V prvním případě mluvíme o kooperativní teorii, v druhém o nekooperativní teorii. 1.2 Teorie užitku Aby hráč mohl rozhodnout, která strategie je pro něj optimální, musí být schopen porovnat výsledky různých strategií. V teorii her bude mít výsledek hry číselnou hodnotu, kterou získáme z výplatní funkce hráče. V tom případě je rozhodování už jednoduché, neboť racionální hráč vybere maximální hodnotu. Jenže odkud se taková číselná hodnota vezme a je vždy možné

10 Teorie her: analýza konfliktů a spolupráce výsledek hry ohodnotit číslem? Pro odpovědi na dané otázky se potřebujeme dozvědět něco o teorii užitku. Teorie užitku je součástí ekonomické teorie, kde slouží především k vysvětlení spotřebitelského chování. Pojem užitek umožňuje analýzu rozhodnutí o tom, jaké statky a služby (a v jakém množství) si spotřebitel při omezeném rozpočtu pořídí. Užitkem nazýváme stupeň uspokojení ze spotřeby určitého statku (obecněji z určité události), což je pojem velmi obecný, uměle definovaný ekonomickou vědou, nikoliv psychologií či jinou příbuznou vědou. Jedinec zakoupením a spotřebou statků a služeb získá určité uspokojení, takže statky a služby, které poslouží k dosažení tohoto účelu (uspokojení), jsou pro jedince užitečné. Pro někoho jiného však může mít spotřeba těchto statků či služeb užitek minimální. Užitek je proto pojem subjektivní, mezi dvěma jedinci neporovnatelný. Ekonomičtí teoretikové se dělí do dvou skupin v názoru na to, do jaké míry je užitek měřitelný. Jedna část teoretiků zastává názor, že jedinec je schopen vyjádřit užitek ze statku určitým číslem, případně dokáže říci, o kolik či kolikrát je pro něj jeden statek užitečnější než jiný. Tento názor se v ekonomii označuje jako kardinalistická teorie užitku. Druhá část teoretiků se domnívá, že jedinec je při porovnání různých statků nanejvýše schopen určit, zda je určitý statek užitečnější než jiný, ale není již schopen určit o kolik či kolikrát. Tento pohled je označován jako ordinalistická teorie užitku. Teorie užitku je pro teorii her důležitá při konstrukci výplatních funkcí hráčů. V některých případech je konstrukce výplatní funkce snadná, neboť výhru, remízu a prohru můžeme vyjádřit jako hodnoty +1, 0 a -1. Jestliže jde o firmu, běžně vystačíme s hodnotami v peněžních jednotkách. I když u rozhodování jedinců je možné v mnohých situacích použít rovněž peněžních jednotek, správně by výplatní funkce měla vždy obsahovat užitky jedinců z jednotlivých variant. Teorie očekávané hodnoty, která byla původním přístupem pro hodnocení variant v případě rozhodování za rizika, předpokládá, že očekávanou hodnotu je možné vypočítat jako vážený průměr hodnot všech možných výsledků, kde váhy představují pravděpodobnosti jednotlivých výsledků. Daniel Bernoulli v roce 1738 prezentoval a navrhl řešení problému, dnes známému jako Petrohradský paradox, na kterém ukázal, že teorie očekávané hodnoty není dostatečná pro vysvětlení rozhodování jedinců za rizika.

Petrohradský paradox Teorie her: analýza konfliktů a spolupráce 11 Předpokládejme hypotetickou hernu nabízející hru, kterou má právo jednou hrát každý hráč a která se hraje podle dosti zajímavých pravidel. Bankéř hází mincí, dokud poprvé nepadne hlava, když hlava padne v n-tém hodu, vyplatí bankéř hráči výhru ve výši 2 n Kč. Hrát tuto hru je pro hráče výhodné, protože i v nejhorším případě získá alespoň 2 Kč, ale v případě štěstí může vyhrát daleko více. Hráč má právo vzdát se nabízené hry a požadovat za odstoupení jakoukoli peněžitou částku. Bankéř má však právo na tuto částku nepřistoupit, pokud se mu bude zdát jako příliš vysoká. V tom případě se bude hrát uvedená hra (proběhne náhodný pokus s mincí). Když hráči požadují přiměřené částky, např. 8 Kč, bankéř přistoupí na jejich vyplacení. Jak však hráči a bankéř stanoví, co je přiměřená částka? Podle teorie očekávané hodnoty by při náhodných výhrách měl hráč požadovat a bankéř přijmout peněžní částku přibližně rovnou střední hodnotě výhry. Menší odchylky od střední hodnoty lze interpretovat jako různý postoj hráčů k riziku. Vypočteme tedy střední hodnotu výhry, kterou získá hráč v této hře. K tomu, aby hráč vyhrál 2 n Kč, musí se objevit v náhodném pokusu (n 1)-krát orel a v n-tém hodu hlava. Tento jev má na poctivé minci pravděpodobnost (1/2) n. Střední hodnota výhry (očekávaná hodnota podle teorie očekávané hodnoty) je rovna: 1 1 1 1 n 1 2 + 4 + 8 + 16 +... + 2 +... = 1+ 1+ 1+ 1 +... =. 2 4 8 16 2 n Bankéř by měl tedy podle teorie hráči vyplatit libovolně velkou částku hráčem požadovanou a být spokojen, že hernu ochránil před potenciálně ještě vyšší výhrou. To však bankéř ve skutečnosti neudělá a příliš velkou částku odmítne. To si uvědomuje i hráč, takže podle toho musí volit svou strategii. Daniel Bernoulli navrhl vysvětlení situace, v níž se bankéř ani hráč neřídí střední hodnotou, pomocí úvahy o užitečnosti peněz. Když je člověk poměrně bohatý, přináší mu zvýšení jeho bohatství o jednu peněžní jednotku menší užitek, než když je chudý. Užitek z peněz tedy s jejich množstvím klesá. Místo peněžních částek bychom do výpočtu očekávané hodnoty měli používat peněžní částky transformované určitou konkávní funkcí (Bernoulli pracoval s logaritmickou funkcí), kterou dnes nazýváme jako užitková funkce. Rozhodování se řídí nikoliv očekávanou hodnotou, ale očekávaným užitkem.

12 Teorie her: analýza konfliktů a spolupráce Teorie očekávané hodnoty byla nahrazena teorií očekávaného užitku (expected utility theory, EUT). Petrohradský paradox je pomocí teorie očekávaného užitku vysvětlen tak, že lidé se nerozhodují podle střední hodnoty peněžních částek, ale podle střední hodnoty užitku z těchto peněžních částek. Dobře zvolená užitková funkce zajistí, že střední hodnota užitku již neroste do nekonečna. Jestliže hráč požaduje odstupné například ve výši 10 Kč, znamená to, že pro jeho individuální funkci užitku platí: 1 1 n 1 u ( 10) = u(2) + u(4) +... + u(2 ) +... 2 4 2 Axiomatizace teorie užitku John von Neumann a Oskar Morgenstern navrhli axiomatickou teorii užitku, která vychází z teorie očekávaného užitku, v monografii Teorie her a ekonomické chování. V práci ukazují, že lineární užitková funkce u popisující soustavu preferencí existuje, pokud soustava preferencí splňuje podmínky vyjádřené souborem několika axiomů. Takto definovaná užitková funkce je známa jako von Neumannova-Morgensternova užitková funkce nebo se ztotožňuje s teorií očekávaného užitku, takže autor dovolávající se na teorii očekávaného užitku má na mysli von Neumannovu-Morgensternovu axiomatizace této teorie. Možnost měřitelnosti užitků odvozují von Neumann a Morgenstern pomocí pravděpodobnostního přístupu. Uvažujme události A, B a C, přičemž jedinec preferuje A před B a B před C. Jestliže je možné uvažovat kombinaci (loterii), ve které vzájemně neslučitelné události A nebo C nastanou s pravděpodobností 0,5, je též možné kombinovat užitky z těchto událostí, ať už jsou jakékoliv. Když je událost B preferována před pravděpodobnostní kombinací událostí A a C v poměru (0,5; 0,5), znamená to, že událost B je méně vzdálená od události A než od C. Pokud přijmeme výše uvedenou operaci, je možné soustavu preferencí vyjádřit numericky. Dosazováním různých pravděpodobností událostí A a C, které označíme α a 1-α, určíme polohu B vůči A a C. Již víme, že událost B je preferována před kombinací 0,5A+0,5C, takže stačí pokračovat otázkou, zda je událost B preferována před kombinací 0,6A+0,4C atd. Uvažujme soustavu (abstraktních) užitků U s prvky u, v, w V soustavě U je dána relace u>v (čti u je preferováno před v) a pro jakékoli číslo α (0<α<1) je dána operace αu+(1-α)v (je možné kombinovat u a v s pravděpodobnostmi α a n

Teorie her: analýza konfliktů a spolupráce 13 1-α). Numerické vyjádření užitků je možné tehdy, pokud soustava U s výše uvedenou relací u>v a operací αu+(1-α)v splňuje následující axiomy: 1. Pro jakoukoli dvojici u, v platí právě jeden ze tří vztahů: u=v, u>v, u<v. Tento princip zajišťuje úplnost soustavy individuálních preferencí. 2. Z nerovností u>v a v>w vyplývá u>w. Tento axiom zavádí tranzitivnost preferencí. 3. Z nerovnosti u<v vyplývá u<αu+(1-α)v a z nerovnosti u>v vyplývá u>αu+(1-α)v. První nerovnost říká, že jestliže v je preferováno před u, pak jakákoli šance (1-α) na užitek v v kombinaci s u musí být preferována před samostatným u. Druhá nerovnost je opakem nerovnosti první. 4. Z nerovnosti u<w<v vyplývá existence α tak, že platí αu+(1-α)v<w. Obdobně je tomu pro obrácenou nerovnost u>w>v. Tento princip vyjadřuje spojitost užitkové funkce 5. Platí rovnost αu+(1-α)v=(1-α)v+αu, která vyjadřuje, že výsledná kombinace preferencí nezávisí na pořadí. 6. Platí rovnost α(βu+(1-β)v)+(1-α)v=γu+(1-γ)v, kde γ=αβ. Axiom vyjadřuje, že výsledný užitek nezávisí na pořadí kroků při kombinaci prvků. Za těchto předpokladů existuje užitková funkce u(x), která přiřadí užitkům u, v, w číselné hodnoty u(u), u(v), u(w). K užitkové funkci je přípustné přičíst reálnou konstantu, označme ji třeba b, nebo je možné užitkovou funkci násobit kladným reálným číslem, označme ho a, aniž by došlo ke změně soustavy preferencí. Užitková funkce au(x)+b vyjadřuje stejné preference jako původní užitková funkce u(x). Užitková funkce zachycuje individuální preference, které není možné mezi různými jedinci navzájem srovnávat či sčítat. Jestliže užitková funkce prvního jedince přiřazuje určité události číselnou hodnotu 5 a užitková funkce druhého jedince přiřazuje jiné události hodnotu 5, nelze z toho vyvozovat, že dané události přináší jedincům stejný užitek. Allaisův paradox Maurice Allais (1953), francouzský ekonom, nositel Nobelovy ceny za ekonomii, ukázal, že v určitých modelových situacích lidé projevují preference porušující axiomy teorie očekávaného užitku. Allais zformuloval

14 Teorie her: analýza konfliktů a spolupráce dvojice loterií, mezi kterými si měli účastníci experimentu volit, přičemž v jedné z dvojic jedna z loterií nabízí určitý výsledek s jistotou. Na základě hlasování účastníků experimentu se Allais pokusil potvrdit hypotézu, že tato jistota povede k posílení přitažlivosti dané varianty pro účastníky a že ovlivní hodnocení ostatních variant (loterií). Výsledky těchto experimentů jsou dnes známy jako Allaisův paradox. Seznámíme se nyní s jedním s Allaisových modelových rozhodovacích problémů. Předpokládejme čtyři možné události (loterie), které označíme A, B, C, D. Účastníci experimentu mají nejprve porovnat loterie A a B, poté loterie C a D. Níže uvádíme možné výhry z určité loterie, pravděpodobnosti výher v procentech. Hra 1 výhra pravděpodobnost Loterie A: 1 mil. Kč 100 % Loterie B: 5 mil. Kč 10 % 1 mil. Kč 89 % 0 Kč 1 % Hra 2 Loterie C: 5 mil. Kč 10 % 0 Kč 90 % Loterie D: 1 mil. Kč 11 % 0 Kč 89 % Očekávané užitky z těchto loterií jsou 1 milión Kč pro loterii A, 1,39 miliónu Kč pro loterii B, 0,5 miliónu pro loterii C a 0,1 miliónů Kč pro loterii D. Účastníci experimentu preferovali loterii A před B, i když podle teorie měli volit loterii B, která nabízí vyšší očekávaný užitek. Ve druhé hře účastníci preferovali loterii C před D. Kombinace těchto voleb vede k rozporu v teorii očekávaného užitku, neboť z takto projevených preferencí účastníků Allaisova experimentu vyplývají nerovnosti: u(1) > 0,10 u(5) + 0,89 u(1) + 0,01 u(0) (A je lepší než B) 0,10 u(5) + 0,90 u(0) > 0,11 u(1) + 0,89 u(0) (C je lepší než D). Ve druhé nerovnosti upravíme malým trikem 0,11u(1) na právě straně, takže dostaneme: 0,10 u(5) + 0,90 u(0) > 1,00 u(1) - 0,89 u(1) + 0,89 u(0). a

Teorie her: analýza konfliktů a spolupráce 15 K oběma stranám nerovnice přičteme výraz 0,89u(1) 0,89u(0), čímž získáme nerovnost vyjadřující preferenci B je lepší než A: 0,10 u(5) + 0,89 u(1) + 0,01 u(0) > 1,00 u(1), což je ve sporu s první nerovností, která zachycuje preferenci A je lepší než B. Allaisovy výsledky zpochybňují teorii racionálního očekávání, především předpoklad nezávislosti variant, podle kterého by dvě výhry se stejnou střední hodnotou měly mít stejný užitek. Protože v loterii B existuje možnost nulové výhry, může hráč, který si tuto výhru vylosuje, pociťovat zklamání z toho, že si raději nevybral loterii A, která nabízí jistotu výhry ve výši 1 mil. Kč. Copak by mu asi doma řekla manželka? Tento pocit jistoty, který nabízí jedna z variant, však podle Allaise znamená, že nelze jednotlivé loterie (části hry) posuzovat jako zcela nezávislé od ostatních loterií (částí hry). Ellsbergův paradox Americký ekonom Daniel Ellsberg je autorem podobného paradoxu teorie očekávaného užitku jako Maurice Allais. Účastník se má rozhodnout ve dvou experimentech s taháním míčků z urny mezi různými sázkami. V prvním experimentu je v urně 90 míčků, z toho 30 červených, zbytek tvoří černé a žluté míčky namíchané v neznámém poměru. Účastník si může vybrat mezi sázkami: a) když si vsadí na červenou barvu a je vytažen červený míček vyhraje 10 Kč, jinak získává 0 Kč, b) když si vsadí na černou barvu a je vytažen černý míček vyhraje 10 Kč, jinak získává 0 Kč. Výzkumníci pozorovali, že účastníci tohoto experimentu obvykle sází na červenou barvu, kde je jistá pravděpodobnost výhry 1/3, oproti černé barvě, kde se pravděpodobnost výhry pohybuje někde v intervalu mezi 0 až 2/3. To znamená, že platí podle teorie očekávaného užitku nerovnost: 1/3 u(10) + 2/3 u(0) > p(černá) u(10) + (1- p(černá)) u(0), z čehož vyplývá, že se o pravděpodobnosti vytažení míčku černé barvy účastníci domnívají 1/3 > p(černá).

16 Teorie her: analýza konfliktů a spolupráce Také v druhém experimentu je v urně 90 míčků, z toho 30 červených, zbytek tvoří černé a žluté míčky namíchané v neznámém poměru. V tomto experimentu se účastník rozhoduje mezi sázkami: a) vytažení červeného nebo žlutého míčku znamená výhru 10 Kč, b) vytažení černého a žlutého míčku znamená výhru 10 Kč. V tomto případě většina účastníků volí sázku na černou a žlutou barvu, kde je pravděpodobnost výhry 2/3, oproti sázce na červenou a žlutou, kde je pravděpodobnost výhry neznámá a pohybuje se v intervalu 1/3 až 1. Z preferencí účastníků získáme podle teorie očekávaného užitku nerovnost: 1/3u(10) + p(žl.)u(10) + p(černá)u(0) < 1/3u(0) + p(žl.)u(10) + p(černá)u(10), z čehož v tomto případě vyplývá, že se o pravděpodobnosti vytažení míčku černé barvy účastníci experimentu domnívají 1/3 < p(černá). Tím vzniká spor, neboť v jednou experimentu účastníci jednají tak, že pravděpodobnost vytažení černého míčku odhadují jako menší než 1/3 a ve druhém experimentu jako větší než 1/3. Tento spor je v ekonomické literatuře znám jako Ellsbergův paradox. Výsledky experimentů jsou interpretovány tím způsobem, že je porušen předpoklad nezávislosti užitkové funkce na riziku. Lidé mají averzi vůči riziku, což se při rozhodování projevuje jejich averzí vůči variantám, které riziko obsahují. V ekonomické literatuře se objevují nové modely teorie užitku, které usilují o vysvětlení některých selhání teorie racionálního očekávání. Například Amos Tversky a Daniel Kahneman (viz Skořepa, 2007) navrhli v roce 1992 tzv. kumulativní prospektovou teorii (cumulative prospect theory). Ve své teorii navrhují tzv. hodnotovou funkci, která je na rozdíl od užitkové funkce v teorii očekávaného užitku, definována jako rozdíl výsledku určité alternativy od jistého referenčního výsledku. Výsledky tak lze rozdělit na zisky a ztráty podle toho, zda se nacházejí pod nebo nad referenčním výsledkem a vzniká možnost, aby hodnotová funkce měla jiný tvar pro zisky a jiný pro ztráty. Druhým novým nástrojem teorie je možnost transformace pravděpodobností výsledků. Hodnotová funkce je pro zisky konkávní, zatímco pro ztráty konvexní, což znamená, že změny ve výsledcích daleko od referenčního výsledku mají menší a menší význam. Kumulativní prospektová teorie sice umí vysvětlit například Allaisův paradox, přesto zatím nelze očekávat, že by v nejbližší době tato nebo nějaká z jiných alternativních teorií vážně ohrozila výsadní postavení teorie očekávaného užitku.

Teorie her: analýza konfliktů a spolupráce 17 2. Hry s konstantním součtem 2.1 Definice hry Teorie her provádí analýzu konfliktních rozhodovacích situací pomocí specifických matematických modelů, které na přiměřené míře abstrakce popisují podstatné charakteristiky dané konfliktní situace a vynechávají ty nepodstatné. Dva nejdůležitější matematické modely teorie her jsou hra v normálním tvaru a hra v rozvinutém tvaru, kterou se budeme podrobněji zabývat později. Naším výchozím teoretickým modelem bude hra v normálním tvaru, která je určena třemi množinami: 1. První množinou je množina hráčů, jinými slovy seznam účastníků konfliktní situace: {1, 2,, N}. Pokud nebude řečeno jinak, budeme v dalším textu pro zjednodušení předpokládat, že se vždy jedná o hru dvou hráčů, které budeme označovat hráč 1 a hráč 2. 2. Druhou množinou je množina prostorů strategií: {X 1, X 2,, X N }. Zde X i označuje prostor strategií i-tého hráče. U hry dvou hráčů se vyhneme neustálému psaní indexů tak, že X bude označovat prostor strategií hráče 1 a Y bude prostor strategií hráče 2. Konkrétní strategie budeme značit x pro hráče 1 a y pro hráče 2. 3. Třetí je množina výplatních funkcí všech hráčů: {f 1 (x 1, x 2,, x N ), f 2 (x 1, x 2,, x N ),, f N (x 1, x 2,, x N )}. Výplatní funkce hráčů jsou definovány na kartézském součinu prostoru strategií, neboť musí stanovit výhru hráče pro všechny možné kombinace strategií. U hry dvou hráčů budeme označovat f 1 (x, y) výplatní funkci hráče 1 a f 2 (x, y) výplatní funkci hráče 2. Předpokládáme, že hráči jsou inteligentní, takže maximalizují hodnotu své výplatní funkce (svůj užitek) a mají dokonalé informace o hře (znají množinu hráčů, prostor strategií svůj i ostatních hráčů a výplatní funkci svoji i ostatních hráčů). Rozhodnutí provádějí hráči ve stejný okamžik, proto žádný z hráčů v době svého rozhodnutí nemůže znát rozhodnutí ostatních hráčů. V některé literatuře se místo pojmu hra v normálním tvaru používá i název hra ve strategickém tvaru. Nejprve se budeme zabývat hrami, které popisují antagonistické konflikty co jeden hráč získá, druhý ztrácí, takže spolupráce v těchto konfliktech nemá smysl. Matematickým modelem antagonistického konfliktu je hra v normálním tvaru, kterou v tomto speciálním případě označujme jako hru s konstantním součtem, ve které pro libovolné strategie x X, y Y pro výplatní funkce hráčů platí (uvažujme hru dvou hráčů):

18 Teorie her: analýza konfliktů a spolupráce f 1 (x, y) + f 2 (x, y) = K, kde K je libovolné reálné číslo. Pro libovolné K je možné hru s konstantním součtem transformovat na ekvivalentní hru s nulovým součtem (K=0). Platí totiž, že přičtením určité konstanty ke všem hodnotám výplatní funkce nedojde ke změně řešení. Ve hře s nulovým součtem o dvou hráčích pro výplatní funkce platí: f 1 (x, y) = - f 2 (x, y). Výhra druhého hráče je výhra prvého hráče s opačným znaménkem. Z tohoto důvodu hru s konstantním součtem zjednodušujeme a při analýze sledujeme pouze výhru prvého hráče f 1 (x, y). Předpokládejme, že pro oba hráče je prostor strategií konečný. První hráč má k dispozici m možných strategií a druhý hráč si může zvolit mezi n strategiemi. Počet možných kombinací strategií je tedy m x n, přičemž každé kombinaci strategií je možné přiřadit výhru f 1 (x, y). Množinu všech výher ve hře s nulovým součtem znázorníme maticí A = (a ij ), i = 1, 2,..., m; j = 1, 2,..., n. Výběr i-tého řádku matice A odpovídá výběru i-té strategie hráčem 1, výběr j-tého sloupce odpovídá výběru j-té strategie hráčem 2. Při výběru této dvojice strategií je hodnota výplatní funkce hráče 1 rovna prvku a ij, hodnota výplatní funkce hráče 2 je rovna -a ij. Tento model se nazývá maticová hra, matici A nazýváme výplatní maticí. A = a a... a 11 21 m1 a a a 12 22 m2......... a a a 1n 2n mn Jakákoliv matice může být považována za maticovou hru. Mějme například matici: 0 2 3. 1 2 2

Teorie her: analýza konfliktů a spolupráce 19 Uvedená matice představuje hru s konstantním součtem s dvěma hráči, ve které má hráč 1 k dispozici dvě strategie a hráč 2 má k dispozici tři strategie. Nyní už máme k dispozici dostatečný modelový aparát pro popis jakékoliv maticové hry. V dalším kroku chceme najít optimální chování hráčů v této hře, což pro hráče 1 znamená zvolit řádek a pro hráče 2 zvolit sloupec v matici. Jak budou hráči postupovat? Prvním možným krokem je vyřadit strategie, které nemá smysl nikdy zvolit a zmenšit tak rozměr matice. První hráč nebude volit ten řádek matice, ve kterém jsou všechny prvky menší než odpovídající prvky v jiném řádku. Druhý hráč nebude volit ten sloupec matice, ve kterém jsou všechny prvky větší (prvky značí jeho prohru) než odpovídající prvky v jiném sloupci. Jde o tzv. silnou dominovanost a platí, že hráč nikdy nezvolí silně dominovanou strategii. Pokud platí, že v jednom řádku (sloupci) jsou všechny prvky menší nebo rovny prvkům druhého řádku (sloupce) jde o slabou dominovanost. Abychom se vyhnuli určitým problémům, které jsou spojeny se slabou dominovaností (viz např. Myerson, 1991, str. 57-61), budeme využívat pouze silnou dominovanost. V naší hře oba hráči dojdou k závěru, že druhý hráč nikdy nezvolí třetí sloupec (silně dominovaná strategie), neboť tento sloupec je pro něj vždy horší než první sloupec (silně dominující/dominantní strategie). Třetí sloupec proto můžeme z matice vyškrtnout, takže matice má nyní tvar: 0 1 2 2. V takto upravené hře je druhý řádek vždy lepší než řádek první. První strategie hráče 1 je silně dominovaná a bude vyškrtnuta, protože inteligentní hráč ji nikdy nezvolí. Po tomto kroku je matice ve tvaru: 1 2. V dané situaci si hráč 2 může pouze vybrat mezi alternativou prohrát -1 nebo -2 (jiným slovy druhý sloupec je silně dominovaný). Hráč 2 vcelku logicky zvolí výhru v hodnotě -1. Tím jsme dospěli k řešení: optimální strategií hráče 1 je zvolit druhý řádek a optimální strategií hráče 2 je zvolit první

20 Teorie her: analýza konfliktů a spolupráce sloupec. Hra skončí výhrou hráče 1 v hodnotě 1. Jelikož jde o hru s nulovým součtem, výhra hráče 1 je prohrou hráče 2. V této jednoduché hře se nám podařilo najít řešení hry pomocí postupné eliminace dominovaných řádků a sloupců, byla to však spíše náhoda. Postupná eliminace dominovaných strategií může hru zjednodušit, což je sice výhodné, ale jen výjimečně se podaří najít řešení. Proto je třeba hledat jiné principy, které by zajistily řešení hry ve všech případech. 2.2 Nashova rovnováha Optimální strategie hráčů ve hře (v konfliktní situaci) najdeme pomocí tzv. Nashovy rovnováhy. Nashova rovnováha je takové řešení, ve kterém platí, že když se některý z hráčů nebude držet své optimální strategie, zatímco jeho soupeř ano, jeho výhra se sníží (v nejlepším případě zůstane stejná). Jinými slovy: ten, kdo se odchýlí od optimálních strategií, si nemůže polepšit. Nashova rovnováha nastává, pokud najdeme strategie prvého a druhého hráče xo X a yo Y pro které platí: f 1 (x, yo) f 1 (xo, yo) a f 2 (xo, y) f 2 (xo, yo). Protože je možno se u her s konstantním součtem omezit pouze na hry s nulovým součtem, označíme f 1 (x, y) = f(x, y) a tedy f 2 (x, y) = -f(x, y). Výše uvedené nerovnosti můžeme pak zapsat ve zjednodušeném tvaru: f(x, yo) f(xo, yo) f(xo, y). Tyto nerovnosti vyjadřují fakt, že když se některý z hráčů nebude držet optimální strategie, zatímco jeho soupeř ano, jeho výhra se sníží (v nejlepším případě zůstane stejná). Takto definované optimální strategie představují tzv. Nashovu rovnováhu (Nashovo rovnovážné řešení) a nazýváme je rovnovážnými strategiemi. Nashovu rovnováhu získáme nalezením sedlového prvku matice A. Sedlový prvek matice je číslo, které je největší ve svém sloupci a zároveň nejmenší ve svém řádku (cílem hráče 2 je minimalizovat výhru hráče 1, neboť výhra 2 hráče je -a ij ). Jestliže a ij je sedlový prvek, potom i-tá strategie hráče 1 a j-tá strategie hráče 2 jsou optimální (rovnovážné) strategie a hodnotu a ij nazýváme cenou hry. Takto nalezené řešení nazýváme Nashovou rovnováhou (rovnovážným řešením) v ryzích strategiích.

Teorie her: analýza konfliktů a spolupráce 21 Při hledání sedlového bodu matice (Nashovy rovnováhy) mohou nastat tyto tři případy: 1. Matice má jeden sedlový prvek (prvek představuje Nashovu rovnováhu). 2. Matice má více sedlových prvků, jejichž hodnoty jsou si rovny, potom tyto sedlové prvky určují alternativní optimální (rovnovážné) strategie. 3. Matice nemá žádný sedlový prvek, rovnovážné strategie se nám daným postupem nepodařilo najít (rovnovážné řešení sice existuje, nikoliv však v ryzích strategiích). Výše uvedené možnosti si ukážeme na příkladě 2.1. Při hledání sedlového prvku budeme postupovat tak, že kulatými závorkami označíme všechna sloupcová maxima a hranatými závorkami všechna řádková minima. Sedlový prvek bude označen kulatými i hranatými závorkami zároveň. Příklad 2.1: 6 6 [( 2) ] 6 [ 7] 6 6 ( 7) ( ) ( ) [ ] 7 7 7 6 [( 0) ] 2 [( 0) ] [( 0) ] 1 [( 0) ] [( 0) ] ( 3) ( 0) [ ] ( 0) 1 [ 2] [ ] ( ) ( ) 2 0 1 Matice má jeden sedlový prvek. Matice má šest sedlových prvků. Matice nemá žádný sedlový prvek. Pokud se nám nepodařilo najít sedlový prvek matice, má to snad znamenat, že hráči nemají žádné rovnovážné strategie? Nikoliv, znamená to pouze, že dosavadní výklad nebyl dostatečný pro nalezení rovnovážných strategií ve všech možných rozhodovacích situacích, které je možné vyjádřit jako maticovou hru. Ukážeme si to na příkladě velmi známe hry kámen, nůžky, papír. Tato hra je hrou dvou hráčů, z nichž každý má k dispozici tři možné

22 Teorie her: analýza konfliktů a spolupráce strategie. Podle pravidel kámen vyhrává nad nůžkami, nůžky nad papírem a papír nad kamenem. V případě, že oba hráči zvolí stejnou strategii, nastává remíza. V reálné situaci by hráči hru opakovali, od toho však v tomto okamžiku abstrahujeme a považujeme remízu za konečný výsledek hry. Hra kámen, nůžky, papír je hrou s konstantním (nulovým) součtem, která je charakterizována maticí: Kámen Nůžky Papír Kámen 0 +1-1 Nůžky -1 0 +1 Papír +1-1 0 Jednoduše si můžeme ověřit, že v této matici není možné najít sedlový prvek, takže ani není možné najít Nashovo rovnovážné řešení v ryzích strategiích. Přesto danou hru běžně hrajeme a známe odpovídající rovnovážnou strategii, která spočívá v náhodném výběru z prostoru strategií. Pro oba hráče je rovnovážnou strategií vektor (1/3; 1/3; 1/3), kde čísla představují pravděpodobnosti, že hráč bude volit první, druhou nebo třetí strategii. Tento typ strategií nazýváme smíšenými (pravděpodobnostními) strategiemi. Také pro tyto strategie platí, že hráč, který se od rovnovážné strategie odchýlí (zvolí jiné pravděpodobnosti), nemůže nic získat, ale naopak může ztratit. Pokud maticová hra nemá řešení v ryzích strategiích, použijeme tzv. smíšeného rozšíření maticové hry. Prostory strategií nyní budou představovat vektory pravděpodobností s jakou hráči zvolí jednotlivé strategie. Prostory strategií hráčů jsou: m T X = [ ] ; x = x1, x2,..., x m, x i = 1, x 0 i= 1 x, n T Y = ; y = [ y ] 1, y2,..., y n, y j = 1, y 0 j= 1 y. Hodnota výplatní funkce udává očekávanou střední hodnotu výhry. V případě her s konstantním součtem stačí sledovat výplatní funkci prvního hráče, která má tvar:

Teorie her: analýza konfliktů a spolupráce 23 m T f ( x, y) = xiaij y j = x Ay. i= 1 n j = 1 Ryzí strategie jsou tedy zvláštním případem (podmnožinou) smíšených strategií, kdy jedna z pravděpodobností je rovná jedné a ostatní pravděpodobnosti jsou rovny nule. Pro maticové hry platí důležitá věta, tzv. základní věta maticových her: Každá maticová hra má Nashovo rovnovážné řešení ve smíšených strategiích. Základní věta maticových her tvrdí, že pro každou matici A existují dva vektory x a y (kroužkem označujeme, že jde o rovnovážné strategie), pro které platí nerovnice: x T Ay o ot o ot x Ay x Ay. Tyto nerovnice jsou matematickou definicí Nashovy rovnováhy ve smíšených strategiích. Hráč, který zvolí jinou než Nashovu rovnovážnou strategii, si může pouze pohoršit, nebo zůstat na tom stejně, v žádném případě si nemůže polepšit. Pokud je maticová hra rozměru m x 2 nebo 2 x n je možno použít grafické metody k nalezení Nashovy rovnováhy. V obecném případě se rovnovážné smíšené strategie získají řešením úlohy lineárního programování simplexovou metodou. Postup výpočtu rovnovážných smíšených strategií si nyní blíže vysvětlíme a následně ukážeme na příkladě. Prvním krokem je ověření, zda ve výplatní matici A existují pouze kladné prvky. Pokud v matici A existují nekladné prvky, přičteme ke všem prvkům a ij konstantu c tak, aby všechny prvky matice byly kladné. Touto úpravou se rovnovážné strategie nezmění, říkáme že původní i nová hra jsou strategicky ekvivalentní hry. Cena nové hry bude rovna v + c. Díky tomuto triku lze, mimo jiné, transformovat libovolnou hru s konstantním součtem na hru s nulovým součtem. A to tak, že od všech prvků matice odečteme cenu hry (výhru prvního hráče). Druhým krokem výpočtu rovnovážných strategií je řešení jedné ze dvou následujících úloh lineárního programování ve tvaru:

24 Teorie her: analýza konfliktů a spolupráce Minimalizovat p 1 + p 2 +...+ p m za podmínek nebo a 11 p 1 + a 21 p 2 +...+ a m1 p m 1; a 1n p 1 + a 2n p 2 +...+ a mn p m 1; p i 0; i = 1, 2,..., m; Maximalizovat q 1 + q 2 +...+ q n za podmínek a 11 q 1 + a 12 q 2 +...+ a 1n q n 1; a m1 q 1 + a m2 q 2 +...+ a mn q n 1; q j 0; j = 1, 2,..., n. Protože všechny prvky a ij jsou kladné, mají obě úlohy přípustné řešení a tedy i řešení optimální. Řešením jakékoli ze dvou uvedených úloh v simplexové tabulce získáme řešení obou úloh, tj. určíme rovnovážné smíšené strategie x o, y o a z hodnoty účelové funkce určíme cenu hry v. Z hlediska výpočetního je výhodnější řešit maximalizační úlohu s proměnnými q j. Řešení v simplexové tabulce v příkladu 2.2 představuje pouze ilustraci postupu, neboť řešení je možné nalézt i bez znalosti lineárního programování, např. pomocí Řešitele v MS Excel či pomocí produktu pro matematické programování (LINDO, LINGO, Xpress). Příklad 2.2: Určete rovnovážné strategie maticové hry, která je charakterizována následující výplatní maticí: 1 0-1 -1 1 2

Teorie her: analýza konfliktů a spolupráce 25 Hra nemá řešení v ryzích strategiích, ale podle základní věty maticových her již víme, že každá maticová hra má řešení ve smíšených strategiích. Všechny prvky výplatní matice nejsou kladné, přičtením c = 2 ke každému prvku matice získáme strategicky ekvivalentní hru: 3 2 1 1 3 4 Následuje řešení v simplexové tabulce, přičemž výpočetně výhodnější je řešit úlohu pro druhého hráče s proměnnými q j. Klíčové prvky v jednotlivých krocích označují hranaté závorky. q 1 q 2 q 3 q 1 q 2 q 1 [3] 2 1 1 0 1 q 2 1 3 4 0 1 1-1 -1-1 0 0 0 q 1 1 2 / 3 1 / 3 1 / 3 0 1 / 3 q 2 0 7 / 3 [ 11 / 3 ] -1 / 3 1 2 / 3 0-1 / 3-2 / 3 1 / 3 0 1 / 3 q 1 1 5 / 11 0 4 / 11-1 / 11 q 3 0 7 / 11 1-1 / 11 3 / 11 0 1 / 11 0 Řešením úlohy je q o = ( 3 / 11 ; 0; 2 / 11 ), p o = ( 3 / 11 ; 2 / 11 ), hodnota kriteriální funkce 1 / v+c = 5 / 11, čili v+c= 11 / 5. Ze vztahů x o i=p i (v+c) a y o i=q i (v+c) dostaneme rovnovážné strategie: 3 / 11 2 / 11 3 / 11 2 / 11 5 / 11 x o = ( 3 / 5 ; 2 / 5 ), y o = ( 3 / 5 ; 0; 2 / 5 ), cena hry v = 11 / 5 2 = 1 / 5. Příklad 2.3 Určete rovnovážné (ryzí či smíšené) strategie maticové hry, která je charakterizována následující výplatní maticí: 0-1 -2-2 0 1-3 -1 0

26 Teorie her: analýza konfliktů a spolupráce

Teorie her: analýza konfliktů a spolupráce 27 3. Hry s nekonstantním součtem V praxi se často setkáváme s konflikty, kdy účastníci rozhodnutí sice sledují své zájmy, které však nejsou v přímém protikladu (jde o tzv. neantagonistické konflikty). Neplatí tedy, že výhra prvého hráče je prohrou druhého hráče a naopak. V těchto případech je třeba dále rozlišit, zda se jedná o hru nekooperativní (hráči nemohou spolupracovat) nebo o hru kooperativní (hráči mohou spolupracovat). 3.1 Nekooperativní hra Matematickým modelem konečných neantagonistických konfliktů tohoto typu pro dva hráče je dvoumaticová hra. Tato hra je určena maticemi A a B, které charakterizují výplatní funkce prvého a druhého hráče. Při výběru i-té strategie (i=1, 2,..., m) prvého hráče a j-té strategie (j=1, 2,..., n) druhého hráče je hodnota výplatní funkce prvého hráče rovna prvku a ij a hodnota výplatní funkce druhého hráče prvku b ij. Mezi hodnotami výher hráčů není na rozdíl od her s konstantním součtem přímý vztah. A = a a... a 11 21 m1 a a a 12 22 m2......... a a a 1n 2n mn B = b b... b 11 21 m1 b b b 12 22 m2......... b b b 1n 2n mn U nekooperativní teorie využijeme modifikované Nashovo rovnovážné řešení, které již známe s antagonistických konfliktů (her s konstantním součtem). Dvojici strategií xo a yo nazveme Nashovými rovnovážnými strategiemi jestliže platí: f 1 (x, yo) f 1 (xo, yo), f 2 (xo, y) f 2 (xo, yo),

28 Teorie her: analýza konfliktů a spolupráce pro všechna x X, y Y. Rovnovážné řešení v ryzích strategiích najdeme tak, že v matici A označíme všechna sloupcová maxima a v matici B všechna řádková maxima. Pokud určitá dvojice prvků dvoumatice je označena prvním i druhým hráčem, jde o rovnovážné řešení. U dvoumaticových her mohou pro Nashova rovnovážná řešení nastat následující případy: 1. Rovnovážné řešení je jediné. V tom případě dává návod k optimálnímu jednání pro oba hráče. 2. Rovnovážných řešení je více, avšak jedno z rovnovážných řešení je pro oba hráče výhodnější než ostatní rovnovážná řešení (přesněji řečeno dané rovnovážné řešení dominuje ostatní rovnovážná řešení). Hráči tedy zvolí pro oba nejvýhodnější rovnovážné řešení. 3. Rovnovážných řešení existuje ve hře více a alespoň dvě z nich jsou nedominovaná. Hráči neví, které rovnovážné řešení zvolit, neboť každý hráč preferuje jiné rovnovážné řešení. Příklad 3.1: Najděte Nashovy rovnovážné ryzí strategie u dvoumaticových her: 3 4 5 2 1) A =, B = 2 2. 7 1 Hodnoty zapíšeme do dvoumatice a označíme kulatými závorkami sloupcová maxima v matici A a hranatými závorkami řádková maxima v matici B: ( 3 ); [ 5] ( 4) ;2 2; [ 7] 2; 1 Strategie (1, 1), tj. první řádek a první sloupec, s výhrami (3; 5) jsou ryzími rovnovážnými strategiemi hráčů. 7 2 9 1 2) A =, B = 2 6 0 4

Teorie her: analýza konfliktů a spolupráce 29 ( 7) ;[ 9] 2;0 2;1 ( 6) ;[ 4] Existují dvě rovnovážná řešení v ryzích strategiích. Hráči dají přednost rovnovážnému řešení s výplatami (7; 9), které dominuje řešení s výplatami (6; 4). 3 2 9 1 3) A =, B = 2 6 0 4 ( 3) ;[ 9] 2;0 2;1 ( 6) ;[ 4] Existují dvě rovnovážná řešení v ryzích strategiích: strategie (1, 1) a strategie (2, 2). Jestliže však z nich první hráč zvolí druhý řádek (rovnovážné řešení na druhém řádku je pro něj výhodnější) a druhý hráč první sloupec (rovnovážné řešení v prvním sloupci je pro něj výhodnější), potom důsledek této volby je nepříznivý pro oba hráče, neboť vede k řešení s výplatami (-2; 0). 3 2 5 1 4) A =, B = 4 2 1 5 3; [ 5] ( 2 ); 1 ( ) [ ] 4 ;1 2; 5 Hra nemá Nashovo rovnovážné řešení v ryzích strategiích. Jestliže jsme nenalezli Nashovo rovnovážné řešení v ryzích strategiích, použijeme smíšeného rozšíření dvoumaticové hry. Platí následující věta: Každá dvoumaticová hra má alespoň jedno rovnovážné řešení.

30 Teorie her: analýza konfliktů a spolupráce Prostory strategií jsou: m T X = [ ] ; x = x1, x2,..., x m, x i = 1, x 0 i= 1 x, n T Y = ; y = [ y ] 1, y2,..., y n, y j = 1, y 0 j= 1 Výplatní funkce hráčů mají tvar: y. m f 1 ( x, y) = xiaij y j = i= 1 n j= 1 x T Ay m T f 2 ( x, y) = xibij y j = x By. i= 1 n j= 1 Hledání rovnovážných strategií v případě smíšeného rozšíření dvoumaticových her je možno formulovat jako hledání optimálního řešení u úlohy nelineárního programování ve tvaru: Maximalizovat p T (A+B)q - e T p - f T q; za podmínek Aq e; B T p f; p 0; q 0; kde A a B jsou výplatní matice hráčů o rozměrech m n (upravené tak, aby jejich prvky byly kladné), p a q jsou vektory o m a n proměnných, e a f jsou vektory složené z m a n jedniček, 0 jsou odpovídající nulové vektory. Smíšené rovnovážné strategie obdržíme po transformacích, které zajistí, že součet pravděpodobností je roven jedné: xo = po/(e T po) a yo= qo/(f T qo).

Teorie her: analýza konfliktů a spolupráce 31 Tímto postupem jsme našli jedno rovnovážné řešení, nevíme však, zda neexistují další rovnovážná řešení. Nalezení všech rovnovážných řešení je poměrné komplikovanou úlohou. Určitou jednoduchou náhradní možností je spustit řešení úlohy z různých výchozích hodnot proměnných, což většina optimalizačních programových produktů povoluje, a sledovat, zda dojde ke změně optimálního řešení. 3.2 Problémy Nashovy rovnováhy Není jistě pochyb o tom, že Nashova rovnováha představuje jeden ze základních kamenů, na níž je vystavěna teorie her. Přes svou univerzálnost nás však Nashova rovnováha může zavést k řešením, která vzbuzují určité rozpaky. Na modelových konfliktech si ukážeme dva typy problematických návodů k optimálnímu chování. Asi neznámějším modelovým konfliktem z teorie her je hra zvaná vězňovo dilema. Název této hry je odvozen od modelové situace, ve které dva vězni, kteří spáchali určitý zločin, jsou odděleně uvězněni a mají možná rozhodnutí přiznat (P) či nepřiznat (NP). Pokud se jeden z vězňů přizná a druhý nikoliv, je prvnímu vězni udělen nižší trest a druhému naopak vyšší trest. Jestliže se oba nepřiznají, nebudou plně usvědčeni, takže dostanou menší trest, než kdyby se oba přiznali a tím na sebe vzájemně připravili důkazy. Hra vězňovo dilema může být například ve tvaru: P P 3; 3 NP 4; 1 NP 1; 4 2; 2. Roky strávené ve vězení mají samozřejmě záporný užitek, proto uvádíme ve výplatní matici pouze záporná čísla. Po nalezení řádkových a sloupcových maxim zjistíme, že ve hře existuje jediná Nashova rovnováha: P NP P NP ( 3 ); [ 3] ( 1; ) 4 4; [ 1] 2; 2.

32 Teorie her: analýza konfliktů a spolupráce Hráči, kteří nemohou kooperovat, budou volit vždy strategii přiznat. Paradoxem je, že rovnovážné řešení s výplatami (-3; -3) je horší než řešení s výplatami (-2; -2). Řešení (nepřiznat, nepřiznat) však nesplňuje podmínky Nashovy rovnováhy, neboť změnou své strategie si hráč může polepšit: dosáhne snížení trestu na jeden rok, zatímco druhý hráč si odsedí čtyři roky. Nashova rovnováha nabízí řešení, které je sice rovnovážné (nikdo si individuální změnou strategie nemůže polepšit), ale nejde o paretovsky efektivní rovnováhu, protože volbou nepřiznat by všichni hráči získali, aniž by byl někdo poškozen. Stojí za povšimnutí, že řešení (přiznat, nepřiznat) a (nepřiznat, přiznat) jsou také paretovsky efektivní, takže řešení (přiznat, přiznat) je dokonce jediným, paretovsky neefektivním řešením ve hře vězňovo dilema. Hra ukazuje, že zcela racionální hráči, kteří jednají ve svém nejlepším zájmu, mohou nakonec skončit v situaci, která je pro všechny nevýhodná. V ekonomické teorii má vězňovo dilema význam například při studiu chování nevynutitelných (ze zákona obvykle zakázaných) kartelových dohod. Při uzavírání dohod je vážným problémem možnost porušování dohody, pokud jednostranné porušení může přinést výhody. Uvažujme dvě firmy, které uzavřely dohodu a mají dvě možné strategie: porušit nebo neporušit dohodu. Vězňovo dilema vede k závěru, že nezávazná dohoda, kterou je možné porušovat, přičemž jednostranné porušení může danému účastníkovi přinést výhodu, má stejný efekt jako žádná dohoda. Z tohoto důvodu by měly být tajné kartelové dohody nestabilní a dříve či později být porušeny jedním z hráčů. A to je vlastně pro spotřebitele dobrá zpráva. Na následujících modelových konfliktech si ukážeme, že v některých hrách existuje až příliš mnoho Nashových rovnováh. První konflikt je nazýván kuře (Chicken). Uvažujme dvě firmy, které těží ve stejné oblasti a obě mají v úmyslu zdvojnásobit svoji těžbu. U obou firem uvažujme dvě možná rozhodnutí: U - ustoupit od svého záměru a zůstat při dosavadním rozsahu těžby, N - neustoupit. Pokud obě firmy ustoupí od svého záměru, situace se nezmění. Pokud jedna ustoupí a druhá neustoupí, ustupující firma si zhorší svoji pozici a neustupující si zlepší svoji pozici. Pokud však žádná firma neustoupí dojde k ekologické katastrofě s obrovskými následky pro obě firmy. Tuto situaci je možno zachytit jako dvoumaticovou hru a symbolicky ohodnotit důsledky výběru rozhodnutí firem: