DOPRAVNI A POC ˇ I TACˇOVE SI TEˇ

Podobné dokumenty
NEKOOPERATIVNI HRY VYUZ ˇ ITI V ANALY ZE DOPRAVNI CH SYSTE MU

TGH13 - Teorie her I.

Teorie her a ekonomické rozhodování 5. Opakované hry

Otázky ke státní závěrečné zkoušce

Úvod do teorie her

Teorie her a ekonomické rozhodování. 3. Dvoumaticové hry (Bimaticové hry)

KOOPERATIVNI HRY DVOU HRA CˇU

Úvod do teorie her

Aplikace teorie her. V ekonomice a politice Ing. Václav Janoušek

Teorie her a ekonomické rozhodování. 9. Modely nedokonalých trhů

Úvod do teorie her ZVYŠOVÁNÍ ODBORNÝCH KOMPETENCÍ AKADEMICKÝCH PRACOVNÍKŮ OSTRAVSKÉ UNIVERZITY V OSTRAVĚ A SLEZSKÉ UNIVERZITY V OPAVĚ

5.7 Kooperativní hry Kooperativní hra 2 hráčů Kooperativní hra N hráčů 5.8 Modely oligopolu 5.9 Teorie redistribučních systémů 5.

Teorie her a ekonomické rozhodování. 2. Maticové hry

Teorie her a ekonomické rozhodování. 7. Hry s neúplnou informací

Rozhodovací procesy v ŽP HRY A SIMULAČNÍ MODELY

Mezi firmami v oligopolu dochází ke strategickým interakcím. Při zkoumání strategických interakcí používáme teorii her.

4EK201 Matematické modelování. 2. Lineární programování

4EK201 Matematické modelování. 10. Teorie rozhodování

Výběrové charakteristiky a jejich rozdělení

Operační výzkum. Teorie her. Hra v normálním tvaru. Optimální strategie. Maticové hry.

Stručný úvod do teorie her. Michal Bulant

3. ANTAGONISTICKÉ HRY

Operační výzkum. Teorie her cv. Hra v normálním tvaru. Optimální strategie. Maticové hry.

TEORIE HER Meta hry PŘEDNÁŠKA. OPTIMALIZACE A ROZHODOVÁNÍ V DOPRAVĚ část druhá Přednáška 4. Zuzana Bělinová

Zpětnovazební učení Michaela Walterová Jednoocí slepým,

Statistická teorie učení

Dva podniky vedou mezi sebou spor, k jehož vyřešení může každý z nich podniknout jednu

4EK311 Operační výzkum. 1. Úvod do operačního výzkumu

Přednáška #8. Základy mikroekonomie TEORIE HER

Modely oligopolu. I. Dokonalý trh II. Nedokonalý trh 1. Modely oligopolu. Dokonalý trh. Nedokonalý trh

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

Charakteristika oligopolu

Dvou-maticové hry a jejich aplikace

Fakt. Každou soustavu n lineárních ODR řádů n i lze eliminací převést ekvivalentně na jednu lineární ODR

Numerické metody a programování. Lekce 8

ANTAGONISTICKE HRY 172

TEORIE HER. Základní pojmy teorie her. buď racionální (usiluje o optimální výsledek hry) nebo indiferentní (výsledek hry je mu lhostejný)

České vysoké učení technické v Praze Fakulta jaderná a fyzikálně inženýrská OKRUHY. ke státním závěrečným zkouškám BAKALÁŘSKÉ STUDIUM

VĚZŇOVO DILEMA. Markéta Reichenbachová II.B. Gymnázium a Střední odborná škola Cihelní 410

MODELY OLIGOPOLU COURNOTŮV MODEL, STACKELBERGŮV MODEL

MATEMATICKÁ TEORIE ROZHODOVÁNÍ

(Ne)kooperativní hry

K vymezení hry Titanic. Jan Mertl

PŘÍKLADY DVOJMATICOVÉ HRY

Vysoká škola technická a ekonomická v Českých Budějovicích

KGG/STG Statistika pro geografy

Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma

Definice spojité náhodné veličiny zjednodušená verze

Základy teorie pravděpodobnosti

Vektorový prostor. Př.1. R 2 ; R 3 ; R n Dvě operace v R n : u + v = (u 1 + v 1,...u n + v n ), V (E 3 )...množina vektorů v E 3,

Úvod do problematiky měření

Simulace pohybu chodců pomocí celulárních modelů

TGH06 - Hledání nejkratší cesty

Teorie her a ekonomické rozhodování. Úvodní informace Obsah kursu 1. Úvod do teorie her

Usuzování za neurčitosti

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Simulační modely. Kdy použít simulaci?

Numerické metody optimalizace - úvod

Řešení. Označme po řadě F (z) Odtud plyne, že

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a statistika (BI-PST) Cvičení č. 1

Teorie her a ekonomické rozhodování 6. Kooperativní hry více hráčů

i=1 Přímka a úsečka. Body, které leží na přímce procházející body a a b můžeme zapsat pomocí parametrické rovnice

4EK212 Kvantitativní management. 2. Lineární programování

PRAVDĚPODOBNOST A STATISTIKA

SPECIFICKÝCH MIKROPROGRAMOVÝCH ARCHITEKTUR

Západočeská Univerzita v Plzni Fakulta aplikovaných Věd Katedra matematiky

Koaliční hry. Kooperativní hra dvou hráčů

Chyby měření 210DPSM

Odhad stavu matematického modelu křižovatek

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Použití derivací L HOSPITALOVO PRAVIDLO POČÍTÁNÍ LIMIT. Monotónie. Konvexita. V této části budou uvedena některá použití derivací.

Vyhněte se katastrofám pomocí výpočetní matematiky

Vlastní čísla a vlastní vektory

Teorie rozhodování (decision theory)

Lineární klasifikátory

Teorie her pro FJFI ČVUT řešené úlohy

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]

Projekty - Úvod do funkcionální analýzy

To je samozřejmě základní pojem konvergence, ale v mnoha případech je příliš obecný a nestačí na dokazování některých užitečných tvrzení.

Hry v rozvinutém tvaru a opakované hry. Hry v rozvinutém tvaru

Modely teorie grafů, min.kostra, max.tok, CPM, MPM, PERT

Zdrojem většiny příkladů je sbírka úloh 1. cvičení ( ) 2. cvičení ( )

10 Funkce více proměnných

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Matematika 5 FSV UK, ZS Miroslav Zelený

13. Lineární programování

TEORIE HER - ÚVOD PŘEDNÁŠKA. OPTIMALIZACE A ROZHODOVÁNÍ V DOPRAVĚ část druhá Přednáška 2. Zuzana Bělinová

12 HRY S NEÚPLNOU INFORMACÍ

Universita Karlova v Praze Matematicko-fyzikální fakulta RIGORÓZNÍ PRÁCE. Mgr. Martin Chvoj. Pokročilé partie teorie her a jejich aplikace

Posloupnosti a jejich konvergence

, 1. skupina (16:15-17:45) Jméno: se. Postup je třeba odůvodnit (okomentovat) nebo uvést výpočet. Výsledek bez uvedení jakéhokoliv

Matematika I A ukázkový test 1 pro 2014/2015

Vypracovat přehled paralelních kinematických struktur. Vytvořit model a provést analýzu zvolené PKS


nutně znamenat ztrátu), ve které mají oba hráči dvě možnosti kooperovat nebo zradit.

HRA V NORMA LNI M TVARU

Univerzita Karlova v Praze Matematicko-fyzikální fakulta BAKALÁŘSKÁ PRÁCE. Martin Chvoj Aplikace teorie her v ekonomii

U Úvod do modelování a simulace systémů

Transkript:

11 DOPRAVNÍ A POČÍTAČOVÉ SÍTĚ 466

ANTAGONISTICKÉ HRY spolehlivost dopravních sítí Obvyklý přístup: získání statistických dat pro jednotlivé hrany (doba přepravy, zpoždění, kapacita) studium vlivu změn chování hran na chování celé sítě Potíže: neúplné informace v případě úplných informací nemusí být jistá stabilita dat v čase 467

Michael G. H. Bell, 2000: A game theory approach to measuring the performance reliability of transport networks Model 1. hráč: uživatel dopravní sítě, který hledá cestu tak, aby minimalizoval očekávané náklady 2. hráč: démon, který ovlivňuje fungování sítě tak, aby tyto očekávané náklady maximalizoval Míra spolehlivosti dopravní sítě = náklady při rovnovážných strategiích Sít je spolehlivá, jestliže očekávané náklady na cestu jsou přijatelné i v případě, že jsou uživatelé extrémně pesimističtí o stavu sítě. 468

HRY MEZI CESTOVATELI většinou soupeření o omezený prostor na silnici M. Van Vugt, R. M. Meertens, P. Van Lange, 1995: Car Versus Public Transportation? Model Hráč 1 Hráč 2 Strategie Veřejná doprava Automobil Veřejná doprava (4, 4) ( 4, 8) Automobil (8, 4) (0, 0) 469

HRY MEZI CESTOVATELI většinou soupeření o omezený prostor na silnici M. Van Vugt, R. M. Meertens, P. Van Lange, 1995: Car Versus Public Transportation? Model Hráč 2 Strategie Veřejná doprava Automobil Veřejná doprava (4, 4) ( 4, 8) Hráč 1 Automobil (8, 4) (0, 0) 470

Vězňovo dilema: Melvin Dresher, Merrill Flood, 1950 Hráč 2 Hráč 1 Spolupráce Zrada (1, 1) Spolupráce Zrada ( 1 2, 1) ( 1, 2) ( ) 0, 1 2 471

Vězňovo dilema: Dirigent, Čajkovskij a KGB Čajkovskij Dirigent Zapírat Přiznat Zapírat ( 3, 3) ( 25, 1) Přiznat ( 1, 25) ( 10, 10) 472

Vězňovo dilema Hráč 2 Hráč 1 Spolupráce Zrada Spolupráce (odměna, odměna) (oškubání, pokušení) Zrada (pokušení, oškubání) (trest, trest) oškubání < trest < odměna < pokušení. 473

David Levinson, 2005: Micro-Foundations of Congestion and Pricing: A Game Theory Perspective Hra dvou nebo tří hráčů, kteří volí čas odjezdu zkoumání vzniku dopravního zahlcení: zvolí-li dva řidiči stejný čas, vznikne zácpa a jeden z řidičů dorazí do cíle později. Model Řidič 2 Brzy Načas Pozdě ( Brzy B+Z 2, B+Z ) 2 (B, 0) (B, P ) ( Řidič 1 Načas (0, B) P +Z 2, P +Z ) 2 (0, P ) ( Pozdě (P, B) (P, 0) P + P +Z 2, P + P +Z ) 2 Pozorování: obvykle B < Z < D 474

B = 1, Z = 2, P = 3 Brzy Řidič 2 Brzy Načas Pozdě ( 3, 3 2 2) (1, 0) (1, 3) Řidič 1 Načas (0, 1) ( 5, 5 ) (0, 3) 2 2 ( Pozdě (3, 1) (3, 0) 11, ) 11 2 2 475

B = 1, Z = 2, P = 3 Brzy Řidič 2 Brzy Načas Pozdě ( 3, 3 2 2) (1, 0) (1, 3) Řidič 1 Načas (0, 1) ( 5, 5 ) (0, 3) 2 2 ( Pozdě (3, 1) (3, 0) 11, ) 11 2 2 Příklad 1: Kuřata Pepíček Strategy Zahni Jed rovně Zahni (1, 1) (0, 2) Maruška Jed rovně (2, 0) ( 3, 3) 476

B = 3, Z = 1, P = 4 Řidič 2 Brzy Načas Pozdě Brzy (2, 2) (3, 0) (3, 4) ( Řidič 1 Načas (0, 3) 5, 5 2 2) (0, 4) ( Pozdě (4, 3) (4, 0) 13, ) 13 2 2 477

B = 3, Z = 1, P = 4 Řidič 2 Brzy Načas Pozdě Brzy (2, 2) (3, 0) (3, 4) ( Řidič 1 Načas (0, 3) 5, 5 2 2) (0, 4) ( Pozdě (4, 3) (4, 0) 13, ) 13 2 2 Poplatky za dopravní zácpu Řidič 2 Brzy Načas Pozdě Brzy (2, 2) (3, 0) (3, 4) Řidič 1 Načas (0, 3) (5, 5) (0, 4) Pozdě (4, 3) (4, 0) (9, 9) 478

P. A. Pedersen, 2003: Moral Hazard in Traffic Games Hypotéza: zvyšování bezpečnosti způsobuje zvyšování počtu agresivních řidičů Strategie: hrdlička nebo jestřáb 2 hrdličky: analogie Cournotova modelu duopolu hrdlička, jestřáb: Stackelbergův model s jestřábem jako vůdcem 2 jestřábi: oba se snaží chovat jako vůdci, výsledkem je nerovnováha 479

Jestřábi a hrdličky Strategie Jestřáb Hrdlička ( Jestřáb V C ), V C (V, 0) 2 2 Hrdlička (0, V ) ( V 2, V 2 ) 480

Rypouš sloní: V >> C 481

482

483

HRY MEZI AUTORITAMI A UŽIVATELI obvykle Stackelbergův model; autorita usiluje o optimální stav celého systému, sobecký uživatel o individuální optimum D. Reyniers, 1992: Crowding Levels and Fare Classes in Public Transport Hráči: provozovatel železnice, pasažéři Strategie: Provozovatel rozhoduje o rozdělení vlaků do tříd a určuje jízdné v jednotlivých třídách (předvídá chování pasažérů) Pasažéři se rozhodují se o tom, kterou třídu použijí 484

H. J. Van Zuylen, H. Taale, 2004: Urban Network with Ring Roads: A Two-Level, Three Player Game Hráči: Společnost zodpovědná za městské komunikace Společnost zodpovědná za obchvat Uživatelé dopravní sítě Strategie společností: nastavení světelných signálů 485

H. J. Van Zuylen, H. Taale, 2004: Urban Network with Ring Roads: A Two-Level, Three Player Game Hráči: Společnost zodpovědná za městské komunikace cíl: minimalizovat celkovou dobu přepravy na městských komunikacích Společnost zodpovědná za obchvat cíl: maximalizovat rychlost na obchvatu Uživatelé dopravní sítě cíl: minimalizovat dobu vlastní přepravy Strategie společností: nastavení světelných signálů 486

Y. Hollander, J. N. Prashker, D. Mahalel, 2006: Determining the Desired Amount of Parking Using Game Theory Stackelbergův model: Vedení města cíl: zachovat přívětivé městské centrum rozvojem MHD a minimalizací IAD strategie: redukce parkovacích míst v centru města Uživatelé dopravní sítě cíl: maximalizovat užitek strategie: volba druhu dopravy do centra, případně volba jiné destinace MANAGEMENT DOPRAVNÍCH SÍTÍ Tim Roughgarden, 2002: Selfish Routing kvantifikace zhoršení chování dopravní sítě způsobeného sobeckým nekoordinovaným chováním uživatelů horní odhad poměru celkových nákladů při nekoordinovaném chování a celkových nákladů při společensky optimálním chování 487

návrh a rozbor algoritmů pro budování a řízení sítí vedoucích ke společensky žádoucímu výsledku 488

MOTIVACE Pigou, 1920 s... satelitní město v... vlakové nádraží x... část celkové přepravy probíhající po dané hraně l(x)... doba přepravy po dané hraně 489

Rovnovážné strategie: 490

Rovnovážné strategie: 491

Rovnovážné strategie: Společenské optimum: x 2 2 + (1 x 2 ) = (x 2 1 2 )2 + 3 4 min 492

Rovnovážné strategie: Společenské optimum: x 2 2 + (1 x 2 ) = (x 2 1 2 )2 + 3 4 min 493

Rovnovážné strategie: Společenské optimum: Ponaučení: sobecké chování nezávislých nespolupracujících jedinců nevede nutně ke společensky optimálnímu výsledku. 494

Rovnovážné strategie: Společenské optimum: Ponaučení: sobecké chování nezávislých nespolupracujících jedinců nevede nutně ke společensky optimálnímu výsledku. Kolikrát horší je tento výsledek? 495

Rovnovážné strategie: Společenské optimum: Ponaučení: sobecké chování nezávislých nespolupracujících jedinců nevede nutně ke společensky optimálnímu výsledku. Kolikrát horší je tento výsledek? Jak nespravedlivé je společenské optimum? 496

497

Společenské optimum: x 2 2 + 2(1 ε)(1 x 2 ) min 498

Braess, 1968 499

Braess, 1968 Společenské optimum: x 2 1 + 1 x 1 + (1 x 1 ) 1 + (1 x 2 ) 2 min 500

Braess, 1968 Společenské optimum: x 2 1 + 1 x 1 + (1 x 1 ) 1 + (1 x 2 ) 2 min x 1 = 1/2 501

Braess, 1968 502

Braess, 1968 503

Braess, 1968 504

Braess, 1968 505

Braess, 1968 506

Braess, 1968 Intuitivně užitečné (nebo aspoň nevinné) jednání přidání rychlé hrany může mít negativní vliv na celou dopravu 507

Jak se vypořádat se sobectvím? 508

Jak se vypořádat se sobectvím? vhodný design sítě poplatky Stackelbergovské směrování 509

Jak se vypořádat se sobci? vhodný design sítě Víme-li, že sít budou užívat sobeční uživatelé, jak ji navrhnout, abychom minimalizovali rozdíl mezi rovnovážným stavem a stavem optimálním? Které hrany odstranit? Potíže: ne vždy je možné dosáhnout optima; výpočtová složitost pro rozsáhlejší sítě s nelineárními latencemi poplatky Stackelbergovské směrování 510

Jak se vypořádat se sobci? vhodný design sítě Víme-li, že sít budou užívat sobeční uživatelé, jak ji navrhnout, abychom minimalizovali rozdíl mezi rovnovážným stavem a stavem optimálním? Které hrany odstranit? Potíže: ne vždy je možné dosáhnout optima; výpočtová složitost pro rozsáhlejší sítě s nelineárními latencemi poplatky Stackelbergovské směrování Část dopravy řízená centrálně, část sobečtí jedinci Jak má být centrálně řízená doprava směrována, aby indukovala dobré chování nekooperativních uživatelů, tj. aby jejich sobecká reakce minimalizovala celkovou latenci? 511

MODEL G = (V, E).... orientovaná sít V.... množina vrcholů E.... množina hran s, t V.... vstup, výstup P.... množina cest z s do t f : P R +.... tok; f e := P :e P f P r.... objem dopravy z s do t přípustný tok: P P f P = r l e ( ) : f e R + 0.... funkce latence přiřazená hraně e nezáporná, spojitá, nerostoucí funkce latence cesty P: l P (f) = e P l e(f e ) (G, r, l).... situace Náklady toku f : C(f) = P P l P (f)f P Optimální tok: přípustný tok minimalizující C(f) 512

Rovnovážný tok (J. Nash, 1950): Tok f přípustný pro (G, r, l) se nazývá rovnovážným, jestliže pro každé P 1, P 2 P, kde f P1 > 0, a každé δ (0, f P1 platí: l P1 (f) l P2 ( f), kde f P δ pro P = P 1, f = f P + δ pro P = P 2, f P pro P {P 1, P 2 }. 513

Rovnovážný tok (J. Nash, 1950): Tok f přípustný pro (G, r, l) se nazývá rovnovážným, jestliže pro každé P 1, P 2 P, kde f P1 > 0, a každé δ (0, f P1 platí: l P1 (f) l P2 ( f), kde f P δ pro P = P 1, f = f P + δ pro P = P 2, f P pro P {P 1, P 2 }. Tvrzení (J. G. Wardrop, 1952): Tok f přípustný pro (G, r, l) je rovnovážný, jestliže pro každé P 1, P 2 P, kde f P1 > 0, platí: l P1 (f) l P2 (f) tj. všechny cesty s nenulovou latencí mají stejnou latenci l P R [plyne ze spojitosti a monotonie latence] 514

Charakterizace optimálního toku Předpoklad: x l e (x) je konvexní pro každou hranu e E C(f) = P P l P (f)f P = e E l e (f e )f e Mezní náklady: Tvrzení: ˆle (x) := d dx (x l e(x)) = l e (x) + x l e(x) Tok ˆf přípustný pro (G, r, l) je optimální tok ˆf je rovnovážný pro (G, r, ˆl) [pro každé P 1, P 2 P, kde f P1 > 0, platí: ˆl P1 (f) ˆl P2 (f)] 515

Existence a jednoznačnost rovnovážného toku: Tvrzení: Pro každou situaci (G, r, l) se spojitými nerostoucími funkcemi latence existuje rovnovážný tok. Jsou-li navíc f, f dva rovnovážné toky, pak pro každou hranu e E platí: l e (f e ) = l e ( f e ). 516

JAK ŠPATNÉ JE SOBECKÉ SMĚROVÁNÍ? Cena anarchie = C(rovnovážný tok) C(optimální tok) Horní odhad: Například pro polynomiální funkce latence stupně nejvýše p s nezápornými koeficienty: CA = 1 1 p (p + 1) p+1 p [p = 1... CA = 4/3] 517

JAK NESPRAVEDLIVÉ JE OPTIMÁLNÍ SMĚROVÁNÍ? Nespravedlnost situace (G, r, l) : u(g, r, l) = max P P { lp při optimálním toku l P R při rovnovážném toku } Tvrzení: Je-li pro každou hranu e E funkce x l(x) konvexní, pak ˆl(x) u(g, r, l) sup x>0 l(x). Odhad: Pro situace (G, r, l), kde jsou funkce latence polynomy stupně nejvýše p s nezápornými koeficienty, je u(g, r, l) p + 1. 518

MEZE: Základní předpoklady při aplikaci teorie kooperativních a nekooperativních her: neomezená racionalita úplná informace 519

MEZE: Základní předpoklady při aplikaci teorie kooperativních a nekooperativních her: neomezená racionalita složité dopravní nebo počítačové sítě: omezené výpočetní možnosti úplná informace 520

MEZE: Základní předpoklady při aplikaci teorie kooperativních a nekooperativních her: neomezená racionalita složité dopravní nebo počítačové sítě: omezené výpočetní možnosti úplná informace není vždy k dispozici úplná informace o povaze ostatních hráčů, o jejich možných strategiích a preferencích 521

MEZE: Základní předpoklady při aplikaci teorie kooperativních a nekooperativních her: neomezená racionalita složité dopravní nebo počítačové sítě: omezené výpočetní možnosti úplná informace není vždy k dispozici úplná informace o povaze ostatních hráčů, o jejich možných strategiích a preferencích hráči se učí volit optimální strategie v opakovaných hrách 522

MEZE: Základní předpoklady při aplikaci teorie kooperativních a nekooperativních her: neomezená racionalita složité dopravní nebo počítačové sítě: omezené výpočetní možnosti úplná informace není vždy k dispozici úplná informace o povaze ostatních hráčů, o jejich možných strategiích a preferencích hráči se učí volit optimální strategie v opakovaných hrách EVOLUČNÍ TEORIE HER 523

Evolučně stabilní strategie Evolučně stabilní strategie = strategie, kterou je-li přijata všemi členy populace nemůže překonat žádná jiná v tom smyslu, že mutant, který by ji používal, by byl méně úspěšný v reprodukci. Speciální případ: populace s nekonečně mnoha členy, kteří se množí asexuálně a navzájem se střetávají vždy po dvojicích (tyto konflikty můžeme modelovat pomocí hry dvou hráčů v normálním tvaru s výplatními funkcemi u 1, u 2 ) strategie I je evolučně stabilní, jestliže pro každou strategii J I platí: u 1 (I, I) > u 1 (J, I) nebo u 1 (I, I) = u 1 (J, I) a zároveň u 1 (I, J) > u 1 (J, J) I evolučně stabilní strategie (I, I) rovnovážný bod 524

x(0)... počáteční vektor populace A... matice hry x i... část hráčů používajících strategii i (Ax T ) i... očekávaná výplata agenta hrajícího strategii i proti oponentovi náhodně vybranému z populace x xax T... průměrná výplata v populaci λ(x)... funkce nabývající kladných hodnot Začátek: Každému hráči je přiřazena ryzí strategie V každém časovém okamžiku hráč hraje proti náhodně vybranému oponentovi, pozoruje svou a oponentovu výplatu, načež mění svou strategii s pravděpodobností úměrnou rozdílu výplat: tj. ẋ i x i = λ(x) ((Ax T ) i xax T ), ẋ i = λ(x) x i ((Ax T ) i xax T ), λ(x) = 1... replikátorová dynamika 525

Simon Fischer, Berthold Vöcking, 2005: On the Evolution of Selfish Routing Početná populace agentů v síti, každý agent volí jednu z možných cest. Dynamika sobeckého směrování ẋ p = λ(x) x p (l(x) l p (x)), 526

Simon Fischer, Berthold Vöcking, 2005: On the Evolution of Selfish Routing Početná populace agentů v síti, každý agent volí jednu z možných cest. Dynamika sobeckého směrování ẋ p = λ(x) x p (l(x) l p (x)), Stabilita Strategie x se nazývá evolučně stabilní, je-li rovnovážná a pro každou nejlepší odpověd y na x platí: x l(y) = y l(y). 527

Simon Fischer, Berthold Vöcking, 2005: On the Evolution of Selfish Routing Početná populace agentů v síti, každý agent volí jednu z možných cest. Dynamika sobeckého směrování ẋ p = λ(x) x p (l(x) l p (x)), Stabilita Strategie x se nazývá evolučně stabilní, je-li rovnovážná a pro každou nejlepší odpověd y na x platí: x l(y) = y l(y). Rychlost konvergence Jak rychle systém dosáhne rovnovážného stavu nebo stavu blízkého 528

Ana L. C. Bazzan, 2005: A Distributed Approach for Coordination of Traffic Signal Agents Potřeba funkční a prostorové decentralizace řízení městské dopravy omezení reálným časem, komunikačními možnostmi, nedokonalou interoperativností HW 529

Ana L. C. Bazzan, 2005: A Distributed Approach for Coordination of Traffic Signal Agents Potřeba funkční a prostorové decentralizace řízení městské dopravy omezení reálným časem, komunikačními možnostmi, nedokonalou interoperativností HW Model: Křižovatky na dopravních tepnách = agenti, kteří se účastní dynamického procesu, kde jsou v úvahu brány nejen sobecké lokální, ale i globální cíle 530

Ana L. C. Bazzan, 2005: A Distributed Approach for Coordination of Traffic Signal Agents Potřeba funkční a prostorové decentralizace řízení městské dopravy omezení reálným časem, komunikačními možnostmi, nedokonalou interoperativností HW Model: Křižovatky na dopravních tepnách = agenti, kteří se účastní dynamického procesu, kde jsou v úvahu brány nejen sobecké lokální, ale i globální cíle Agent při plnění úkolů jedná nezávisle, shromažd uje a zpracovává data, plánuje, uskutečňuje plány,... 531

Ana L. C. Bazzan, 2005: A Distributed Approach for Coordination of Traffic Signal Agents Potřeba funkční a prostorové decentralizace řízení městské dopravy omezení reálným časem, komunikačními možnostmi, nedokonalou interoperativností HW Model: Křižovatky na dopravních tepnách = agenti, kteří se účastní dynamického procesu, kde jsou v úvahu brány nejen sobecké lokální, ale i globální cíle Agent při plnění úkolů jedná nezávisle, shromažd uje a zpracovává data, plánuje, uskutečňuje plány,... Každý agent má informace pouze o místní dopravní situaci (detektory) Omezená komunikace 532

Ana L. C. Bazzan, 2005: A Distributed Approach for Coordination of Traffic Signal Agents Potřeba funkční a prostorové decentralizace řízení městské dopravy omezení reálným časem, komunikačními možnostmi, nedokonalou interoperativností HW Model: Křižovatky na dopravních tepnách = agenti, kteří se účastní dynamického procesu, kde jsou v úvahu brány nejen sobecké lokální, ale i globální cíle Agent při plnění úkolů jedná nezávisle, shromažd uje a zpracovává data, plánuje, uskutečňuje plány,... Každý agent má informace pouze o místní dopravní situaci (detektory) Omezená komunikace I bez centrální autority může systém dospět ke koordinaci i když to bude trvat určitý čas 533

MODEL: Každý agent i Q = {1, 2,..., n} hraje hru G dvou hráčů proti každému agentu-sousedstvi j N i ; hráč n je příroda Množina strategií agenta i : A i = {a i,1, a i,2,..., a i,n } Výplatní funkce: u i : A 1 A n R Smíšená strategie: p i = (p i,1,..., p i,k,..., p i,m ), p i,k 0, p i,1 + + p i,m = 1 S i množina všech smíšených strategií agenta i S = S 1 S n Začátek: příroda (dopravní tok) určí výplatní funkce všech agentů V čase t agent i zvolí strategii a obdrží výplatu = součet výplat získaných v hrách s každým ze sousedů v následujícím období aktualizuje strategii v závislosti na výplatě 534

Období změny stavu Lokální změna v čase t = ρ na křižovatce i = agent i aktualizuje smíšenou strategii p i v závislosti na toku vozidel q i,k měřeném na každém z detektorů k : p i,t = (p i,1,t,..., p i,m,t ) = [ ] qi,1,t q i,m,t k q,..., i,k,t k q i,k,t 535

Období výplat Globální změna = změna výplatních funkcí a 1 > b 1, c b 1 > c, b 2 > a 2, c a 2 > c, Rovnovážné body: (s 1, s 1 ), (s 2, s 2 ), (p 1, p 1 ), (p 2, p 2 ) ( p 1 = b 1 a 1 +b 1, ) a 1 a 1 +b 1, p 2 = ( ) b 2 a a 2 +b 2, 2 a 2 +b 2 536

Období učení V těchto obdobích mají agenti čas na učení, jak měnit strategie, aby se zkoordinovali a směřovali ke globálnímu cíli (období nastávají náhodně s četností určenou pro daný model) Aktualizace smíšených strategií: ( ) πi,1, π p i = i,m, k π,..., i,k, k π, i,k, 1 k m, a i,k A i π i,k,t = λ π i,k,t + (1 λ) π i,k, λ pamět ový faktor, 0 < λ < 1 poslední období změny stavu před 0... t = ρ < 0 interval učení... = (δ, 0) výplata získaná jednáním a i,k před t... πi,k,t průměrná výplata získaná jednáním a i,k během... π i,k, 537

Simulace 538

Agent 15 s P W s P E s P W (2, 2) (0, 0) Agent 14 s P E (0, 0) (1, 1) Agent 15 s P W s P E s P W (1, 1) (0, 0) Agent 14 s P E (0, 0) (2, 2) 539

Experiment A Výplatní funkce odrážejí globální cíle sledování závislosti na četnosti intervalů učení stacionární stav dosažen ve většině simulovaných situací, uspokojivý čas Experiment B Výplatní funkce odrážejí jen lokální cíle čas potřebný k dosažení stejných výsledků je delší než v A Experiment C Komunikace a přenos informací mezi sousedy Čas potřebný k dosažení koordinace je delší než bez komunikace 540

Srovnání s centrálním řízením dopravy centrální řízení vede k lepším výsledkům v případech, kdy tok vozidel je v jednom směru výrazně vyšší než v druhém 541

Srovnání s centrálním řízením dopravy centrální řízení vede k lepším výsledkům v případech, kdy tok vozidel je v jednom směru výrazně vyšší než v druhém jinak vítězí navržený decentralizovaný systém 542