|
|
- Vladimír Malý
- před 8 lety
- Počet zobrazení:
Transkript
1 Umělá inteligence II Roman Barták, KTIML Úvodem Pokud agent ví, kde je (plně pozorovatelný svět), potom pro každý stav umíme doporučit akci maximalizující očekávaný užitek (strategie) g a to i v případě, p že výsledek akce je nejistý. U(s) = R(s) + γ max a A(s) Σ s P(s s,a) U(s ) A co když nevíme, kde agent je? částečně pozorovatelný Markovský rozhodovací problém (POMDP) Acokdyžjeagentů více? teorie her (hledání strategie pro agenta) tvorba pravidel (hledání pravidel hry pro maximalizaci globálního užitku)
2 POMDP Pro rozhodování o další akci máme k dispozici: přechodový model P(s s s,a) ocenění stavů R(s) senzorický model P(e s) Hovoříme o částečně pozorovatelném Markovském rozhodovacím problému (POMDP). Pokud agent neví, kde je (částečně pozorovatelný svět), potom nemůže provést akci π(s) doporučenou pro stav s. Jak modelovat neznámý stav? domnělý (belief) stav pravděpodobnostní rozložení přes všechny stavy vektor pravděpodobností každého stavu b(s) = pravděpodobnost přiřazená stavu s v domnělém stavu b Nyní budeme hledat strategii pro domnělé stavy π(b). ( ) Řešení POMDP Jak zjistíme další domnělý stav na základě současného domnělého stavu a akce? b (s ) = α P(e s ) Σ s P(s s,a) b(s) b = FORWARD(b,a,e) Je to vlastně filtrace na základě předchozích pozorování a provedených akcí, kterou umíme dělat inkrementálně. Optimální akce záleží pouze na aktuálním domnělém stavu, optimální strategii tedy můžeme definovat pro domnělé stavy π*(b). POMDP agent opakuje v cyklu následující kroky: 1. vybere akci na základě současného domnělého stavu a=π*(b) π 2. získá pozorování (vjem) e okolí 3. vypočte nový domnělý stav b = FORWARD(b,a,e)
3 Od POMDP k MDP Následující domnělý stav b záleží deterministicky na aktuálním domnělém stavu b, pozorování e a akci a. b = FORWARD(b,a,e), Jak odhadnout následující domnělý stav, když ještě nemáme k dispozici pozorování? P(e a,b) = Σ s P(e a,b,s ) P(s a,b) = Σ s P(e s ) P(s a,b) = Σ s P(e s ) Σ s P(s a,s) b(s) Jaká je teď pravděpodobnost dosažení b z b akcí a? P(b b,a) = P(b a,b) = Σ e P(b a,b,e) P(e a,b) = Σ e P(b a,b,e) Σ s P(e s ) Σ s P(s a,s) b(s) kde P(b a,b,e), = 1, pokud b = FORWARD(b,a,e),, jinak 0 Ještě zbývá ocenění domnělého stavu r(b) = Σ s b(s)r(s) Dohromady tedy máme MDP! Hledání optimální strategie pro stavy v POMDP lze převést na hledání optimální strategie v MDP pro prostor domnělých stavů. Pozor, odpovídající MDP pracuje s mnoho-dimenzionálním spojitým prostorem! Hledání strategie Bohužel prezentované techniky řešení MDP nemůžeme přímo použít, protože domnělých stavů je nekonečně mnoho. Místo strategie budeme pracovat s podmíněným plánem. akce je vybrána na základě pozorování a předchozích domnělých stavů (strom akcí) Iteraci hodnot lze uzpůsobit pro podmíněné plány (postupně přidáváme další akce do plánu), ale to je příliš neefektivní. Použijeme dynamické rozhodovací sítě a techniku pohledu dopředu. dynamická Bayesovská síť pro přechodový a senzorický model uzly pro ocenění ě a užitek uzly se známými hodnotami uzel užitku,který reprezentuje budoucí ocenění ocenění stavu
4 Pohled dopředu dynamická rozhodovací síť Při hledání podmíněného plánu dané délky postupujeme stejně jako při hraní her. roli oponenta hrají pozorování trojúhelníky reprezentují domnělé stavy a vedou z nich ihhrany pro možné žéakce domnělý stav získáme z cesty, která k němu vede (na ní známe pozorování) kolečka reprezentují možné pozorování a z nich vzniklé domnělé stavy nepotřebujeme speciální uzly pro různé efekty akcí, protože změna domnělého stavu je deterministická i ti Pro hledání řešení můžeme použít podobný postup jako algoritmus MINIMAX (po cestě ještě přidáváme ocenění domnělých stavů). Hloubku stromu (rozvinutí sítě) určuje faktor slevy γ. Rozhodování s více agenty Uvažujme nyní, že rozhodování je ovlivněno jiným typem neurčitosti jinými agenty, jejichž chování je zpětně ovlivněno našimi rozhodnutími. tvorba agentů (agent design) teorie her umožňuje analyzovat rozhodnutí agentů a počítat očekávané užitky tvorba pravidel (mechanism design) inverzní teorie her umožňuje nastavit pravidla hry tak, aby celkový užitek byl maximalizován, když každý agent maximalizuje svůj užitek
5 Hry s jedním tahem Podíváme se jen na hry, kde všichni hráči (agenti) najednou zvolí svůj tah h( (akci) přesněji hráči volí tah bez znalosti tahů ostatních hráčů Hra s jedním tahem je definována hráči, například O (odd) a E (even) akcemi (tahy), například jeden prst a dva prsty funkcí odměny (payoff) určující pro každou kombinaci akcí hráčů odměnu každého hráče například hra Morra se dvěma prsty (hráči O a E každý ukážou jeden nebo dva prsty a pokud je celkový počet prstů f lichý, získá O od E f dolarů, jinak získá E od O f dolarů) O: jeden O: dva E: jeden E=+2, O=-2 E=-3, O=+3 E: dva E=-3, O=+3 E=+4, O=-4 Hry s jedním tahem strategie a řešení Hráči hryvolístrategii strategii, jaké tahy budou volit. čistá strategie deterministická strategie, která doporučuje konkrétní akci smíšená strategie randomizovaná strategie, která určuje pravděpodobnost volby akce [p,a; (1-p),b] Výstup hry je numerická odměna každého hráče. Řešení hry je přiřazení racionální strategie každému hráči. Otázkou je, co přesně znamená racionální strategie.
6 Uvažujme následující hru Vězňovo dilema Dva zloději Alice a Bob byli chyceni při činu ua nyní jsou odděleně vyslýcháni. Oba dostali nabídku dosvědčit, že partner je šéf bandy výměnou za propuštění (partner dostane 10 let). Pokud budou proti sobě svědčit navzájem, dostanou po 5l letech. Pokud odmítnou svědčit, dostanou po 1 roku. Jak se mají rozhodnout? racionální volba je svědčit. Alice: svědčit Alice: odmítnout Bob: svědčit A=-5, B=-5 A=-10, B=0 Bob: odmítnout A=0, B=-10 A=-1, B=-1 Dominance Rozhodnutí svědčit u vězňova ě ň dilematu je dominantní strategií. strategie s hráče p silně dominuje strategii s pokud je výstup hry pro s pro hráče p vždy lepší než pro s při použití libovolné l strategie t ostatních hráčů slabá dominance znamená, že s není nikdy horší než s Racionální volbou je přirozeně ě volit dominantní strategii. t Pokud oba hráči volí dominantní strategii je kombinace těchto strategií rovnováhou (equilibrium) dominantních strategií. Rovnováha je obecně přidělení strategií, kdy žádný hráč nic nezíská, pokud strategii změní Nash equilibrium. Výstup hry je Pareto optimální, pokud není žádný jiný výstup lepší pro všechny hráče. Výstup A je Pareto dominován jiným výstupem B, pokud všichni háči hráči preferují B před ř da. Dilema u vězňů je v tom, že výstup v rovnovážném stavu (svědčit,svědčit) )je Pareto dominován výstupem (odmítnout,odmítnout).
7 Ne-dominantní strategie Uvažujme nyní další hru. Firma Acme plánuje výrobu herní konzole a rozhoduje se mezi použitím DVD a Blu-ray. Firma Best připravuje novou hru a také se rozhoduje mezi distribucí na DVD a Blu-ray. Přirozeně, pokud se firmy shodnou, potom z toho budou obě profitovat. Acme: bluray Acme: dvd Best: bluray A=+9, B=+9 A=-4, B=-1 Best: dvd A=-3, B=-1 A=+5, B=+5 Neexistuje rovnováha dominantních strategií (nejsou dominantní strategie), ale jsou tady dvě Nashova equilibria. Je zde více přijatelných řešení, ale pokud si každá firma vybere jiné, potom na to obě doplatí. Jak na to? obě firmy zvolí řešení odpovídající Pareto optimálnímu výstupu (bluray, bluray) A co když je více takových řešení? agenti mezi sebou komunikují k koordinační hry Smíšené strategie Vraťme se nyní ke hře Morra se dvěma prsty. zde neexistuje čistá strategie pokud je počet prstů sudý, chce O změnit strategii pokud je počet prstů lichý, chce E změnit strategii je potřeba hledat smíšenou strategii von Neumann navrhl metodu maximin pro hledání optimální smíšené strategie pro hry dvou hráčů s nulovým součtem protože odměny hráčů se doplňují, j, stačí se dívat na odměnu jednoho hráče
8 Maximin metoda čisté strategie Zkusme změnit pravidla následujícím způsobem nejprve volí E a potom O (se znalostí volby E) klasický algoritmus minimax pro hledání optimální strategie O je samozřejmě ve výhodě, takže tak dostaneme dolní odhad odměny pro E (-3) podobně můžeme nechat volit O a potom E získáme horní odhad odměny pro E (2) Maximin metoda smíšené strategie Nás ale zajímají smíšené strategie [p,jeden; (1-p),dva] Pokud první hráč zvolí smíšenou strategii a druhý ji zná, může použít čistou strategii dle p. levý obrázek nám dá p do strategie E - - maximalizujeme odměnu pro E (p=7/12 a odměna bude -1/12) pravý obrázek nám dá q do strategie O minimalizujeme odměnu E (q=7/12 a odměna bude -1/12) Optimální strategie pro oba hráče je [7/12,jeden; 5/12,dva] maximin rovnováha (je to také Nash equilibrium) je zřejmé, že hra je výhodnější pro O
9 Tvorba pravidel Zatím jsme se zabývali hledáním racionální strategie pro danou hru. Zkusme to naopak hledat pravidla hry taková, že pokud hru hrají racionální agenti, tak výsledkem je maximalizace celkové míry užitku. Tvorba pravidel (mechanism design) nebo také inverzní teorie her. Používá se v ekonomice nebo politických vědách, obecně pro synchronizaci nezávislých racionálně uvažujících agentů. Problém se skládá z: jazyka popisujícího možné strategie agentů jednoho zvoleného agenta ústředí který od agentů shromažďuje volby dle jejich j strategií pravidlo (známé všem agentům), podle kterého ústředí určí odměnu všem agentům dle jejich voleb Aukce Aukce je mechanismus pro prodání zboží skupině agentů - dražitelů. Budeme uvažovat aukce jednoho prvku (zboží). Agent má typicky y vlastní soukromé ocenění v i nabízeného zboží. starý rozbitý nábytek má jinou hodnotu pro sběratele a jinou pro člověka, který si chce vybavit byt Někdy je hodnota zboží společná, ale různí agenti mají různé informace o tom, kolik skutečná hodnota je. Princip aukce při aukci má každý dražitel v jistém okamžiku možnost dát nabídku b i zboží získá nejvyšší nabídka, ale cenu, kterou bude platit, nemusí být b max (záleží na pravidlech aukce)
10 Anglická aukce Asi nejznámější typ aukce, také aukce s rostoucí nabídkou. Postup anglické aukce Ústřední agent začne s minimální nabídkou b min Pokud je nějaký dražitel ochoten tuto cenu zaplatit, nabídne ústřední agent cenu b min +dpronějaké navýšení d. Aukce končí ve chvíli, kdy žádný dražitel není ochotný nabídnout více. Zboží získává agent s poslední nabídkou a platí tuto nabídku. Jak víme, že to funguje? snahou je prodat zboží za největší cenu a zároveň maximalizovat globální užitek aukce je efektivní pokud zboží získá agent, který si ho nejvíce cení Anglická aukce je zpravidla efektivní a maximalizující příjem, za předpokladu, že je dostatek dražitelů mezi dražiteli není tajná dohoda d ať ť už přímá nebo prostřednictvím pravidel aukce Anglická aukce Hlavním nebezpečím anglické aukce je dohoda dražitelů na manipulaci s cenami. problém Příklad manipulace cen prostřednictvím mechanismu aukce v roce 1999 v Německu dražili 10 bloků frekvencí pro mobilní telefony pravidlem bylo, že další nabídka musí navýšit předchozí nabídku oalespoň 10% za blok aukce se účastnili pouze dva dražitelé, Mannesman a T-Mobile Mannesman dal první nabídku na bloky miliónu DEM a na bloky ,18 miliónu DEM. T-Mobile interpretoval tuto nabídku tak, že Mannesman nabízí podělení se o frekvence, kdy každý dostane půlku frekvencí za 20 miliónů DEM Jak to poznali? Navýšení 18,18 miliónu o 10% dá částku 19,99 miliónu!
11 Odhalení pravdy Prodávající i celkový užitek zpravidla profituje z většího množství dražitelů. Jednou z cest, jak přilákat dražitele, je zjednodušit pravidla aukce. Přesněji řečeno umožnit dražitelům mít dominantní strategii, tj. strategii fungující nezávisle na strategiích ostatních agentů. agent nemusí ztrácet část průzkumem strategií ostatních agentů Taková strategie obvykle zahrnuje odhalení vlastního ocenění zboží v i odhalení pravdy. Anglická akce má řadu žádoucích vlastností: dominantní strategie spočívá v účasti na aukci, dokud je nabízená cena menší než v i není to ale úplné odhalení pravdy, protože u vítězného agenta známe pouze dolní odhad jeho v i Obálková metoda Další nevýhody anglické aukce je-li jeden silný dražitel, o kterém ostatní očekávají, že může nabídnout největší cenu, tak se ostatní aukce nezúčastní a silný dražitel získá zboží za nejmenší nabídkou cenu (odrazení od soutěže) agenti se musí sejít na jednom místě avěnovat celé aukci čas (cena komunikace) Alternativním řešením je aukce se zalepenou nabídkou. každý agent pošle svoji jedinou nabídku do ústředí vyhraje nejvyšší nabídka Zde není jednoduchá dominantní strategie nabídka agenta se odvozuje od očekávaných nabídek ostatních agentů nechť v i je můj užitek ze získání zboží a b 0 je očekávané maximum nabídek ostatních t agentů moje nabídka bude b 0 +ε (pro malé ε), pokud je to méně než v i Agent s největším v i nemusí nutně vyhrát, tj. je omezena výhoda nejsilnějšího hráče (větší soutěživost).
12 Vickreyho aukce Jednoduchou změnou lze obálkovou metodu pro dražitele zjednodušit, aby dominantní strategií bylo nabízet vlastní hodnotu zboží v i. Vickreyho aukce (aukce se zalepenou obálkou a druhou cenou) vítěz aukce dle nejvyšší nabídky platí cenu druhé nejvyšší nabídky Rozbor dominantní strategie užitek (zisk) agenta i při nabídce b i, hodnotě v i a nejlepší nabídce ostatních agentů b 0 (v i b 0 ) pro b i >b 0, jinak 0 když (v i b 0 ) > 0, tak každá nabídka, která vyhraje aukci, je optimální, speciálně pak v i když (v i b 0 ) < 0, tak každá nabídka, která prohraje aukci, je optimální, speciálně pak v i v i je optimální pro oba případy a je to jediná nabídka, která má tuto vlastnost t Uvažujme hru, kde agenti soupeří o část společného zboží. Příklad (redukce znečištění) Každý stát má volbu Společné zboží může redukovat znečištění za cenu -10 bodů, které je na to potřeba vynaložit znečištění redukovat nebude za cenu -5 bodů, které je potřeba vynaložit na zdravotní náklady a cenu -1, kterou přispěje všem ostatním státům Jaká je volba jednotlivých států? přirozeně pokračovat ve znečišťování (racionální rozhodnutí) Výsledek při 100 státech získá každá země užitek -104 Pokud by všichni přestali znečišťovat, byl by užitek každé země -10. Tragédie společného Pokud nikdo nemusí platit za používání společného zdroje, potom se ho snaží co nejvíce využít, což přináší menší celkový užitek všem. Podobné vězňově dilematu existuje lepší řešení pro všechny, ale není způsob, jak se k němu může racionální agent dobrat. Jak to řešit? zavedení daně za využívání společných zdrojů (emisní povolenky)
13 VCG aukce Tragédii společného lze řešit změnou pravidel, aby byl celkový užitek v zájmu rozhodnutí jednotlivých agentů. Příklad Uvažujme, že město chce dát do svých obvodů bezdrátový internet, ale nemá dostatek financí dát ho všem obvodům. Pokud se každého obvodu zeptá, kolik si internetu cení s cílem dát ho tam, kde si ho cenní nejvíce, každý obvod přirozeně cenu nadsadí. Řešením může být daň za získané zboží Mechanismus Vickrey-Clarke-Groves 1. ústředí se zeptá agentů na hodnotu získání zboží b i 2. ústředí alokuje zboží skupině agentů A nechť b i (A) = b i, je-li i A, jinak 0, potom ústředí vybere množinu A maximalizující B = Σ i b i (A) 3. agent i zaplatí daň W -i B -i, kde B -i = Σ j i b j (A) W -i = celkový zisk B, pokud se agent i aukce neúčastní jinými slovy, agent, který zboží dostane, platí jako daň největší hodnotu agenta, který zboží nedostal (a agent, který zboží nedostal, neplatí nic) VCG aukce analýza Proč jsou s výsledkem VCG aukce všichni agenti spokojeni (pokud uvedli pravdivou hodnotu zboží)? agent, který zboží získal, platí méně, než kolik je pro něj hodnota zboží agent, který zboží nezískal, je rád, protože daň ň převyšuje ř hodnotu zboží (a nemusí ji platit) Jedná se o pravidla odhalující pravdu? racionální agent se snaží maximalizovat svůj užitek, tj. rozdíl hodnoty zboží a zaplacené daně v i (A) (W -i B -i, ) ústředí maximalizuje celkový užitek (a agent to ví) Σ j b j (A) = b i (A) + Σ j i b j (A) agent vlastně maximalizuje v i (A) + Σ j i b j (A) W -i na hodnotu W -i nemá žádný vliv, takže pokud chce, aby ústředí maximalizovalo to, co chce maximalizovat sám, potom volí b b i = v i
Teorie rozhodování (decision theory)
Umělá inteligence II Roman Barták, KTIML roman.bartak@mff.cuni.cz http://ktiml.mff.cuni.cz/~bartak Teorie pravděpodobnosti (probability theory) popisuje v co má agent věřit na základě pozorování. Teorie
Agent pracující v částečně pozorovatelném prostředí udržuje na základě senzorického modelu odhaduje, jak se svět může vyvíjet.
Umělá inteligence II Roman Barták, KTIML roman.bartak@mff.cuni.cz http://ktiml.mff.cuni.cz/~bartak Dnešní program Agent pracující v částečně pozorovatelném prostředí udržuje na základě senzorického modelu
Teorie her a ekonomické rozhodování. 11. Aukce
Teorie her a ekonomické rozhodování 11. Aukce 11. Aukce Příklady tržních mechanismů prodej s pevnou cenou cenové vyjednávání aukce Využití aukcí prodej uměleckých předmětů, nemovitostí, prodej květin,
Teorie her a ekonomické rozhodování. 7. Hry s neúplnou informací
Teorie her a ekonomické rozhodování 7. Hry s neúplnou informací 7.1 Informace Dosud hráči měli úplnou informaci o hře, např. znali svou výplatní funkci, ale i výplatní funkce ostatních hráčů často to tak
Úvod do teorie her
Úvod do teorie her. Formy her a rovnovážné řešení Tomáš Kroupa http://staff.utia.cas.cz/kroupa/ 208 ÚTIA AV ČR Program. Definujeme 2 základní formy pro studium různých her: rozvinutou, strategickou. 2.
Úvod do teorie her
Úvod do teorie her 2. Garanční řešení, hry s nulovým součtem a smíšené strategie Tomáš Kroupa http://staff.utia.cas.cz/kroupa/ 2017 ÚTIA AV ČR Program 1. Zavedeme řešení, které zabezpečuje minimální výplatu
Teorie her a ekonomické rozhodování. 2. Maticové hry
Teorie her a ekonomické rozhodování 2. Maticové hry 2.1 Maticová hra Teorie her = ekonomická vědní disciplína, která se zabývá studiem konfliktních situací pomocí matematických modelů Hra v normálním tvaru
Teorie her a ekonomické rozhodování. 4. Hry v rozvinutém tvaru
Teorie her a ekonomické rozhodování 4. Hry v rozvinutém tvaru 4.1 Hry v rozvinutém tvaru Hra v normálním tvaru hráči provedou jediné rozhodnutí a to všichni najednou v rozvinutém tvaru řada po sobě následujících
Stručný úvod do teorie her. Michal Bulant
Stručný úvod do teorie her Michal Bulant Čím se budeme zabývat Alespoň 2 hráči (osoby, firmy, státy, biologické druhy apod.) Každý hráč má určitou množinu strategií, konkrétní situace (outcome) ve hře
Mezi firmami v oligopolu dochází ke strategickým interakcím. Při zkoumání strategických interakcí používáme teorii her.
Teorie her a oligopol Varian: Mikroekonomie: moderní přístup, oddíly 26.1-9, 27.1-3 a 27.7-8 Varian: Intermediate Microeconomics, Sections 27.1-9, 28.1-3, 28.7-8 () 1 / 36 Obsah přednášky V této přednášce
12 HRY S NEÚPLNOU INFORMACÍ
12 HRY S NEÚPLNOU INFORMACÍ 543 Ne v každé hře mají všichni hráči úplné informace o výplatních funkcích ostatních. Ve skutečnosti je většina situací s informací neúplnou. Například: V aukcích zpravidla
Užitek a rozhodování
Užitek a rozhodování 10. května 2018 1 Užitek 2 Rozhodovací sítě 3 Markovský rozhodovací proces Zdroje: Roman Barták, přednáška přednáška Umělá inteligence II, Matematicko-fyzikální fakulta, Karlova univerzita
Teorie her a ekonomické rozhodování. 3. Dvoumaticové hry (Bimaticové hry)
Teorie her a ekonomické rozhodování 3. Dvoumaticové hry (Bimaticové hry) 3.1 Neantagonistický konflikt Hra v normálním tvaru hráči provedou jediné rozhodnutí a to všichni najednou v rozvinutém tvaru řada
Teorie užitku. Marta Vomlelová 14. prosince / 23
Teorie užitku Většinou měříme výplatu, hodnotu atd. penězi. MEU (maximalizace očekávaného zisku) je většinou rozumná věc k volbě. Ale občas je lidská intuice jiná a je na nás, jestli věříme víc intuici
ANTAGONISTICKE HRY 172
5 ANTAGONISTICKÉ HRY 172 Antagonistický konflikt je rozhodovací situace, v níž vystupují dva inteligentní rozhodovatelé, kteří se po volbě svých rozhodnutí rozdělí o pevnou částku, jejíž výše nezávisí
3. ANTAGONISTICKÉ HRY
3. ANTAGONISTICKÉ HRY ANTAGONISTICKÝ KONFLIKT Antagonistický konflikt je rozhodovací situace, v níž vystupují dva inteligentní rozhodovatelé, kteří se po volbě svých rozhodnutí rozdělí o pevnou částku,
Operační výzkum. Teorie her cv. Hra v normálním tvaru. Optimální strategie. Maticové hry.
Operační výzkum Teorie her cv. Hra v normálním tvaru. Optimální strategie. Maticové hry. Operační program Vzdělávání pro konkurenceschopnost Název projektu: Inovace magisterského studijního programu Fakulty
Připomeňme, že naším cílem je tvorba nástroj, pro zjištění stavu světa případně
Umělá inteligence II Roman Barták, KTIML roman.bartak@mff.cuni.cz http://ktiml.mff.cuni.cz/~bartak Racionální rozhodování Připomeňme, že naším cílem je tvorba racionálních agentů maximalizujících očekávanou
Bayesovské metody. Mnohorozměrná analýza dat
Mnohorozměrná analýza dat Podmíněná pravděpodobnost Definice: Uvažujme náhodné jevy A a B takové, že P(B) > 0. Podmíněnou pravěpodobností jevu A za podmínky, že nastal jev B, nazýváme podíl P(A B) P(A
Teorie her a ekonomické rozhodování. 8. Vyjednávací hry
Teorie her a ekonomické rozhodování 8. Vyjednávací hry 8. Vyjednávání Teorie her Věda o řešení konfliktů Ale také věda o hledání vzájemně výhodné spolupráce Teorie vyjednávání Odvětví teorie her dohoda
Umělá inteligence II
Umělá inteligence II 11 http://ktiml.mff.cuni.cz/~bartak Roman Barták, KTIML roman.bartak@mff.cuni.cz Dnešní program! V reálném prostředí převládá neurčitost.! Neurčitost umíme zpracovávat pravděpodobnostními
TGH13 - Teorie her I.
TGH13 - Teorie her I. Jan Březina Technical University of Liberec 19. května 2015 Hra s bankéřem Máte právo sehrát s bankéřem hru: 1. hází se korunou dokud nepadne hlava 2. pokud hlava padne v hodu N,
Um lá inteligence II
Um lá inteligence II 13 http://ktiml.mff.cuni.cz/~bartak Roman Barták, KTIML roman.bartak@mff.cuni.cz Motivace! Uvažujme agenta, který se u í hrát šachy.! P i u ení s u itelem je pot eba pro každou pozici
a4b33zui Základy umělé inteligence
LS 2011 Jméno: a4b33zui Základy umělé inteligence 10.6.2011 O1 O2 O3 O4 O5 Total (50) Instrukce: Na vypracování máte 90 min, můžete použít vlastní materiály nebo poznámky. Použití počítače nebo mobilního
Dva podniky vedou mezi sebou spor, k jehož vyřešení může každý z nich podniknout jednu
Zadání příkladu: Dva podniky vedou mezi sebou spor, k jehož vyřešení může každý z nich podniknout jednu ze tří akcí: a/ žalovat druhý podnik u soudu strategie Z b/ nabídnout druhému podniku spojení strategie
13. cvičení z PSI ledna 2017
cvičení z PSI - 7 ledna 07 Asymptotické pravděpodobnosti stavů Najděte asymptotické pravděpodobnosti stavů Markovova řetězce s maticí přechodu / / / 0 P / / 0 / 0 0 0 0 0 0 jestliže počáteční stav je Řešení:
Teorie her a ekonomické rozhodování 5. Opakované hry
Teorie her a ekonomické rozhodování 5. Opakované hry (chybějící či chybná indexace ve skriptech) 5.1 Opakovaná hra Hra až dosud hráči hráli hru jen jednou v reálu se konflikty neustále opakují (firmy nabízí
Základy umělé inteligence
Základy umělé inteligence Hraní her (pro 2 hráče) Základy umělé inteligence - hraní her. Vlasta Radová, ZČU, katedra kybernetiky 1 Hraní her (pro dva hráče) Hraní her je přirozeně spjato s metodami prohledávání
Úvod do teorie her. 6. Koaliční hry
Úvod do teorie her 6. Koaliční hry Tomáš Kroupa http://staff.utia.cas.cz/kroupa/ 2018 ÚTIA AV ČR Různé formy her Známé formy her jsou: rozvinutá, strategická, koaliční. Pro danou množinu hráčů N = {1,...,
Dokonalá konkurence. Mikroekonomie. Opakování. Řešení. Příklad. Příklad. Řešení Ing. Jaroslav ŠETEK, Ph.D. Katedra ekonomiky, JČU
Opakování Mikroekonomie Dokonalá konkurence Ing. Jaroslav ŠETEK, Ph.D. Katedra ekonomiky, JČU U firmy v rámci dokonalé konkurence jsou výrobní náklady dány vztahem: TC = 20000 + 2 a) Jestliže tržní cena
, 1. skupina (16:15-17:45) Jméno: se. Postup je třeba odůvodnit (okomentovat) nebo uvést výpočet. Výsledek bez uvedení jakéhokoliv
42206, skupina (6:5-7:45) Jméno: Zápočtový test z PSI Nezapomeňte podepsat VŠECHNY papíry, které odevzdáváte Škrtejte zřetelně a stejně zřetelně pište i věci, které platí Co je škrtnuto, nebude bráno v
Rozhodovací procesy v ŽP HRY A SIMULAČNÍ MODELY
Rozhodovací procesy v ŽP HRY A SIMULAČNÍ MODELY Teorie her proč využívat hry? Hry a rozhodování varianty her cíle a vítězné strategie (simulační) Modely Operační hra WRENCH Cv. Katedra hydromeliorací a
Dokažte Větu 2(Minimax) ze třetího dílu seriálu pro libovolnou hru s nulovým součtem, ve kterémákaždýhráčnavýběrprávězedvoustrategií.
Teorie her º Ö ÐÓÚ Ö Ì ÖÑ Ò Ó Ð Ò º Ù Ò ¾¼½ ÐÓ ½º HráčIsitajněnapíšenapapírnějaképřirozenéčíslozrozmezíaž noznačmeho ivestejnou chvílisirovněžhráčiinapíšenapapírnějaképřirozenéčíslozrozmezíaž noznačmeho
FIT ČVUT MI-LOM Lineární optimalizace a metody. Dualita. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti
FIT ČVUT MI-LOM Lineární optimalizace a metody Dualita Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Michal Černý, 2011 FIT ČVUT, MI-LOM, M. Černý, 2011: Dualita 2/5 Dualita Evropský
(Ne)kooperativní hry
(Ne)kooperativní hry Tomáš Svoboda, svobodat@fel.cvut.cz katedra kybernetiky, centrum strojového vnímání 5. října 2015 Tomáš Svoboda, svobodat@fel.cvut.cz / katedra kybernetiky, CMP / (Ne)kooperativní
10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Bayesovské modely Doc. RNDr. Iveta Mrázová, CSc.
Zpětnovazební učení Michaela Walterová Jednoocí slepým,
Zpětnovazební učení Michaela Walterová Jednoocí slepým, 17. 4. 2019 V minulých dílech jste viděli Tři paradigmata strojového učení: 1) Učení s učitelem (supervised learning) Trénovací data: vstup a požadovaný
Úvod do teorie her ZVYŠOVÁNÍ ODBORNÝCH KOMPETENCÍ AKADEMICKÝCH PRACOVNÍKŮ OSTRAVSKÉ UNIVERZITY V OSTRAVĚ A SLEZSKÉ UNIVERZITY V OPAVĚ
ZVYŠOVÁNÍ ODBORNÝCH KOMPETENCÍ AKADEMICKÝCH PRACOVNÍKŮ OSTRAVSKÉ UNIVERZITY V OSTRAVĚ A SLEZSKÉ UNIVERZITY V OPAVĚ Úvod do teorie her David Bartl, Lenka Ploháková OSNOVA Úvod (hra n hráčů ve strategickém
B) EX = 0,5, C) EX = 1, F) nemáme dostatek informací.
Hlasovací otázka 9 Náhodná veličina X nabývá jen dvou různých hodnot, 0 a 1. Předpokládejme P(X = 0) = 0,5. Co můžeme říci o EX? Hlasovací otázka 9 Náhodná veličina X nabývá jen dvou různých hodnot, 0
Mikroekonomie magisterský kurz - VŠFS Jiří Mihola, jiri.mihola@quick.cz, www.median-os.cz, 2010 Téma 1 Teorie her pro manažery Obsah 5.1 Teorie her jako součást mikroekonomie 5.2 Základní pojmy teorie
Dokumentace programu piskvorek
Dokumentace programu piskvorek Zápočtového programu z Programování II PRM045 Ondřej Vostal 20. září 2011, Letní semestr, 2010/2011 1 Stručné zadání Napsat textovou hru piškvorky se soupeřem s umělou inteligencí.
Teorie her a ekonomické rozhodování. 9. Modely nedokonalých trhů
Teorie her a ekonomické rozhodování 9. Modely nedokonalých trhů 9.1 Dokonalý trh Dokonalý trh Dokonalá informovanost kupujících Dokonalá informovanost prodávajících Nulové náklady na změnu dodavatele Homogenní
4. Aplikace matematiky v ekonomii
4. Aplikace matematiky v ekonomii 1 Lineární algebra Soustavy 1) Na základě statistických údajů se zjistilo, že závislost množství statku z poptávaného v průběhu jednoho týdne lze popsat vztahem q d =
Hry v rozvinutém tvaru a opakované hry. Hry v rozvinutém tvaru
Hry v rozvinutém tvaru a opakované hry Obsah kapitoly Studijní cíle Doba potřebná ke studiu Pojmy k zapamatování Úvod Výkladová část 1) Hry v rozvinutém tvaru 2) Opakované hry I. Konečně opakované hry
Hry a UI historie. von Neumann, 1944 algoritmy perfektní hry Zuse, Wiener, Shannon, přibližné vyhodnocování
Hry a UI historie Hry vs. Prohledávání stavového prostoru Hry a UI historie Babbage, 1846 počítač porovnává přínos různých herních tahů von Neumann, 1944 algoritmy perfektní hry Zuse, Wiener, Shannon,
14. cvičení z PSI. 9. ledna Pro každý stav platí, že všechny hrany z něj vycházející mají stejnou pravděpodobnost.
4. cvičení z PSI 9. ledna 09 4. rozdělení po mnoha krocích) Markovův řetězec je dán obrázkem: 8 9 4 7 6 Pro každý stav platí, že všechny hrany z něj vycházející mají stejnou pravděpodobnost. a) Klasifikujte
Základy umělé inteligence
Základy umělé inteligence Automatické řešení úloh Základy umělé inteligence - prohledávání. Vlasta Radová, ZČU, katedra kybernetiky 1 Formalizace úlohy UI chápe řešení úloh jako proces hledání řešení v
SEMINÁRNÍ PRÁCE Z MATEMATIKY
SEMINÁRNÍ PRÁCE Z MATEMATIKY PETROHRADSKÝ PARADOX TEREZA KIŠOVÁ 4.B 28.10.2016 MOTIVACE: K napsání této práce mě inspiroval název tématu. Když jsem si o petrohradském paradoxu zjistila nějaké informace
PŘÍKLADY DVOJMATICOVÉ HRY
PŘÍKLADY DVOJMATICOVÉ HRY Příklad 1 SOUTĚŽ O ZAKÁZKY Investor chce vybudovat dva hotely Jeden nazveme Velký (zkratka V); ze získání zakázky na něj se očekává zisk ve výši 30 milionů Druhý nazveme Malý
Aplikace teorie her. V ekonomice a politice Ing. Václav Janoušek
Aplikace teorie her V ekonomice a politice Ing. Václav Janoušek Co je teorie her a její využití Teorie her obor aplikované matematiky a operační analýzy, sloužící k analýze konfliktních a strategických
Úvod do teorie her. David Bartl, Lenka Ploháková
Úvod do teorie her David Bartl, Lenka Ploháková Abstrakt Předložený text Úvod do teorie her pokrývá čtyři nejdůležitější, vybrané kapitoly z této oblasti. Nejprve je čtenář seznámen s předmětem studia
Numerická stabilita algoritmů
Numerická stabilita algoritmů Petr Tichý 9. října 2013 1 Numerická stabilita algoritmů Pravidla v konečné aritmetice Pro počítání v konečné aritmetice počítače platí určitá pravidla, která jsou důležitá
pro bakalářské studijní programy fyzika, informatika a matematika 2018, varianta A
Přijímací zkouška na MFF UK pro bakalářské studijní programy fyzika, informatika a matematika 2018, varianta A U každé z deseti úloh je nabízeno pět odpovědí: a, b, c, d, e. Vaším úkolem je u každé úlohy
14. cvičení z PSI. 9. ledna 2018
cvičení z PSI 9 ledna 08 Asymptotické pravděpodobnosti stavů Najděte asymptotické pravděpodobnosti stavů Markovova řetězce s maticí přechodu / / / 0 P / / 0 / 0 0 0 0 0 0 jestliže počáteční stav je Příslušný
Pravděpodobnost a statistika (BI-PST) Cvičení č. 1
Pravděpodobnost a statistika (BI-PST) Cvičení č. 1 Katedra aplikované matematiky Fakulta informačních technologií České vysoké učení technické v Praze ZS 2014/2015 (FIT ČVUT) BI-PST, Cvičení č. 1 ZS 2014/2015
1. Přednáška. Ing. Miroslav Šulai, MBA
N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy
Operační výzkum. Teorie her. Hra v normálním tvaru. Optimální strategie. Maticové hry.
Operační výzkum Hra v normálním tvaru. Optimální strategie. Maticové hry. Operační program Vzdělávání pro konkurenceschopnost Název projektu: Inovace magisterského studijního programu Fakulty ekonomiky
8. Dokonalá konkurence
8. Dokonalá konkurence Kompletní text ke kapitole viz. KRAFT, J., BEDNÁŘOVÁ, P, KOCOUREK, A. Ekonomie I. TUL Liberec, 2010. ISBN 978-80-7372-652-2; str.64-75 Dokonale konkurenční tržní prostředí lze charakterizovat
EM algoritmus. Proč zahrnovat do modelu neznámé veličiny
EM algoritmus používá se pro odhad nepozorovaných veličin. Jde o iterativní algoritmus opakující dva kroky: Estimate, který odhadne hodnoty nepozorovaných dat, a Maximize, který maximalizuje věrohodnost
Teorie informace: řešené příklady 2014 Tomáš Kroupa
Teorie informace: řešené příklady 04 Tomáš Kroupa Kolik otázek je třeba v průměru položit, abychom se dozvěděli datum narození člověka (den v roce), pokud odpovědi jsou pouze ano/ne a tázaný odpovídá pravdivě?
Anotace. Středník II!! 7. 5. 2010 programování her.
Anotace Středník II!! 7. 5. 2010 programování her. Teorie her Kombinatorická hra je hrou dvou hráčů. Stav hry je určen pozicí nějakých předmětů. Všechny zúčastněné předměty jsou viditelné. Jde o tzv. hru
Pravděpodobnost, náhoda, kostky
Pravděpodobnost, náhoda, kostky Radek Pelánek IV122 Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností připomenutí, souvislosti
Charakteristika oligopolu
Oligopol Charakteristika oligopolu Oligopol v ekonomice převažuje - základní rysy: malý počet firem - činnost několika firem v odvětví vyráběný produkt může být homogenní (čistý oligopol) nebo heterogenní
VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE. Model tahové hry s finančními odměnami
VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE FAKULTA INFORMATIKY A STATISTIKY Obor: Statistika a ekonometrie Název bakalářské práce Model tahové hry s finančními odměnami Autor: Vedoucí bakalářské práce: Rok: 009 Markéta
2 HRA V EXPLICITNÍM TVARU
2 HRA V EXPLICITNÍM TVARU 59 Příklad 1 Hra Nim. Uvažujme jednoduchou hru, kdy dva hráči označme je čísly 1, 2 mají před sebou dvě hromádky, z nichž každá je tvořena dvěma fazolemi. Hráč 1 musí vzít z jedné
Teorie her. RNDr. Magdalena Hykšová, Ph.D. online prostředí, Operační program Praha Adaptabilita, registrační číslo CZ.2.17/3.1.00/31165.
Teorie her RNDr. Magdalena Hykšová, Ph.D. Kurz vznikl v rámci projektu Rozvoj systému vzdělávacích příležitostí pro nadané žáky a studenty v přírodních vědách a matematice s využitím online prostředí,
Operační výzkum. Teorie her. Řešení maticových her převodem na úlohu LP.
Operační výzkum Řešení maticových her převodem na úlohu LP. Operační program Vzdělávání pro konkurenceschopnost Název projektu: Inovace magisterského studijního programu Fakulty ekonomiky a managementu
Dvou-maticové hry a jejich aplikace
Dvou-maticové hry a jejich aplikace Obsah kapitoly. Hry s konstantním součtem Hra v normálním tvaru (ryzí strategie) Smíšené strategie. Hry s nekonstantním součtem Nekooperativní hra Dvou-maticová hra
Přijímací zkouška na MFF UK v Praze
Přijímací zkouška na MFF UK v Praze pro bakalářské studijní programy fyzika, informatika a matematika 017, varianta A U každé z deseti úloh je nabízeno pět odpovědí: a, b, c, d, e. Vaším úkolem je u každé
Odhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
Umělá inteligence I. Roman Barták, KTIML. roman.bartak@mff.cuni.cz http://ktiml.mff.cuni.cz/~bartak
Umělá inteligence I Roman Barták, KTIML roman.bartak@mff.cuni.cz http://ktiml.mff.cuni.cz/~bartak Na úvod Agent s reflexy pouze převádí současný vjem na jednu akci. Agent s cílem umí plánovat několik akcí
A. Cíl hry. Vítězem je hráč s nejvíce vítěznými body po 5 kole. Vítězné body můžete získat dvěma způsoby. a) každé kolo -za darování zboží do senátu
A. Cíl hry Vítězem je hráč s nejvíce vítěznými body po 5 kole. Vítězné body můžete získat dvěma způsoby. a) každé kolo -za darování zboží do senátu b) na konci hry -za nejvíce peněz - za největší rozmanitost
MODELY OLIGOPOLU COURNOTŮV MODEL, STACKELBERGŮV MODEL
MODELY OLIGOPOLU COURNOTŮV MODEL, STACKELBERGŮV MODEL DOKONALÁ KONKURENCE Trh dokonalé konkurence je charakterizován velkým počtem prodávajících, kteří vyrábějí homogenní produkt a nemohou ovlivnit tržní
Pravděpodobnost kolem nás
Brno, 17. 6. 2011 Pravděpodobnost kolem nás - jak spravedlivě losovat? - je možnost volby vždy výhodou? - který šifrovací zámek chrání nejlépe? - je známka z testu věrohodná? - proč prosperuje casino?
Veřejné finance - základní otázky
Veřejné finance - základní otázky - jak rozsáhlá má být redistribuce důchodů? - jak ovlivňovat hospodářský cyklus (dynamiku HDP)? - co a kolik se má vyrábět ve veřejném sektoru? - jak se uskutečňují kolektivní
12. Lineární programování
. Lineární programování. Lineární programování Úloha lineárního programování (lineární optimalizace) je jedním ze základních problémů teorie optimalizace. Našim cílem je nalézt maximum (resp. minimum)
Pravděpodobnostní (Markovské) metody plánování, MDP - obsah
Pravděpodobnostní (Markovské) metody plánování, MDP - obsah Pravděpodobnostní plánování - motivace. Nejistota ve výběr akce Markovské rozhodovací procesy Strategie plán (control policy) Částečně pozorovatelné
Karty Prší. Anotace: Abstract: Gymnázium, Praha 6, Arabská 14 předmět Programování, vyučující Tomáš Obdržálek
Gymnázium, Praha 6, Arabská 14 předmět Programování, vyučující Tomáš Obdržálek Karty Prší ročníkový projekt, Tomáš Krejča 1E květen 2014 Anotace: Mým cílem bylo vytvořit simulátor karetní hry prší. Hráč
Úlohy nejmenších čtverců
Úlohy nejmenších čtverců Petr Tichý 7. listopadu 2012 1 Problémy nejmenších čtverců Ax b Řešení Ax = b nemusí existovat, a pokud existuje, nemusí být jednoznačné. Často má smysl hledat x tak, že Ax b.
Formování cen na trzích výrobních faktorů
Formování cen na trzích výrobních faktorů Na trzích výrobních faktorů jsou určujícími elementy poptávka a nabídka výrobního faktoru. Na trzích výrobků a služeb jsou domácnosti poptávající a firmy nabízející
TEORIE HER Meta hry PŘEDNÁŠKA. OPTIMALIZACE A ROZHODOVÁNÍ V DOPRAVĚ část druhá Přednáška 4. Zuzana Bělinová
PŘEDNÁŠKA 4a TEORIE HER Meta hry OPTIMALIZACE A ROZHODOVÁNÍ V DOPRAVĚ část druhá Přednáška 4 Strategické hry se nenulovým součtem počet hráčů není dán, ale dále uvažujeme 2 hráče hrající racionálně Meta
Dnešní program odvozování v Bayesovských sítích exaktní metody (enumerace, eliminace proměnných) aproximační metody y( (vzorkovací techniky)
Umělá inteligence II Roman Barták, KTIML roman.bartak@mff.cuni.cz http://ktiml.mff.cuni.cz/~bartak Bayesovská síť zachycuje závislosti mezi náhodnými proměnnými Pro zopakování orientovaný acyklický graf
Varianty Monte Carlo Tree Search
Varianty Monte Carlo Tree Search tomas.kuca@matfyz.cz Herní algoritmy MFF UK Praha 2011 Témata O čem bude přednáška? Monte Carlo Tree Search od her podobných Go (bez Go) k vzdálenějším rozdíly a rozšíření
Umělá inteligence II Roman Barták, KTIML roman.bartak@mff.cuni.cz http://ktiml.mff.cuni.cz/~bartak Pro zopakování Pravděpodobnost je formální mechanismus pro zachycení neurčitosti. Pravděpodobnost každé
V této části se budeme věnovat nejjednoduššímu typu her, ve kterých rozhodováníprobíhávjednomkrokuakaždýhráčmáúplnouinformacijako
Kapitola 1 Aplikace teorie her Teorie her není úplně nejvýstižnější pojmenování. Předmětem teorie her nejsou hry v obvyklém smyslu slova, hrané pro zábavu. Výstižnější název by asi byl teorie interaktivního
e erz vaná v aco rozpr
rozpracovaná verze Představte si, že jste velryba. Jste velryba. Nyní jste připraveni hrát hru. Herní materiál 78 hracích karet (3 sady velryb, superhrdinové, želvy) 6 karet rolí (4x velryba, 2x superšpion)
ÚVOD DO ROZHODOVÁNÍ PŘEDNÁŠKA. OPTIMALIZACE A ROZHODOVÁNÍ V DOPRAVĚ Přednáška 1. Zuzana Bělinová
PŘEDNÁŠKA 1 ÚVOD DO ROZHODOVÁNÍ Organizační Vyučující Ing., Ph.D. email: belinova@k620.fd.cvut.cz Doporučená literatura Dudorkin J. Operační výzkum. Požadavky zápočtu docházka zápočtový test (21.5.2015)
Výběrové charakteristiky a jejich rozdělení
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový
UČENÍ BEZ UČITELE. Václav Hlaváč
UČENÍ BEZ UČITELE Václav Hlaváč Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz, http://cmp.felk.cvut.cz/~hlavac 1/22 OBSAH PŘEDNÁŠKY ÚVOD Učení
Průvodce studiem. do bodu B se snažíme najít nejkratší cestu. Ve firmách je snaha minimalizovat
6. Extrémy funkcí více proměnných Průvodce studiem Hledání extrémů je v praxi často řešená úloha. Např. při cestě z bodu A do bodu B se snažíme najít nejkratší cestu. Ve firmách je snaha minimalizovat
Přednáška #8. Základy mikroekonomie TEORIE HER
Přednáška #8 Základy mikroekonomie TEORIE HER 14.11.2012 V minulé přednášce jsme si vysvětlili, co je to oligopolistické tržní uspořádání Oligopol jako tržní uspořádání stojí mezi monopolem a režimem dokonalé
Zabýváme se konstrukcí racionálních agentů.
Umělá inteligence II Roman Barták, KTIML roman.bartak@mff.cuni.cz http://ktiml.mff.cuni.cz/~bartak Zabýváme se konstrukcí racionálních agentů. Agent je entita, co vnímá okolní prostředí prostřednictvím
JAK HRÁT Petr Vojtěch Jindřich Pavlásek
JAK HRÁT Petr Vojtěch Jindřich Pavlásek Cíl Představte si, že jste velryba. Jste velryba. Nyní jste připraveni hrát hru. Herní materiál Hráči se jako velrybí generálové pokouší sestavit nejsilnější možnou
Cvičení 5 - Inverzní matice
Cvičení 5 - Inverzní matice Pojem Inverzní matice Buď A R n n. A je inverzní maticí k A, pokud platí, AA = A A = I n. Matice A, pokud existuje, je jednoznačná. A stačí nám jen jedna rovnost, aby platilo,
oddělení Inteligentní Datové Analýzy (IDA)
Vytěžování dat Filip Železný Katedra počítačů oddělení Inteligentní Datové Analýzy (IDA) 22. září 2014 Filip Železný (ČVUT) Vytěžování dat 22. září 2014 1 / 25 Odhad rozdělení Úloha: Vstup: data D = {
1 Linearní prostory nad komplexními čísly
1 Linearní prostory nad komplexními čísly V této přednášce budeme hledat kořeny polynomů, které se dále budou moci vyskytovat jako složky vektorů nebo matic Vzhledem k tomu, že kořeny polynomu (i reálného)
Úlohy domácí části I. kola kategorie C
6. ročník Matematické olympiády Úlohy domácí části I. kola kategorie C 1. Určete všechny dvojice (x, y) reálných čísel, která vyhovují soustavě rovnic (x + )2 = y, (y )2 = x + 8. Řešení. Vzhledem k tomu,
1 Determinanty a inverzní matice
Determinanty a inverzní matice Definice Necht A = (a ij ) je matice typu (n, n), n 2 Subdeterminantem A ij matice A příslušným pozici (i, j) nazýváme determinant matice, která vznikne z A vypuštěním i-tého
Usuzování za neurčitosti
Usuzování za neurčitosti 25.11.2014 8-1 Usuzování za neurčitosti Hypotetické usuzování a zpětná indukce Míry postačitelnosti a nezbytnosti Kombinace důkazů Šíření pravděpodobnosti v inferenčních sítích