Osadníci z Katanu. a Monte Carlo Tree Search. David Pěgřímek. http://davpe.net MFF UK (2013) 1 / 24



Podobné dokumenty
Varianty Monte Carlo Tree Search

Každý hráč dostane 1 list s herním plánem. Připraví se 6 kostek. Navíc potřebuje každý hráč tužku. Určí se, kdo začíná.

Algoritmy pro práci s neúplnou informací

OSADNÍCI Z KATANU JUBILEJNÍ SCÉNÁŘ KOLONIE (Jubiläums-Szenario Die Kolonien )

Almanach Katanu Podrobný výklad pravidel a příklady ke hře Osadníci z Katanu

HERNÍ MATERIÁL. město vesnice silnice

Teorie her a ekonomické rozhodování. 4. Hry v rozvinutém tvaru

Objevitelské plavby na Katanu

ALMANACH. Podrobný výklad pravidel

PRAVIDLA HRY OBSAH. Přejeme příjemnou zábavu na Katanu!

Pravděpodobnost a statistika (BI-PST) Cvičení č. 1

Ročníkový projekt. Osadníci z Katanu. Jakub Malý. Uživatelská dokumentace

Úvod do teorie her

Princes of Florence - Pro Ludo

Monte Carlo Tree Search. Marika Ivanová

Přehled hry a hrací deska pro první pokusy Přečtěte si nejprve tento přehled, ve kterém najdete nejdůležitější změny oproti hře Osadníci z Katanu.

OSADNÍCI Z KATANU HISTORICKÉ SCÉNÁŘE 2: VELKÁ ČÍNSKÁ ZEĎ (Die große Mauer)

JAK HRÁT Petr Vojtěch Jindřich Pavlásek

e erz vaná v aco rozpr

BAKALÁŘSKÁ PRÁCE. MCTS pro hru Metro

Geneticky vyvíjené strategie Egyptská hra SENET

B) EX = 0,5, C) EX = 1, F) nemáme dostatek informací.

Města a Rytíři HR A OBSAHUJE OBSAH

Základy umělé inteligence

strategická desková hra pro dva hráče

HERNÍ PLÁN MAD MECHANIC APOLLO GAMES APKSOFT s.r.o.

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

Složitost her. Herní algoritmy. Otakar Trunda

TGH13 - Teorie her I.

Gymnázium, Praha 6, Arabská 14. předmět Programování, vyučující Tomáš Obdržálek. Počítačová hra Fotbalový Manažer. ročníkový projekt.

HERNÍ PLÁN MAD MECHANIC APOLLO GAMES APKSOFT s.r.o.

pro bakalářské studijní programy fyzika, informatika a matematika 2018, varianta A

Univerzita Karlova v Praze. Matematicko-fyzikální fakulta. Jakub Tomek. Aplikace MCTS na hru Quoridor. Studijní program: informatika

Cíl hry. Herní komponenty. Spielablauf. Hra od Donalda X. Vaccariniho pro 2 4 hráče od 8 let

HERNÍ PLÁN MULTIFRUITS APOLLO GAMES APKSOFT s.r.o.

Pravděpodobnost kolem nás

HERNÍ MATERIÁL. Milí hráči, OBSAH PRAVIDEL. 138 herních figurek. VARIANTY - Přátelský zloděj - Události Katanu - Přístavní mistr - Katan pro dva

HERNÍ PLÁN WIN AND RACE APOLLO GAMES APKSOFT s.r.o.

O soutěži MaSo. Co je to MaSo? Třinácté MaSo, 78 družstev, 46 škol. Organizace. maso.mff.cuni.cz. o dvakrát za rok o nejen počítání o soutěž družstev

Pravidla hry OBSAH. Sestavení herního plánu... 2 Přehled hry Příprava hry... 4 Průběh hry Kmeny Konec hry...

Padne-li na kostkách číslo 10, obdrží červený hráč 1 kartu rudy,

HERNÍ PLÁN MULTIFRUITS APOLLO GAMES APKSOFT s.r.o.

kartu Loupež Mor Všichni hráči dostanou za svá města pouze 1 kartu se surovinou. Města a rytíři: Hráči nedostanou za svá města žádné obchodní zboží.

Dva kompletně řešené příklady

GENERAL GAME PLAYING Marika Ivanová Seminář Herní Algoritmy,

OSADNÍCI Z KATANU HISTORICKÉ SCÉNÁŘE 1: CHEOPS

HERNÍ KOMPONENTY 34 karet zakázek 132 karet palet 54 hexových žetonů palet a 1 startovní trojhexový žeton 4 karty nápovědy

Herní plán QUICK PAY JACKPOTS

Závěrečná práce studentského projektu OPPA

HERNÍ PLÁN IVT SYNOT

Platí všechna pravidla ze základní hry, erhalten natürlich keinen Chip). Die übrigen 7 Zahlenchips verteilen Sie zufällig auf die restlichen

HERNÍ PLÁN BONUS JOKER II APOLLO GAMES APOLLO SOFT k. s.

ODDVILLE hra pro 2 4 hráče od 10 let

Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

2. Řešení úloh hraní her Hraní her (Teorie a algoritmy hraní her)

Hraní her. (Teorie a algoritmy hraní her) Řešení úloh hraní her. Václav Matoušek /

Emotion Technická charakteristika

HERNÍ PLÁN GOLDEN TREASURE APOLLO GAMES APKSOFT s.r.o.

HERNÍ PLÁN MYSTERY JOKER APOLLO GAMES APKSOFT s.r.o.

Hry a UI historie. Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

Stručný úvod do teorie her. Michal Bulant

HERNÍ PLÁN ATLANTIS APOLLO GAMES APKSOFT s.r.o.

Rozhodovací procesy v ŽP HRY A SIMULAČNÍ MODELY

Pavel Veselý Proof-number search, Lambda search a jejich vylepšení

Teorie her a ekonomické rozhodování. 7. Hry s neúplnou informací

Ing. Alena Šafrová Drášilová

IB112 Základy matematiky

Pravidla Vítejte u nových dobrodružství na Katanu!

Hledání správné cesty

Quatrata.


POPIS HRY. Apex Multi Magic. APEX MULTI MAGIC III CZ kat.2 V1.01 Minimální vklad 1 Kč Maximální vklad 100 Kč

HERNÍ PLÁN PANDORA APOLLO GAMES APOLLO SOFT k. s.

Obsah: Hry Prohledávání stavového prostoru. Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

Príprava hry. 1. Umístěte nový herní plán na původní, jak je zobrazeno níže. jídla na loviště

PRAVDĚPODOBNOST Náhodné pokusy. Náhodný jev

HERNÍ PLÁN SLOT BIRDS APOLLO GAMES APKSOFT s.r.o.

Hry a UI historie. agent musí brát v úvahu akce jiných agentů jak ovlivní jeho. vliv ostatních agentů prvek náhody. Hry: Obsah:

! Kyberne(ka!a!umělá!inteligence! 8.!Hraní!dvouhráčových!her,!adversariální! prohledávání!stavového!prostoru!!!!

S U P E R G A M E S HERNÍ PLÁN

Král elfů (King of the elves) Karetní hra Elfenland od Alana R.Moona Pro 2-6 hráčů; od 10 let; délka cca 60 minut

VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE. Model tahové hry s finančními odměnami

Teorie her a ekonomické rozhodování. 2. Maticové hry

Design: Wilfried a Marie Fort

Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

Vlastnická listina. Křišťálová koule

Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

"Agent Hledač" (3. přednáška)

HERNÍ PLÁN HORUS EYE APOLLO GAMES APOLLO SOFT k. s.

DRUHY HAZARDNÍCH HER. Vytvořeno: Odborem 34 Státní dozor nad sázkovými hrami a loteriemi 12. října 2016

Hry a UI historie. Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi. 72 studentů

Algoritmy pro hraní tahových her

Počet hráčů: 2 4 Věk hráčů: 10+ Doba hraní: min

DUST SETUP. následně každý hráč odloží hranou kartu a začíná první kolo. HERNÍ KOLO

TEORIE HER

INTERACTIVE GAMES 750 CZK

Herní plán. Hot as Hell

ZÁKON o HAZARDNÍCH HRÁCH

Transkript:

.. Osadníci z Katanu a Monte Carlo Tree Search David Pěgřímek http://davpe.net MFF UK (2013) 1 / 24

Osadníci z Katanu autor hry Klaus Teuber (1995 Německo) strategická desková hra pro 3 až 4 hráče hra s neúplnou informací náhoda 2 / 24

Pravidla hrací desku tvoří 19 šestiúhelníků (krajiny) na jejich vrcholy lze stavět vesnice (zisk 1 bod) na strany lze stavět cesty spojující vesnice krajiny jsou: pole, les, pahorkatina, hory, pastviny a poušť ty produkují suroviny: obilí, dřevo, cihly, ruda, vlna poušť nevynáší nic krajiny jsou očíslované čísly 2 až 12, hází se dvěma kostkami hráč jehož vesnice sousedí s krajinou jejíž číslo padlo na součtu kostek si bere jednu surovinu kterou daná krajina produkuje 3 / 24

vesnici lze povýšit na město (zisk 2 body) město vynáší dvojnásobek surovin vyhrává kdo získá 10 bodů hráči mezi sebou mohou obchodovat lze měnit s bankou v kurzu 4 : 1 v případě přístavu 3 : 1 pokud je součet kostek 7 nastupuje zloděj akční karty (rytíř, pokrok, 1 bod) největší vojsko, nejdelší cesta (2 body) 4 / 24

5 / 24

Existující implementace SmartSettlers (Monte Carlo Tree Search) JSettlers (open source, Java) http://nand.net/jsettlers/ Settlers of Catan (Microsoft) 6 / 24

První část dle článku Monte-Carlo Tree Search in Settlers of Catan vytvoření prvotní implementace (program SmartSettlers) Osadníků z Katanu používající MCTS dostupné z http://www.personeel.unimaas.nl/ G-Chaslot/papers/ACGSzitaChaslotSpronck.pdf Citace: Szita, I., Chaslot, G., and Spronck, P. (2010). Monte-Carlo Tree Search in Settlers of Catan. Advances in Computer Games. Vol. 6048, pp. 21 32. Springer Berlin / Heidelberg 7 / 24

Úprava hry odstranění neúplné informace odkrytí karet agent nemění karty s hráči může měnit karty s bankou 8 / 24

Pořadí hráčů na pořadí hráčů záleží náhodní agenti - výhoda hráče číslo 1 MCTS agenti - výhoda hráčů číslo 2 a 3 pro další pokusy je pořadí hráčů náhodné 9 / 24

Připomenutí MCTS selekce - rekurzivně z kořene vybírám děti až k listu expanze - přidám nový uzel simulace (playout) - sehraji náhodnou hru zpětná propagace - výsledek propaguji zpět do kořene UCT - vyberu dítě uzlu p které maximalizuje ln Np V i + C N i C je konstanta která se určí experimentálně V i je hodnota uzlu, N i počet návštěv 10 / 24

Domain Knowledge v MC simulacích každá akce má nějakou váhu vybudování vesnice/města +10 000 vybudování cesty 10 #cest hráče kde R := 10 R # osad a měst hráče zahrání karty rytíře pokud zloděj blokuje mé pole +100 zahrání akční karty +10 jinak váhy akcí +1 pravděpodobnosti jsou úměrné těmto vahám oproti uniformnímu samplování znatelně horší výsledek 11 / 24

Domain Knowledge v MCTS vybudování vesnice získá 20 virtuálních výher vybudování města získá 10 virtuálních výher pokud je do stromu vložena akce vybuduj vesnici, čítače počtu přístupů a počtu vítězství jsou inicializovány na 20 zvýšilo sílu hráče 12 / 24

MCTS proti JSettlers jeden hráč MCTS proti třem hráčům JSettlers 100 sehraných her náhodný hráč - 0% výhra MCTS s 1 000 simulacemi za tah - 27% výhra MCTS s 10 000 simulacemi za tah - 49% výhra 13 / 24

MCTS proti Lidem 1 člověk, 2 JSettlers agenti a 1 MCTS agent sehrán tucet her, vítězí převážně člověk strategie ruda a obilí (preferovaná MCTS agentem) strategie dřevo a cihly MCTS nestaví tolik vesnic jako by stavěl člověk 14 / 24

Druhá část dle bakalářské práce Monte Carlo Tree Search in a Modern Board Game Framework z roku 2012 autor je G.J.B. Roelofs z Maastricht University vytvoření Frameworku pro hraní moderních her a otestování na Osadnících z Katanu používajících MCTS dostupné z https://project.dke.maastrichtuniversity.nl/games/ files/bsc/roelofs_bsc-paper.pdf 15 / 24

Parametry MCTS se selekcí UCT a parametrem T (Coulom 2007) parametr T - minimální hranice pro zapnutí UCT pokud není uzel navštíven alespoň T krát, pak se pro selekci použije playout strategie playout strategie - náhodná hra bez domain knowledge 16 / 24

Expectimax jako minimax ale navíc chance uzly hodnota chance uzlů je vážený součet jeho následníků vylepšení: Group Chance Model chance uzel a jeho děti seskupeny do jednoho uzlu nevýhoda: některé akce mohou být ignorovány 17 / 24

Expectimax 18 / 24

Chance a Group Chance Model 19 / 24

Skupinování tahů (Move Groups) podobné tahy se seskupí do obecnějších skupin redukuje větvení -> zrychluje fázi selekce a expanze zvýšení síly hráče např. v Go 20 / 24

Skupinování tahů (Move Groups) 21 / 24

Experimenty v simulacích maximálně 2 000 ms na tah na pořadí stále záleží, při zkracování délky simulace zvýhodněn hráč 4 při použití strategií už včas na pořadí tolik nezáleží pokusy ukončit hru dříve nebyly úspěšné optimální hodnota parametru C je 7 nízká hodnota parametru C snižuje sílu hráče parametr T nemá významný efekt (T = 30) 22 / 24

Experimenty při vyšším počtu simulací je síla Chance modelu stejná jako Group Chance modelu skupinování tahů způsobilo pokles ve výkonosti snížení času na tah se díky skupinování se projevilo, ale zanedbatelně zvýšení počtu simulací zvyšuje sílu hráče 23 / 24

Děkuji za pozornost. 24 / 24