Algoritmy pro práci s neúplnou informací

Podobné dokumenty
Varianty Monte Carlo Tree Search

Osadníci z Katanu. a Monte Carlo Tree Search. David Pěgřímek. MFF UK (2013) 1 / 24

Úvod do teorie her

Hry a UI historie. von Neumann, 1944 algoritmy perfektní hry Zuse, Wiener, Shannon, přibližné vyhodnocování

Monte Carlo Tree Search. Marika Ivanová

Základy umělé inteligence

Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi. 72 studentů

Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

Hry a UI historie. Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

Obsah: Hry Prohledávání stavového prostoru. Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

Seminář z umělé inteligence. Otakar Trunda

Hry a UI historie. agent musí brát v úvahu akce jiných agentů jak ovlivní jeho. vliv ostatních agentů prvek náhody. Hry: Obsah:

Algoritmy pro hraní tahových her

Hry a UI historie. Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

! Kyberne(ka!a!umělá!inteligence! 8.!Hraní!dvouhráčových!her,!adversariální! prohledávání!stavového!prostoru!!!!

Gymnázium, Praha 6, Arabská 14. předmět Programování, vyučující Tomáš Obdržálek. Počítačová hra Fotbalový Manažer. ročníkový projekt.

Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

Anotace. Středník II!! programování her.

Algoritmus Minimax. Tomáš Kühr. Projektový seminář 1

Geneticky vyvíjené strategie Egyptská hra SENET

HRY A UI HISTORIE. Hry vs. Prohledávání stavového prostoru. Obsah:

BAKALÁŘSKÁ PRÁCE. MCTS pro hru Metro

TGH13 - Teorie her I.

Základy umělé inteligence

Teorie her a ekonomické rozhodování. 7. Hry s neúplnou informací

A4B33ZUI Základy umělé inteligence

Počítačové šachy. Otakar Trunda

Teorie her a ekonomické rozhodování. 4. Hry v rozvinutém tvaru

Složitost her. Herní algoritmy. Otakar Trunda

Dokumentace programu piskvorek

Univerzita Karlova v Praze. Matematicko-fyzikální fakulta. Jakub Tomek. Aplikace MCTS na hru Quoridor. Studijní program: informatika

Úvod do teorie grafů

Stručný úvod do teorie her. Michal Bulant

Pravděpodobnost, náhoda, kostky

Datové struktury Úvod

Hraní her. (Teorie a algoritmy hraní her) Řešení úloh hraní her. Václav Matoušek /

Pavel Veselý Proof-number search, Lambda search a jejich vylepšení

DUST SETUP. následně každý hráč odloží hranou kartu a začíná první kolo. HERNÍ KOLO

B) EX = 0,5, C) EX = 1, F) nemáme dostatek informací.

Algoritmizace prostorových úloh

UNIVERZITA PARDUBICE

ADT STROM Lukáš Foldýna

Uvažujeme jen hry s nulovým součtem, tj. zisk jednoho. Střídá se náš tah, kde maximalizujeme svůj zisk, s tahem

Aplikace umělé inteligence v počítačových hrách

strategická desková hra pro dva hráče

Prohledávání do šířky a do hloubky. Jan Hnilica Počítačové modelování 15

State Space Search Step Run Editace úloh Task1 Task2 Init Clear Node Goal Add Shift Remove Add Node Goal Node Shift Remove, Add Node

Umělá inteligence I. Roman Barták, KTIML.

Rozšířený obchod. Náhrada za slabý list (karty v ruce)

Číslo výrobku: Sada na pétanque. Návod na hraní. Tchibo GmbH D Hamburg 95091AB2X3VIII

Řešení problémů pomocí MCTS

Metody návrhu algoritmů, příklady. IB111 Programování a algoritmizace

Binární vyhledávací stromy pokročilé partie

ROČNÍKOVÝ PROJEKT. Evade

2. Řešení úloh hraní her Hraní her (Teorie a algoritmy hraní her)

Umělá inteligence I. Roman Barták, KTIML.

HERNÍ PLÁN POKER GIRLS APOLLO GAMES APKSOFT s.r.o.

Základní datové struktury III: Stromy, haldy

4EK311 Operační výzkum. 1. Úvod do operačního výzkumu

INTERACTIVE GAMES 750 CZK

ŽS/12 Metoda vrůstu v nácviku herní činnosti

Dva kompletně řešené příklady

bfs, dfs, fronta, zásobník, prioritní fronta, halda

DIPLOMOVÁ PRÁCE. Ondřej Sýkora Umělá inteligence pro real-time strategické počítačové hry

HERNÍ PLÁN SÁZKOVÉ HRY

HERNÍ PLÁN - VIDEO GAMES II - verze 750

Rozhodovací procesy 3

GENERAL GAME PLAYING Marika Ivanová Seminář Herní Algoritmy,

PŘÍRODOVĚDECKÁ FAKULTA UNIVERZITY PALACKÉHO KATEDRA INFORMATIKY ROČNÍKOVÝ PROJEKT KLOKAN. Informatika, II. ročník

AI TESTER. Uživatelská příručka. AI Tester 1.1 AI Tester Server 0.9

PRAVIDLA: ÚROVEŇ 4 BALÍČEK VS BALÍČEK

Algoritmy a datové struktury

Obsah: Algoritmus Minimax. 7 9 Nedeterministick і hry 7 9 Hry s nep 0 0esn 0 5mi znalostmi

Martin Milata, Pokud je alespoň jeden rozměr čokolády sudý (s výjimkou tabulky velikosti 1x2, která už je od

Pravděpodobnost, náhoda, kostky

Čtvercové, krychlové a teseraktové minipiškvorky

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Emotion Technická charakteristika

TEORIE HER Meta hry PŘEDNÁŠKA. OPTIMALIZACE A ROZHODOVÁNÍ V DOPRAVĚ část druhá Přednáška 4. Zuzana Bělinová

Hledání správné cesty

Fotonové mapy. Leonid Buneev

Heuristiky, best-first search, A* search.

Rozhodovací procesy v ŽP HRY A SIMULAČNÍ MODELY

zpravidla předpokládá, že hodnoty intenzity poruch a oprav jsou konstantní.

BAKALÁŘSKÁ PRÁCE. Umělá inteligence pro strategické hry

Aplikace teoretických postupů pro ocenění rizika při upisování pojistných smluv v oblasti velkých rizik

Základy informatiky. Teorie grafů. Zpracoval: Pavel Děrgel Úprava: Daniela Szturcová

Grafy. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 13.

Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE

Rekurzivní algoritmy

Matematika III 10. přednáška Stromy a kostry

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Heuristiky, best-first search, A* search

DRUHY HAZARDNÍCH HER. Vytvořeno: Odborem 34 Státní dozor nad sázkovými hrami a loteriemi 12. října 2016

Stromy. Strom: souvislý graf bez kružnic využití: počítačová grafika seznam objektů efektivní vyhledávání výpočetní stromy rozhodovací stromy

HINT. Tahová strategie, Uživatelská dokumentace. Štěpán Poljak, 2010

Ing. Alena Šafrová Drášilová

Transkript:

Michal Krkavec 23. listopadu 2011

Obsah Náhoda Expectimax Neúplné informace Monte Carlo Tree Search Perfect Information Monte Carlo Realtime plánování Plánování v RTS Monte Carlo Plánování

Expectimax Expectimax úprava Minimaxu pro hry s úplnou ale nedokonalou informací některé uzly odpovídají stavům hry speciální uzly pro náhodu všichni synové mají svou pravděpodobnost, že nastanou hodnotou uzlu náhody je střední hodnota synů (vážený průměr) αβ-prořezávání při omezené ohodnocovací funkci

Monte Carlo Tree Search MCTS best-first search algoritmus rozvinutí nalezeného listu pseudonáhodné simulace až do koncových stavů propagace výsledku simulace ke kořeni nepotřebuje expertní znalosti o hře (heuristické funkce) tudíž je dostatečně univerzální

Perfect Information Monte Carlo Perfect Information Monte Carlo neúplnou informaci obchází vzorkováním herního světa následně je daný stav světa vyhodnocen (přímo / heuristicky) pomocí MCTS úspěchy u karetních her (Bridge, Skat, Hearts) problémy?

Perfect Information Monte Carlo Potíže PIMC PIMC selhává: strategy fusion (vzorkování přestože dva světy splývají, PIMC si myslí, že je dokáže rozeznat) non-locality (závislost na hodnotách mimo svůj podstrom) jak často? Měřitelné vlastnosti stromu: leaf correlation (závislost listů) bias (odchylka, nadržování) disambiguation factor (zmenšování neúplné informace, počet možných světů)

Perfect Information Monte Carlo Umělé stavové stromy s neúplnou informací Zjednodušení: stupeň uzlů hráče je 2 veškerá náhoda (rozdělení neúplných informací) se odehraje v kořeni stromu každý hráč může začínat v K možných pozicích stupeň kořene je K 2 hodnoty koncových stavů { 1, 1} Parametry: leaf correlation, bias, disambiguation factor konkrétně K = 8, hloubka stromu také 8, 10000 vygenerovaných stromů, na každém se odehrály 2 partie soupeřové: PIMC, random player, CFR (Counter-factual Regret alg. téměř optimální alg. založený na klasickém prohledávání stavového prostoru)

Perfect Information Monte Carlo Výsledky partií Na umělých stromech: nejhorší výsledky při nízké leaf correlation (závislosti listů) při nižší závislosti uzlů hraje roli i bias (nadržování) disambiguation factor (zmenšování neúplné informace) nejednoznačný vliv Analýza lidmi sehraných partií hry Skat: zmenšování neúplné informace vždy blízko 0.6 závislost listů vysoká odchylka (nadržování, bias) spíše rovnoměrný dobré výsledky pro PIMC proti random a srovnatelné s CFR

Perfect Information Monte Carlo Výsledky partií Poker (PIMC vs random vs CFR): nulové odkrývání informací závislost listů 0,5 odchylka 0,5 slabší výsledky

Plánování v RTS Umělá inteligence v RTS skriptování nejčastější řešení, pevně daná pravidla, málo přizpůsobivý předvídatelný soupeř, klidně statisíce řádků kódu plánování práce se zdroji, stavba jednotek, plánování soubojů různé úrovně plánování kontrola jednotek většinou defaultní (reaktivní) chování taktické (střednědobé) plánování jakým způsobem vést útok, hledat nepřítele, stavět obranu,... strategické (dlouhodobé) plánování kdy stavět jednotky a jaké, kdy zaútočit, jakým směrem se soustředit další plánování na úrovni jednotek, např. pathfinding

Monte Carlo Plánování Monte Carlo Plánování pro plánování ve hrách s neúplnou informací, náhodou a současným hraním tahů abstrahuje stavový prostor vzorkuje stavy s neúplnou informací různé úrovně plánování? parametrizovatelné základní plány (útok, stavba budov, stavba jednotek, pohyb)

Monte Carlo Plánování MCPlan Monte Carlo přístup: pro daný (abstraktní) stav hry vygeneruj P plánů simuluj každý plán celkem S-krát do maximální hloubky K kroků ohodnoť závěrečný stav sluč jednotlivá ohodnocení z S simulací vyber nejlepší plán

Monte Carlo Plánování MCPlan pohybujeme se po abstraktních stavech obecný univerzální algoritmus podle konkrétní hry musíme umět: definovat plány ohodnotit abstraktní stavy

Monte Carlo Plánování MCPlan ve hře Capture the Flag Herní svět: symetrická mapa se zdmi soupeři mají základny proti sobě cílem je dovézt soupeřovu vlajku do své základny polohu vlajky známe vlajku může nést jen soupeřova jednotka pouze bojové jednotky počet životů dostřel, palebná síla Neřeší zásoby zdrojů, stavbu jednotek. Soustředí se na průzkum mapy, obranu a krádež vlajky.

Monte Carlo Plánování Realizace hry abstrakce stavu mapa rozdělena na větší políčka životy jednotek a jejich poloha na políčcích mapy polohy vlajek a objevených zdí ohodnocovací funkce zdraví jednotek prozkoumání mapy + aktuální viditelnost vzdálenost vlajky od základny simulace pohyb jednotek na náhodné políčko ve svém okolí odebrání životů nejbližšímu nepříteli v dostřelu přeplánování při událostech objevení, zničení nepřítele, zvednutí vlajky

Monte Carlo Plánování Výsledky Sledovat lze různé parametry: počet plánů (vs random) počet jednotek (vs random) složitost mapy (vs rush-the-flag) abstrakce stavu mapa rozdělena na větší políčka životy jednotek a jejich poloha na políčcích mapy polohy vlajek a objevených zdí při událostech objevení, zničení nepřítele, zvednutí vlajky

MCTS v dalších hrách s neúplnou informací deskové hry Fantom staré Prahy, Osadníci, Scrabble, Vrhcáby (Backgamon) další Pacman, Magic: The Gathering

Literatura Chaslot, Bakkes, Szita, Spronck: Monte-Carlo Tree Search: A New Framework for Game AI Long, Sturtevant, Buro, Furtak: Understanding the Succes of Perfect Information Monte Carlo Sampling in Game Tree Search Chung, Buro, Schaeffer: Monte Carlo Planning in RTS Games Ward, Cowling: Monte Carlo Search Applied to Card Selection in Magic: The Gathering