GENERAL GAME PLAYING Marika Ivanová Seminář Herní Algoritmy, 12. 12. 2012

Podobné dokumenty
Umělá inteligence I. Roman Barták, KTIML.

Seriál: Management projektů 7. rámcového programu

Katedra obecné elektrotechniky Fakulta elektrotechniky a informatiky, VŠB - TU Ostrava 16. ZÁKLADY LOGICKÉHO ŘÍZENÍ

Dynamický model predikovaného vývoje krajiny. Vilém Pechanec

RAPEX závěrečná zpráva o činnosti systému v roce 2012 (pouze výtah statistických údajů)

Škola VOŠ a SPŠE Plzeň, IČO , REDIZO

Ukázka knihy z internetového knihkupectví

Čl. 3 Poskytnutí finančních prostředků vyčleněných na rozvojový program Čl. 4 Předkládání žádostí, poskytování dotací, časové určení programu

TWINNING PROJEKT CZ01/IB-EN-01

13. Sítě WAN. Rozlehlé sítě WAN. Počítačové sítě I. 1 (6) KST/IPS1. Studijní cíl. Představíme rozlehlé sítě typu WAN. Doba nutná k nastudování

METODIKA PRO NÁVRH TEPELNÉHO ČERPADLA SYSTÉMU VZDUCH-VODA

Algoritmizace a programování

Trvale udržitelný rybolov

Žáci mají k dispozici pracovní list. Formou kolektivní diskuze a výkladu si osvojí grafickou minimalizaci zápisu logické funkce

Zákon o elektronickém podpisu

Provozní řád ELMÍK Dětské centrum

1 METODICKÉ POKYNY AD HOC MODUL 2007: Pracovní úrazy a zdravotní problémy související se zaměstnáním

4 DVOJMATICOVÉ HRY. Strategie Stiskni páku Sed u koryta. Stiskni páku (8, 2) (5, 3) Sed u koryta (10, 2) (0, 0)

Příspěvky poskytované zaměstnavatelům na zaměstnávání osob se zdravotním postižením Dle zákona č. 435/2004 Sb., o zaměstnanosti, v platném znění.

1.7. Mechanické kmitání

Číslicová technika 3 učební texty (SPŠ Zlín) str.: - 1 -

Moderní technologie ve studiu aplikované fyziky CZ.1.07/2.2.00/ Reálná čísla

Příloha č. 54. Specifikace hromadné aktualizace SMS-KLAS

INTERNETOVÝ TRH S POHLEDÁVKAMI. Uživatelská příručka

PŘÍRUČKA K PŘEDKLÁDÁNÍ PRŮBĚŽNÝCH ZPRÁV, ZPRÁV O ČERPÁNÍ ROZPOČTU A ZÁVĚREČNÝCH ZPRÁV PROJEKTŮ PODPOŘENÝCH Z PROGRAMU BETA

VYUŽITÍ NEURONOVÝCH SÍTÍ PROSTŘEDÍ MATLAB K PREDIKCI HODNOT NÁKLADŮ PRO ELEKTRICKÉ OBLOUKOVÉ PECE

Seznámení žáků s pojmem makra, možnosti využití, praktické vytvoření makra.

VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s. Fakulta ekonomických studií katedra řízení podniku. Předmět: ŘÍZENÍ LIDSKÝCH ZDROJŮ (B-RLZ)

KLÍČE KE KVALITĚ (METODIKA II)

Oborové číslo Hodnocení - část A Hodnocení - část B Hodnocení - část A+B

VŠEOBECNÉ PODMÍNKY PLATNÉ PRO

SimOS. Jakub Doležal Radek Hlaváček Michael Očenášek Marek Reimer

Informace. Veškeré informace o probíhající výzvě (včetně materiálů ke stažení) jsou dostupné na webové stránce:

Základní škola, Staré Město, okr. Uherské Hradiště, příspěvková organizace. Komenské 1720, Staré Město, Metodika

Zadávání tiskových zakázek prostřednictvím JDF a Adobe Acrobat Professional

Tvorba webových stránek

PROŽÍVÁME, VYJADŘUJEME A ZVLÁDÁME SVÉ EMOCE

VŠEOBECNÉ PODMÍNKY PRO POSKYTOVÁNÍ VEŘEJNĚ DOSTUPNÝCH SLUŽEB ELEKTRONICKÝCH KOMUNIKACÍ PROSTŘEDNICTVÍM VEŘEJNÝCH TELEFONNÍCH AUTOMATŮ

MANDÁTNÍ SMLOUVA NA POSKYTOVÁNÍ PRÁVNÍCH SLUŽEB SOUVISEJÍCÍCH S PRODEJEM JEDNOTEK AAU

UNIFORM. Podlahové lišty. Technická příručka. Systém podlahových lišt / ztraceného bednění. Verze: CZ 12/2015

I. Všeobecná ustanovení

EXPERTNÍ POSUDEK Doc. RNDr. Martin Ouředníček, Ph.D. Stručný výtah z posudku.

Magnetic Levitation Control

Poukázky v obálkách. MOJESODEXO.CZ - Poukázky v obálkách Uživatelská příručka MOJESODEXO.CZ. Uživatelská příručka. Strana 1 / 1. Verze aplikace: 1.4.

SMLOUVA O POSKYTOVÁNÍ SOCIÁLNÍ SLUŽBY č.../2013

Všeobecné obchodní podmínky

N á v r h VYHLÁŠKA. ze dne 2015,

MEZINÁRODNÍ AUDITORSKÝ STANDARD ISA 505 EXTERNÍ KONFIRMACE OBSAH

Metodika kontroly naplněnosti pracovních míst

NUR - Interaktivní panel, D1

Pracovní návrh. VYHLÁŠKA Ministerstva práce a sociálních věcí. ze dne o hygienických požadavcích na prostory a provoz dětské skupiny do 12 dětí

PŘÍLOHA 1.6 SMLOUVY O PŘÍSTUPU K VEŘEJNÉ PEVNÉ KOMUNIKAČNÍ SÍTI LOGISTIKA KONCOVÝCH ZAŘÍZENÍ

řádově různě rostoucí rostou řádově stejně rychle dvě funkce faktor izomorfismus neorientovaných grafů souvislý graf souvislost komponenta

2. Vstup do podnikání fyzická osoba

Software IS Řízení stavebních zakázek

METODICKÉ DOPORUČENÍ Ministerstva vnitra. ze dne 17. prosince 2015

Zobrazení v rovině je předpis, který každému bodu X roviny připisuje právě jeden bod X roviny. Bod X se nazývá vzor, bod X se nazývá obraz.

Plánování v rámci ISMS

Zápis z porady obecních knihovníků okresu Náchod, která se uskutečnila v Městské knihovně v Náchodě

1.2.5 Reálná čísla I. Předpoklady:

FAKULTA INFORMATIKY A MANAGEMENTU UNIVERZITA HRADEC KRÁLOVÉ SEMESTRÁLNÍ PRÁCE. Modely operačního výzkumu 1. Studijní obor:

Soubory a databáze. Soubor označuje množinu dat, která jsou kompletní k určitému zpracování a popisují vybrané vlastnosti reálných objektů

ČÁST PÁTÁ POZEMKY V KATASTRU NEMOVITOSTÍ

Č E S K Á Š K O L N Í I N S P E K C E. Čj.: / Oblastní pracoviště č. 6 Ústí n. L. INSPEKČNÍ ZPRÁVA

ORGANIZAČNÍ ŘÁD ŠKOLY

Uplatňování nařízení o vzájemném uznávání u předmětů z drahých kovů

POWER GAMES 750 POPIS HRY

Plánování a organizace práce podle Denig-Holmsové

O metodě storytellingu a jeho využití ve školství. Obsah: co je to storytelling využití storytellingu ve školství praktické úkoly a techniky

D o h o d a. o s o u č i n n o s t i

DOBA KAMENNÁ: Styl je cíl

Etiketa v podnikání a písemném styku. Ing. Zlatko Tvrdoň

Počítače s kuriózním hardwarem. Martin Damek, 2007

Sedláčková TŘÍDA ANOTACE PLNĚNÉ VÝSTUPY

Vážené kolegyně a kolegové,

S B Í R K A O B S A H :

PRAVIDLA soutěže COOP DOBRÉ RECEPTY Jarní probuzení

PRÁCE S LISTY. kliceprozivot.cz vm.nidm.cz. Název příkladu dobré praxe. Tematická oblast (odbornost) Tvořivé činnosti přírodní materiály

DYNAMICKÉ VÝPOČTY PROGRAMEM ESA PT

Š K O L N Í Ř Á D FMŠ U Borovice

Miroslav Kunt. Srovnávací přehled terminologie archivních standardů ISAD(G), ISAAR(CPF) a české archivní legislativy

DIDAKTIKA PRAKTICKÉHO VYUČOVÁNÍ I.

6. Příklady aplikací Start/stop Pulzní start/stop. Příručka projektanta VLT AQUA Drive

Vláda nařizuje podle 133b odst. 2 zákona č. 65/1965 Sb., zákoník práce, ve znění zákona č. 155/2000 Sb.:

Cesta kolem světa za 80 dní. Cesta kolem světa pro 2-6 hráčů od 10 let od Michaela Rienecka, Kosmos 2004

Metodika testování navazujících evidencí

téma: Formuláře v MS Access

Změna č. 4 ÚPSÚ Lhota pod Libčany

a m1 a m2 a mn zobrazení. Operaci násobení u matic budeme definovat jiným způsobem.

pracovní list studenta

Autorizovaným techniků se uděluje autorizace podle 5 a 6 autorizačního zákona v těchto oborech a specializacích:

4.5.1 Magnety, magnetické pole

HERNÍ PLÁN pro provozování okamžité loterie POMÁHÁME NAŠÍ ZOO - DŽUNGLE

PRÁVNICKÉ OSOBY POJEM A KATEGORIZACE

ŘÁD UPRAVUJÍCÍ POSTUP DO DALŠÍHO ROČNÍKU

Výzva pro předložení nabídek k veřejné zakázce malého rozsahu s názvem Výměna lina

Zajištění provozní funkčnosti platebních automatů a měničů bankovek pro Fakultní nemocnici Královské Vinohrady. Zadavatel

AMEX Color - programovací prostředek pro ovládání měřidel z listu MS Excel II.

Objektově orientované databáze

Aplikace počítačů v provozu vozidel 9

Transkript:

GENERAL GAME PLAYING Marika Ivanová Seminář Herní Algoritmy, 12. 12. 2012

Obsah Koncept GGP Herní model Reprezentace znalostí Hráči (General Game Players) Řídící systém Závěr

Koncept GGP Snaha o vytvoření AI systému schopného porozumět pravidlům libovolné hry a naučit jej hrát bez zásahu člověka Oproti specializovaným programům nezávisí na algoritmech navržených pro konkrétní hry AAAI National Conference 2005: GGP Competition Samotná idea je starší: Jacque Petrat: Realization of a general game playing program (1968)

Koncept GGP AAAI Competition (http://games.stanford.edu) 2005, Stanford University 2 fáze (qualification, runoff) Hry s úplnou informací Hry jednoho hráče (bludiště) Kompetitivní hry (Tic-Tac-Toe, varianty šachu) Kooperativní prvky Později i hry s částečnou informací Odměna $10,000 pro vítěze

Koncept GGP Základní oblasti výzkumu GGP Reprezentace znalostí Prohledávání Plánování Učení Různé typy her částečná/úplná informace s/bez komunikace mezi hráči Obecně n hráčů

Herní model Uvažujeme konečné synchronní hry Končený a neměnný počet hráčů Formálně vyjádříme hru jako stavový automat: S množina stavů {r 1 r n } role ve hře n hráčů A 1 A n n množin akcí, každá množina pro roli l 1 l n legální akce ve stavu, kde l i A i S u: S A 1... A n S přechodová funkce s 1 S počáteční stav t S koncové stavy g 1,... g n kde g i S N, cílová relace

Reprezentace znalostí Potřeba formálního symbolického jazyka pro popis pravidel libovolné hry Game Description Language (GDL) vyvinut za tímto účelem Stav hry jako databáze Pravidla pro legálnost, aktualizace stavů, atd.

Reprezentace znalostí GDL je založen na jazyku Datalog Obvykle prefixová notace Proměnné začínají symbolem? Rozlišuje 9 relací: role does goal init next terminal true legal distinct

Reprezentace znalostí GDL příklad: Tic-Tac-Toe Konstanty: xplayer, oplayer hráči x, o, b značky noop tah Funkce cell(number, number, mark) buňka control(player) hráč na tahu mark(number, number) tah

Reprezentace znalostí GDL příklad: Tic-Tac-Toe Hráči (role) (role xplayer) (role oplayer) Stav hry (true) Situace na obrázku, na tahu je hráč x. (true (control xplayer)) (true (cell 1 1 x)) (true (cell 1 2 b)) (true (cell 1 3 b)) (true (cell 2 1 b)) (true (cell 2 2 o)) (true (cell 2 3 b))

Reprezentace znalostí GDL příklad: Tic-Tac-Toe Počáteční stav (init) (init (cell 1 1 b)) (init (cell 3 3 b)) (init (control xplayer)) Aktualizace stavu hry (next) Např. střídání hráče na tahu: (<= (next (control xplayer)) (true (control oplayer))) (<= (next (control oplayer)) (true (control xplayer)))

Reprezentace znalostí GDL příklad: Tic-Tac-Toe Přípustné tahy (legal) Hráč?player může hrát na pozici [?x,?y], pokud je na tahu a daná pozice zatím není obsazena (<= (legal?player (mark?x?y)) (true (cell?x?y b)) (true (control?player))) (<= (legal xplayer noop) (true (control oplayer))) (<= (legal oplayer noop) (true (control xplayer)))

Reprezentace znalostí GDL příklad: Tic-Tac-Toe Tahy (does) Označuje tah zahraný hráčem v určitém kroku V pravidlech popisujících změnu stavu hry Pokud hráč?player zahraje na [?x,?y], v příštím tahu bude tato buňka označena symbolem hráče (<= (next (cell?x?y x)) (does xplayer (mark?x?y))) Buňky, na které hráč nezahrál, zůstávají nezměněny (<= (next (cell?x?y b)) (does?player (mark?m?n)) (true (cell?x?y b)) (distinctcell?x?y?m?n)) (<= (distinctcell?x?y?m?n) (distinct?x?m)) (<= (distinctcell?x?y?m?n) (distinct?y?n))

Reprezentace znalostí GDL příklad: Tic-Tac-Toe Cílové ohodnocení (goal) Cíle hráčů mohou být opačné, asymetrické, i doplňkové Určují ohodnocení jednotlivých hráčů (<= (goal?player 100) (line?player)) Koncové stavy (terminal) Nulární relace (<= terminal (role?player) (line?player)) (<= terminal (not open))

Reprezentace znalostí Závislostní graf uzly jsou relace v hlavách a tělech klauzulí Hrana vede z p do q, pokud p se vyskytuje v těle a q v hlavě klauzule GDL restrikce Relace Výskyt závislost role Pouze v hlavě pravidla bez těla init Hlava klauzule Nezávisí na na true, legal, does, next, terminal, goal true Tělo klauzule does Tělo klauzule legal, terminal ani goal nezávisí na does next Hlava klauzule r(x,y) <= p(x,y) q(x,y) s(x,y) <= r(x,y) s(x,z) <= r(x,y) t(y,z) t(x,z) <= s(x,y) s(y,x)

Reprezentace znalostí Ukončení: nekonečná sekvence tahů dosáhne koncový stav v konečném počtu kroků Hratelnost: Každá role má v neterminálním stavu aspoň 1 přípustný tah Monotonie: každá role má právě jedno ohodnocení v dosažitelném stavu, ohodnocení neklesá Vyhratelnost: pro každou roli existuje posloupnost tahů vedoucí do koncového stavu s největším ohodnocením dané role Dobře zformovaná hra

Hráči (General Game Players) Máme nástroj pro reprezentaci stavu hry Můžeme využít tradiční prohledávací techniky (minimax, alfa-beta, ) Nabízí se doménově nezávislé heuristiky (history, transpoziční tabulky ) Problém: jakou zvolit ohodnocovací funkci? Vytvoření co nejlepšího hráče je předmětem GGP Competition

Hráči (General Game Players) Heuristika Např. čím více možných tahů, tím lépe V obecném případě je těžké najít úspěšnou heuristiku Cluneplayer (vítěz 2005) Goblin Fluxplayer (vítěz 2006) Simulace (Monte Carlo) Cadiaplayer (vítěz 2007, 2008) Ary (vítěz 2009, 2010) HyperPlay (též pro hry s neúplnou informací)

Hráči (General Game Players) Cluneplayer Snaha vytvořit heuristickou ohodnocovací funkci Využití klíčových aspektů hry Hledání důležitých výrazů, snaha o jejich interpretaci

Hráči (General Game Players) Goblin 2. místo na GGP Competition 2005 Alfa-beta Iterativní prohlubování Transpoziční tabulky Paranoid Adversarial Search Feature Extraction

Hráči (General Game Players) Goblin Paranoid Adversarial Search Minimax předpokládá 2 hráče GGP umožňuje libovolný počet hráčů Očekáváme, že se proti nám všichni spikli Generují se všechny možné kombinace tahů oponentů Varianta minimaxu proti velkému nepříteli

Hráči (General Game Players) Cadiaplayer Pro hry jednoho hráče používá variantu IDA* UCT simulace pro hry dvou a více hráčů (kooperativní i kompetitivní) Absence nutnosti doménově specifických znalostí je vhodná v GGP Překládá GDL do Prologu, samotné prohledávání v C++

Řídící systém Arcade Databáze informací o hrách, hráčích a zápasech Game editor Game manager Odpovědný za průběh jednotlivých her a zápasů Komunikace s hráči prostřednictvím HTTP Distribuce axiomů Udržování stavu hry a jeho aktualizace Kontrola přípustnosti tahů Určení vítězů Časová synchronizace (startclock, playclock)

Řídící systém

Řídící systém Před začátkem zápasu musí být specifikováno Hra známá pro systém Počet hráčů Startclock doba před zahájením hry Playclock čas na tah Dále přebírá odpovědnost Game Manager Start: (START <MATCHID> <ROLE> <DESCRIPTION> <STARTCLOCK> <PLAYCLOCK>) Play: (PLAY <MATCHID> (<A1> <A2>... <An>)) Stop: (STOP <MATCHID> (<A1> <A2>... <An>))

Řídící systém Příklad komunikace mezi GM a hráči při hře Tic- Tac-Toe

Řídící systém http://130.208.241.192/ggpserver/index.jsp

Závěr Mladé téma Široké možnosti dalšího výzkumu Význam (zatím) spíše teoreticý Užitečné v didaktice

Zdroje Genesereth, M., and Love, N. 2005. General game playing: Overview of the AAAI competition. AI Magazine 26(2) Genesereth, M., and Love, N. 2005. General game playing: Game description language specification. Technical report, Computer Science Department, Stanford University, Stanford, CA, USA. http://games.stanford.edu/gdl spec.pdf) Jim Clune. Heuristic evaluation functions for general game playing. In Proceedings of the AAAI Conference on Articial Intelligence, pages 1134{1139, 2007. Peter Kissmann and Stefan Edelkamp. Gamer, a general game playing agent. KI Lunstliche Intelligenz, 25:49{52, 2011.