Vhodné k testování AI technik protože a) není třeba množství znalostí b) snadno se měří úspěšnost (výhra/prohra)

Podobné dokumenty
2. Řešení úloh hraní her Hraní her (Teorie a algoritmy hraní her)

Hraní her. (Teorie a algoritmy hraní her) Řešení úloh hraní her. Václav Matoušek /

Algoritmy pro hraní tahových her

Hry a UI historie. von Neumann, 1944 algoritmy perfektní hry Zuse, Wiener, Shannon, přibližné vyhodnocování

Základy umělé inteligence

Varianty Monte Carlo Tree Search

Obsah: Hry Prohledávání stavového prostoru. Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

Hry a UI historie. agent musí brát v úvahu akce jiných agentů jak ovlivní jeho. vliv ostatních agentů prvek náhody. Hry: Obsah:

Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

Teorie her a ekonomické rozhodování. 4. Hry v rozvinutém tvaru

Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi. 72 studentů

Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

Karty Prší. Anotace: Abstract: Gymnázium, Praha 6, Arabská 14 předmět Programování, vyučující Tomáš Obdržálek

Hry a UI historie. Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

ŠACHOVÉ ENGINY. Semestrální práce pro předmět 4IZ430 Principy inteligentních systémů

! Kyberne(ka!a!umělá!inteligence! 8.!Hraní!dvouhráčových!her,!adversariální! prohledávání!stavového!prostoru!!!!

Hry a UI historie. Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

Gymnázium Arabská. Hra Pexeso. ročníkový projekt předmět programování vyučující Tomáš Obdržálek autor Ondřej Novák školní rok 2013/2014

Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

HRY A UI HISTORIE. Hry vs. Prohledávání stavového prostoru. Obsah:

Věk: Počet hráč Poče P et hr h áčů: Počet karet: Cíl hry: Správný set: nebo nebo Pravidla hry SNEAK PEEK

Obsah: Hry vs. Prohledávání stavového prostoru Algoritmus Minimax. Nedeterministické hry Hry s nepřesnými znalostmi

Algoritmy pro práci s neúplnou informací

Teorie her a ekonomické rozhodování. 7. Hry s neúplnou informací

Algoritmus Minimax. Tomáš Kühr. Projektový seminář 1

}w!"#$%&'()+,-./012345<ya

Úvod do teorie her

Anotace. Středník II!! programování her.

Umělá inteligence I. Roman Barták, KTIML.

TGH13 - Teorie her I.

Dokumentace programu piskvorek

INTERACTIVE GAMES 750 CZK

PLAY IT AGAIN: POPIS HRY Strana 1 z 10 PLAY IT AGAIN : POPIS HRY. Pohled na obrazovku při sázce 2

Registrační číslo projektu: CZ.1.07/1.5.00/ Název projektu: Moderní škola 21. století. Zařazení materiálu: Ověření materiálu ve výuce:

Kód: Vzdělávací materiál projektu Zlepšení podmínek výuky v ZŠ Sloup. Present simple "to have, to be"

Řešení: PŘENESVĚŽ (N, A, B, C) = přenes N disků z A na B pomocí C

Sport, sportování a hry

UPPAAL příklady. Jiří Vyskočil 2010

SEMINÁRNÍ PRÁCE Z MATEMATIKY

Prohledávání do šířky a do hloubky. Jan Hnilica Počítačové modelování 15

Internetový čtrnáctideník pro šachové nadšence hledající zábavu i poučení.

HERNÍ PLÁN SÁZKOVÉ HRY

ČTENÍ. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :

DRUHY HAZARDNÍCH HER. Vytvořeno: Odborem 34 Státní dozor nad sázkovými hrami a loteriemi 12. října 2016

====== ZAČÁTEK UKÁZKY ======

Výukový materiál zpracovaný v rámci operačního programu Vzdělávání pro konkurenceschopnost

Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49

K možnosti provozování tzv. LIVE DEALER GAMES

Škola: Střední škola obchodní, České Budějovice, Husova 9. Inovace a zkvalitnění výuky prostřednictvím ICT

LOGBOOK. Blahopřejeme, našli jste to! Nezapomeňte. Prosím vyvarujte se downtrade

Emotion Technická charakteristika

Materiál slouží k procvičení znalosti přítomného času prostého, tvorbě vět a otázek.

Chit Chat 1 - Lekce 11

POSLECH. Kate and Jim are friends. It's Thursday afternoon and they are talking about their free time activities.

S U P E R G A M E S HERNÍ PLÁN

DC circuits with a single source

Počítačové šachy. Otakar Trunda

Teorie her a ekonomické rozhodování. 2. Maticové hry

Magic Games DEV. Pro všechny herní varianty platí: Nejvyšší sázka na hru: 25 bodů Nejvyšší výhra ze hry: bodů

Úvod do teorie grafů

Číslo materiálu: VY 32 INOVACE 29/18. Číslo projektu: CZ.1.07/1.4.00/

WORKSHOP III. Téma: Bonusy, hry nad rámec HP Vytvořeno: Odborem 34 Státní dozor nad sázkovými hrami a loteriemi Praha 4.

Piškvorky. Gymnázium, Praha 6, Arabská 16. Kristofer Filip, 1.E. Květen Stránka 1. předmět programování, vyučující Tomáš Obdržálek

Geneticky vyvíjené strategie Egyptská hra SENET

Gymnázium, Praha 6, Arabská 14. předmět Programování, vyučující Tomáš Obdržálek. Počítačová hra Fotbalový Manažer. ročníkový projekt.

Project 1. My projects

Po e5 se situace znovu mění. Černý vytváří hrozby obdobné jako bílý.

Draw Poker CZK. Hra s rizikem: Po přepnutí přístroje na hru s rizikem, má hráč ze zásady možnost volit mezi dvěma typy her s rizikem.

Třídy složitosti P a NP, NP-úplnost

Alfa-beta algoritmus pro umělou inteligenci hry šachy

Zjistit, jak žáci zvládli učivo prvního pololetí. Pomůcky: Psací potřeby Zdroje: vlastní. III_2-05_54 Half term test, 6yr - řešení

Vyplácení: a) Přes Hopper v mincích 10,-- Kč. b) pomocí klíčového spínače a tlačítka VÝPLATA (Handpay - funkce)

TEORIE HER

PRAVIDLA POKERU Čtyři barvy Třináct hodnot VÝHERNÍ KOMBINACE

Metody návrhu algoritmů, příklady. IB111 Programování a algoritmizace

Školení pro místní samosprávu Téma: Hazardní hry Obecné představení hazardních her a jejich regulace Druhy her základní přehled

Magnetické šipky pravidla

Projekt: ŠKOLA RADOSTI, ŠKOLA KVALITY Registrační číslo projektu: CZ.1.07/1.4.00/ EU PENÍZE ŠKOLÁM

Herní engine. Co je Engine Hotové enginy Jemný úvod do game designu

POSLECH. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :

Cvičení Programování I. Stručné poznámky ke cvičení ze

Cvičení 1. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

Martin Milata, Pokud je alespoň jeden rozměr čokolády sudý (s výjimkou tabulky velikosti 1x2, která už je od

Problém identity instancí asociačních tříd

Cambridge International Examinations Cambridge International General Certificate of Secondary Education

TEORIE HER Meta hry PŘEDNÁŠKA. OPTIMALIZACE A ROZHODOVÁNÍ V DOPRAVĚ část druhá Přednáška 4. Zuzana Bělinová

UČENÍ BEZ UČITELE. Václav Hlaváč

Ocean Tale 2 HERNÍ PLÁN NÁVOD PRO HRU

B) EX = 0,5, C) EX = 1, F) nemáme dostatek informací.

Abstrakt. V příspěvku se budeme zabývat kombinatorickými hrami s úplnou informací

Chit Chat 2 - Lekce 1

Gymnázium, Brno, Slovanské nám. 7 WORKBOOK. Mathematics. Teacher: Student:

Pravidla vybraných deskových her pro potřeby předmětů Projektový seminář 1 a 2 v roce 2011/2012. Tomáš Kühr

Obsah herní sady: 40x dřevěný kámen hrací deska návod

Admiral Lions CZK. Struktura:

Kredit: aktuální stav kreditu, zde jsou zobrazeny hodnoty všech vhozených mincí a vložených bankovek

Šachy, vrhcáby (backgammon) & dáma

Transkript:

Počítačové hry Vymezení oblasti zájmu akční (FPS: Doom, Quake, Unreal) simlulace (SimCity, The Sims, Creatures) RTS (Dune II, WarCraft, C&C) deskové logické hry klasické (šachy, piškvorky) hazardní karetní (poker, bridge, Guess it) Vhodné k testování AI technik protože a) není třeba množství znalostí b) snadno se měří úspěšnost (výhra/prohra) Klíčové otázky: 1. Je nalezené řešení dobré? lib. řešení (lze použít heuristiku) nejlepší (prohledat celý prostor) 2. Mohu "vrátit" tah? ano (osmička) ne (šachy) 3. Je "jistý" vstup? ano (šachy) ne (poker)

Klasické deskové logické hry Základem je PROBLEM SOLVING snažíme se dostat z počátečního stavu do cílového (např. mat) za použití pravidel. Významný rozdíl je v tom, že hráči mají rozdílné úkoly. Cílem jednoho je maximalizovat ohodnocující funkci, zatímco cílem druhého je minimalizovat jí. Potřebujeme: kvalitní generátor (kvalitních) stavů kvalitní funkci ohodnocující stavy ty nejlepší najít a expandovat nejdříve (kvůli alfa beta prořezávání viz dále) tj. implementovat heuristické prvky do těchto funkcí Pozn.: 1) Nutno umět obětovat levé křídlo 2) Šachy 40 možností tahu a 40 tahů každého hráče 40 80 stavů k kompletním stromu řešení. Přesněji to je 1,5x10 128. Stojí za to porovnat toto číslo s počtem částic ve vesmíru 3,2x10 78 a se stářím vesmíru 419 bilionů let 3) A těch zrnek bylo 18446744073709551615 ;-). 4) AI pro go, ktere porazi profesionala -> 1 mil. USD

Kromě hledání i jiné techniky: knihovna zahájení a koncovek rozpoznávání vzorů (šablon) Typické rysy počítačové hry silný v komplikovaných situacích s množstvím kombinací obrovská znalost zahájení a koncovek nevnímá hluk, stress a psychický tlak tvrdá hra proti soupeři bez fantazie, "překvapen" originálními tahy malá nebo žádná znalost strategie, díky efektu horizontu neodhalí plán na mnoho kol dopředu obvykle zaměřen na materiální výhodu neobětuje figuru či pozici, pokud se to brzy nevyplatí Známé vítězné strategie U řady jednoduchých her je znám deterministický postup, jak vyhrát. Naprogramovat ho je z našeho pohledu nuda stačí se podívat do tabulky nebo spočítat vzoreček.

MIN MAX Odebírání zápalek Máme n hromádek a na každé z nich je určitý počet žetonů. Hraje se na tahy. Tah je odstranění jednoho nebo více žetonů z libovolné hromádky. Hráč, který odstraní poslední žeton prohrává. Příklad je pro dvě hromádky se 2mi a 3mi žetony.

1) Označíme listy podle výhodnosti pro prvního hráče (čtverec) je-li list čtverec, první hráč vyhrál. 2) Označení vnitřních uzlů: první hráč maximalizuje zisk, druhý minimalizuje. Není vždy možné dostat se až k listům je třeba vyrobit ohodnocující funkci: Př.: TicTacToe: #x - #o... # - počet linií s x (o), kde lze dodělat trojici

Alfa-beta prořezávání Dovoluje vynechat z prohledávání řadu uzlů rychlejší prohledávání možnost prohledat strom do větší hloubky (např. v šachách o tři půltahy).

Vyhodnocování stavů počet zajatců... figura vs. pěšec (1,3,3.5,5,9,1000), ale materiál není všechno nutnost klidového stavu, jinak materiál není věrohodný mobility ratio = míra manévrovací schopnosti, kterou nám přinese nový stav (součet legálních tahů) pozice (celková konfigurace, otevřenost...) další kriteria závislé na hře, pro šachy například: bezpečnost (a statika) krále, aktivní vliv dámy a silných figur, čas vyvedení dámy, dobrá forma pěšců... celkem asi 20 30 kriterií poziční kritéria se vyjadřují v jednotkách jednoho pěšce zřídka se pozice hodnotí lépe než i jen jediný pěšec Praktické tipy Rozpracované situace ukládat do "cache". Program může počítat i při tahu člověka (permanent brain) Knihovna zahájení a koncovek (nutnost "minmaxovat" celou knihovnu) hašovací tabulky (ignorace synonym, prázdná šachovnice, opakující se tahy)

Hrát jako člověk Velmistři uvažují jen jeden či dva tahy, a asi 35 pokračování. Odhad situace "průchod kavárnou", zapamatování si reálné pozice, ale ne smyšlené (analogie se slovy vs. shluky písmen), příklad Šachy na PC str. 62 Vynikající goisté a šachisté mají "slovník" ± 50000 konfigurací, a schopnost práce s funkčními relacemi, ovšem nejsou schopni vysvětlit, jak uvažují :-(. "Chtěl bych všechny zainteresované informovat o tom, že 90% toho, co o šachu vím, se zásadně nedá použít v programu." David Levy "do nothing but do it well", uzavřené pozice a trapas s opomenutím nastavení "faktoru podceňování" po restartu Cray za 20 milionů prohrál s Belle za 20 tisíc Historie: baron Kempelen (1769): "Turek" prohrál s ním mj. Napoleon Torresův (1890): mech. pohyb a elmg. Relé, koncovka král vs. král a věž Turing (1939/1952): "Papírový stroj" Shannon (1949): "Strategie B" (klidové stavy, předběžný výběr, dnešní praxe) Los Almos (1956): Maniac I (von Neumannova arch., 6x6 polí, první prohra Deep Thought (pět studentů), Deep Thought II (IBM), Deep Blue (1997): Deep Blue vs. Kasparov

Náhoda a blufování Problém je zřejmý nemáme úplnou informaci o hře a tedy nemůžeme najít 100% nejlepší tah musíme se s tím vypořádat použitím pravděpodobností. Ty zjistíme buď podrobnou analýzou úlohy (to je hotové pro poker, Black Jack... a nebo trénováním a optimalizací). Např. pro poker existují přesné instrukce, kdy přihazovat a kdy složit karty podle toho co dělají vaši spoluhráči, jaká je sázka, kolikátý jste v řadě, jak se dnes večer blufuje a jaké máte draw. Výhody počítače:1) netrápí ho případná fatální prohra 2) hraje a blafuje opravdu náhodně (člověk je mizerný randomizer) 3) dokáže detekovat vaše vzorce chování 4) real poker face Poznámky: 1) BlackJack a kasina 2) Lidé, když vyhrávají, blufují častěji.

Optimální strategie pro hru "Guess it" Mám blafovat? Blafuje soupeř? *\** 1 2 3 4 5 1 2 3 4 5 *\** 1 3 4 5 33 50 50 56 58 1 50 50 41 38 33 26 33 37 40 43 2 33 33 28 25 22 19 26 29 31 33 3 38 32 27 24 21 16 21 23 25 27 4 32 30 26 23 21 12 17 19 21 22 5 32 29 25 23 21 * Počet karet, které má v ruce soupeř ** Počet karet, které mám v ruce já The rules: Eleven cards are taken from the pack, usually all aces, kings and queens except one. The eleven cards are shuffled. One card is chosen, its identity unknown to both players, and put aside. To win the game a player must correctly name this card. The remaining cards are dealt, five to each players. The players now take turns. At each turn a player may either guess the hidden card (winning if he is correct, losing if he is incorrect) or aks the opponent if he has a certain card in his hand. If the opponent has the card demanded he must respond truthfully and place it, face up, in front of him. If the opponent does not have the card he replies NO. No card can be asked for twice. Irrespective of the answer it is then the opponents turn to guess or ask.

Zdánlivě jiný přístup, než řešení stromem Každý bod na který lze táhnout se ohodnotí počtem bodů podle jeho výhodnosti. Např pro piškvorky: sousedí bod se soupeřovou značkou +1 sousedí bod s mojí značkou +2 je bod pokračováním dvojice mých značek +4 je bod pokračováním volné trojice mých značek +10 je bod pokračováním čtveřice mých značek +50 je bod pokračováním volné trojice soupeřových značek +20 je bod pokračováním čtveřice soupeřových značek +40 atd. Čím jsme končili v roce 2001: Jak je to s AI ve WarCraftu a ostatních hrách z prvního slidu? to bych taky rád věděl, ale evidentně nic moc :-) 5 minut povídání ze kterého vyplyne, že to jde vždy expertní systém bastl