Alternativní metody prohledávání stavového prostoru. Gerstner Laboratory Agent Technology Group, Czech Technical University in Prague

Podobné dokumenty
Evoluční algoritmy. Podmínka zastavení počet iterací kvalita nejlepšího jedince v populaci změna kvality nejlepšího jedince mezi iteracemi

Heuristické řešení problémů. Seminář APS Tomáš Müller

Obsah: CLP Constraint Logic Programming. u odpovědí typu A, B, C, D, E: jako 0)

Transportation Problem

Evolučníalgoritmy. Dále rozšiřována, zde uvedeme notaci a algoritmy vznikléna katedře mechaniky, Fakulty stavební ČVUT. Moderní metody optimalizace 1

Programování. s omezujícími podmínkami. SAT a lokáln. Algoritmus GSAT. Algoritmus GSAT. Roman Barták

u odpovědí typu A, B, C, D, E: Obsah: jako 0) CLP Constraint Logic Programming

Dynamic programming. Optimal binary search tree

Neinformované metody prohledávání stavového prostoru. Gerstner Laboratory Agent Technology Group, Czech Technical University in Prague

Chapter 7: Process Synchronization

Compression of a Dictionary

2. Řešení úloh hraní her Hraní her (Teorie a algoritmy hraní her)

Hraní her. (Teorie a algoritmy hraní her) Řešení úloh hraní her. Václav Matoušek /

DC circuits with a single source

Gymnázium, Brno, Slovanské nám. 7 WORKBOOK. Mathematics. Teacher: Student:

PŘEDNÁŠKA 03 OPTIMALIZAČNÍ METODY Optimization methods

EXACT DS OFFICE. The best lens for office work

Úvod do stochastických optimalizačních metod (metaheuristik) Moderní metody optimalizace 1

Umělá inteligence I. Roman Barták, KTIML.

Optimalizace & soft omezení: algoritmy

Nová éra diskových polí IBM Enterprise diskové pole s nízkým TCO! Simon Podepřel, Storage Sales

Programování. s omezujícími podmínkami. Roman Barták. roman.bartak@mff.cuni.cz

Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost.

GUIDELINES FOR CONNECTION TO FTP SERVER TO TRANSFER PRINTING DATA

State Space Search Step Run Editace úloh Task1 Task2 Init Clear Node Goal Add Shift Remove Add Node Goal Node Shift Remove, Add Node

Database systems. Normal forms

ITC2007 Solver Description:

Czech Republic. EDUCAnet. Střední odborná škola Pardubice, s.r.o.

Využití hybridní metody vícekriteriálního rozhodování za nejistoty. Michal Koláček, Markéta Matulová

Základní pojmy I. EVOLUCE

Introduction to MS Dynamics NAV

MC Tlumiče (řízení pohybu) MC Damper

Next line show use of paragraf symbol. It should be kept with the following number. Jak může státní zástupce věc odložit zmiňuje 159a.

Distribuované systémy a výpočty

Navrženy v 60. letech jako experimentální optimalizační metoda. Velice rychlá s dobrou podporou teorie

Převod prostorových dat katastru nemovitostí do formátu shapefile

Social Media a firemní komunikace

ALGORITMIZACE 2010/03 STROMY, BINÁRNÍ STROMY VZTAH STROMŮ A REKURZE ZÁSOBNÍK IMPLEMENTUJE REKURZI PROHLEDÁVÁNÍ S NÁVRATEM (BACKTRACK)

ČVUT FEL X36PAA - Problémy a algoritmy. 5. úloha - Seznámení se se zvolenou pokročilou iterativní metodou na problému batohu

2. Entity, Architecture, Process

NATIONAL ASSESSMENT FRAMEWORK FOR LANGUAGES AT SENIOR SECONDARY LEVEL 2001 CZECH EXTENDED LEVEL PAPER 1: PROCESSING SPOKEN INFORMATION


Umělá inteligence I. Roman Barták, KTIML.

Genetické programování

Jak se matematika poučila v biologii

RNDr. Jakub Lokoč, Ph.D. RNDr. Michal Kopecký, Ph.D. Katedra softwarového inženýrství Matematicko-Fyzikální fakulta Univerzita Karlova v Praze

Aplikace matematiky. Dana Lauerová A note to the theory of periodic solutions of a parabolic equation

Enabling Intelligent Buildings via Smart Sensor Network & Smart Lighting

2N Voice Alarm Station

SPECIFICATION FOR ALDER LED

Metaheuristiky s populacemi

Metody návrhu algoritmů, příklady. IB111 Programování a algoritmizace

Databázové systémy II. KIV/DB2 LS 2007/2008. Zadání semestrální práce

Semestrální práce z předmětu. Jan Bařtipán / A03043 bartipan@studentes.zcu.cz

PRAVIDLA ZPRACOVÁNÍ STANDARDNÍCH ELEKTRONICKÝCH ZAHRANIČNÍCH PLATEBNÍCH PŘÍKAZŮ STANDARD ELECTRONIC FOREIGN PAYMENT ORDERS PROCESSING RULES

Vraťme se k základům: DFS = Depth First Search

WORKSHEET 1: LINEAR EQUATION 1

1. Maple - verze. 2. Maple - prostredi. Document Mode vs. Worksheet Mode

2) Napište algoritmus pro vložení položky na konec dvousměrného seznamu. 3) Napište algoritmus pro vyhledání položky v binárním stromu.

Škola: Střední škola obchodní, České Budějovice, Husova 9. Inovace a zkvalitnění výuky prostřednictvím ICT

Cambridge International Examinations Cambridge International General Certificate of Secondary Education

PART 2 - SPECIAL WHOLESALE OFFER OF PLANTS SPRING 2016 NEWS MAY 2016 SUCCULENT SPECIAL WHOLESALE ASSORTMENT

2011 Jan Janoušek BI-PJP. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Problém identity instancí asociačních tříd

(

x86 assembler and inline assembler in GCC

Bioinformatika a výpočetní biologie. KFC/BIN VII. Fylogenetická analýza

POSLECH. Cinema or TV tonight (a dialogue between Susan and David about their plans for tonight)

Gramatická evoluce a softwarový projekt AGE

Genetické algoritmy. Informační a komunikační technologie ve zdravotnictví

ZÁPADOČESKÁ UNIVERZITA V PLZNI FAKULTA STROJNÍ BAKALÁŘSKÁ PRÁCE. 2016/2017 Monika Knolová

LED STANDARD 12V GU4, GU5.3, G53

PL/SQL. Jazyk SQL je jazykem deklarativním, který neobsahuje procedurální příkazy jako jsou cykly, podmínky, procedury, funkce, atd.

Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49

obal manuálu, asi něco podobného jako u LC 100 asi by to chtělo lepší obrázek!!! FYTOSCOPE FS130 Instruction Guide

User manual SŘHV Online WEB interface for CUSTOMERS June 2017 version 14 VÍTKOVICE STEEL, a.s. vitkovicesteel.com

Radiova meteoricka detekc nı stanice RMDS01A

PRODEJNÍ EAUKCE A JEJICH ROSTOUCÍ SEX-APPEAL SELLING EAUCTIONS AND THEIR GROWING APPEAL

DATA SHEET. BC516 PNP Darlington transistor. technický list DISCRETE SEMICONDUCTORS Apr 23. Product specification Supersedes data of 1997 Apr 16

Programování. s omezujícími podmínkami. Roman Barták. rová hranová konzistence

UPM3 Hybrid Návod na ovládání Čerpadlo UPM3 Hybrid 2-5 Instruction Manual UPM3 Hybrid Circulation Pump 6-9

AIC ČESKÁ REPUBLIKA CZECH REPUBLIC

Základy teorie front III

Cambridge International Examinations Cambridge International General Certificate of Secondary Education

USING VIDEO IN PRE-SET AND IN-SET TEACHER TRAINING

PITSTOP VY_22_INOVACE_26

Cambridge International Examinations Cambridge International General Certificate of Secondary Education

Úvod do optimalizace, metody hladké optimalizace

MySQL sežere vaše data

PG 9.5 novinky ve vývoji aplikací

Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma

VYSOKÁ ŠKOLA HOTELOVÁ V PRAZE 8, SPOL. S R. O.

Configuration vs. Conformation. Configuration: Covalent bonds must be broken. Two kinds of isomers to consider

Litosil - application

Travelling Rules for Inbounds in District 2240 Czechia and Slovakia

Škola: Střední škola obchodní, České Budějovice, Husova 9. Inovace a zkvalitnění výuky prostřednictvím ICT

Theme 6. Money Grammar: word order; questions

Air Quality Improvement Plans 2019 update Analytical part. Ondřej Vlček, Jana Ďoubalová, Zdeňka Chromcová, Hana Škáchová

II_ _Listening Pracovní list č. 2.doc II_ _Listening Pracovní list č. 3.doc II_ _Listening Řešení 1,2.doc

Energy vstupuje na trh veterinárních produktů Energy enters the market of veterinary products

Transkript:

Alternativní metody prohledávání stavového prostoru Michal Pěchouček Gerstner Laboratory Agent Technology Group, Czech Technical University in Prague http://labe.felk.cvut.cz/~pechouc/kui/3.pdf

palternativní metody prohledávání stavového prostoru Neinformované optimalizační metody: náhodně restartovaný hill climbing local beam search simulované žíhání genetické algoritmy constrain satisfaction /Úvod

phill climbing Example: n-queens Put n queens on an n n board with no two queens on the same row, column, or diagonal Move a queen to reduce number of conflicts h = 5 h = 2 h = 0 Almost always solves n-queens problems almost instantaneously for very large n, e.g., n = 1million Chapter 4, Sections 3 4 5 /Úvod

phill climbing Hill-climbing (or gradient ascent/descent) Like climbing Everest in thick fog with amnesia function Hill-Climbing( problem) returns a state that is a local maximum inputs: problem, a problem local variables: current, a node neighbor, a node current Make-Node(Initial-State[problem]) loop do neighbor a highest-valued successor of current if Value[neighbor] Value[current] then return State[current] current neighbor end Chapter 4, Sections 3 4 6 /Úvod

phill climbing Hill-climbing contd. Useful to consider state space landscape objective function global maximum shoulder local maximum "flat" local maximum current state state space Random-restart hill climbing overcomes local maxima trivially complete Random sideways moves escape from shoulders loop on flat maxima /Úvod Chapter 4, Sections 3 4 7

phill climbing náhodně restartovaný hill climbing - opakuje algoritmus s náhodnými počátečními stavy /Úvod

phill climbing náhodně restartovaný hill climbing - opakuje algoritmus s náhodnými počátečními stavy pro pravděpodobnost nalezení optima p potřebujeme 1/p restartů pro problém 8 královen, kde p 0.14 potřebujeme 7 iterací /Úvod

phill climbing náhodně restartovaný hill climbing - opakuje algoritmus s náhodnými počátečními stavy local beam search - pracuje s k stavy a každém kroku s k nejlepšímy následníky /Úvod

psimulované žíhání Simulated annealing hlavní myšlenka: vymanit se z lokálního optima tím že se povolá zkhoršující tahy ale s postupně Idea: escape se snižující local frekvencí maximaa by velikostí allowing some bad moves but gradually decrease their size and frequency function Simulated-Annealing( problem, schedule) returns a solution state inputs: problem, a problem schedule, a mapping from time to temperature local variables: current, a node next, a node T, a temperature controlling prob. of downward steps current Make-Node(Initial-State[problem]) for t 1 to do T schedule[t] if T = 0 then return current next a randomly selected successor of current E Value[next] Value[current] if E > 0 then current next else current next only with probability e E/T Chapter 4, Sections 3 4 8 /Úvod

pevoluční výpočty Genetické algoritmy, genetické programování a další evoluční strategie jsou často řazeny (mylně) do kategorie metod konnekcionismu. Jedná se však o netradiční metody umělé inteligence. Souhrnně se řadí s neuronovými sítěmi do kategorie metod zvaných softcomputing. Genetické algoritmy představuji speciální prohledávací technologii, která je založena na náhodné generaci většího množství stavů, jejich následné masivní evoluci. každý stav je reprezentován jako chromozóm (klasicky jako binární vektor, lze však i celočíselný vektor, matice, strom,...) každý chromozóm je ohodnocen tzv. fitness funkcí pouze kvalitní chromozómy mají šanci přežít do další generace v dlouhodobém horizontu stoupá průměrná hodnota fitness a nekvalitní chromozómy vymírají /Úvod

pevoluční výpočty The Effect of Parallelism J. Kubalík, Gerstner Laboratory for Intelligent Decision Making and Control /Úvod

pstandartní GA t=0 Initialize P(t) while (not termination-condition) do begin Evaluate P(t) t=t+1 Select P(t) from P(t-1) Recombine end /Úvod

pvýběr (selection) Roulette Wheel Selection J. Kubalík, Gerstner Laboratory for Intelligent Decision Making and Control /Úvod

Crossover pmutace aprovides křížení random (recombination) information exchange - works on couples of individuals Simple 1-point crossover Mutation Mutation - preserves population diversity works on single individual J. Kubalík, Gerstner Laboratory for Intelligent Decision Making and Control J. Kubalík, Gerstner Laboratory for Intelligent Decision Making and Control /Úvod

pmutace a křížení (recombination) Genetic algorithms contd. GAs require states encoded as strings (GPs use programs) Crossover helps iff substrings are meaningful components + = GAs evolution: e.g., real genes encode replication machinery! Chapter 4, Sections 3 4 12 /Úvod

pmutace a křížení (recombination) Genetic algorithms = stochastic local beam search + generate successors from pairs of states 24748552 24 31% 32752411 32748552 32748152 32752411 23 29% 24748552 24752411 24752411 24415124 20 26% 32752411 32752124 32252124 32543213 11 14% 24415124 24415411 24415417 Fitness Selection Pairs Cross Over Mutation Chapter 4, Sections 3 4 11 /Úvod

pconstrain Satisfaction Problem řešení problému s omezujícími podmínkami /Úvod

pconstrain Satisfaction Problem řešení problému s omezujícími podmínkami rozšíření pojetí stavu z klasických prohledávacích algoritmů: libovolná datová struktura, která umožňje goal-test, eval a next na /Úvod

pconstrain Satisfaction Problem řešení problému s omezujícími podmínkami rozšíření pojetí stavu z klasických prohledávacích algoritmů: libovolná datová struktura, která umožňje goal-test, eval a next na stav jako proměnnou X i, která nabývá hodnot s domény D i. /Úvod

pconstrain Satisfaction Problem řešení problému s omezujícími podmínkami rozšíření pojetí stavu z klasických prohledávacích algoritmů: libovolná datová struktura, která umožňje goal-test, eval a next na stav jako proměnnou X i, která nabývá hodnot s domény D i. goal-test je pak soubor omezujících podmínek specifikující možné kombinace hodnot daných proměnných /Úvod

pconstrain Satisfaction Problem Example: Map-Coloring Western Australia Northern Territory South Australia Queensland New South Wales Victoria Tasmania Variables WA, NT, Q, NSW, V, SA, T Domains D i = {red,green,blue} Constraints: adjacent regions must have different colors e.g., WA NT (if the language allows this), or (WA, NT) {(red,green), (red,blue), (green,red), (green,blue),...} Chapter 5 4 /Úvod

pconstrain Satisfaction Problem Example: Map-Coloring contd. Western Australia Northern Territory South Australia Queensland New South Wales Victoria Tasmania Solutions are assignments satisfying all constraints, e.g., {WA =red,nt = green,q=red,nsw =green,v = red,sa = blue,t = green} Chapter 5 5 /Úvod

pconstrain Satisfaction Problem Example: Cryptarithmetic T W O + T W O F O U R F T U W R O X 3 X 2 X 1 Variables: F T U W R O X 1 X 2 X 3 Domains: {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} Constraints alldiff(f, T,U,W, R, O) O + O = R + 10 X 1, etc. Chapter 5 9 /Úvod

pconstrain Satisfaction Problem Backtracking search function Backtracking-Search(csp) returns solution/failure return Recursive-Backtracking({ }, csp) function Recursive-Backtracking(assignment, csp) returns soln/failure if assignment is complete then return assignment var Select-Unassigned-Variable(Variables[csp], assignment, csp) for each value in Order-Domain-Values(var, assignment, csp) do if value is consistent with assignment given Constraints[csp] then add {var = value} to assignment result Recursive-Backtracking(assignment, csp) if result failure then return result remove {var = value} from assignment return failure Chapter 5 13 /Úvod

pconstrain Satisfaction Problem Backtracking example Chapter 5 14 /Úvod

pconstrain Satisfaction Problem Backtracking example Chapter 5 17 /Úvod

pconstrain Satisfaction Problem Backtracking example Chapter 5 17 /Úvod

pconstrain Satisfaction Problem Backtracking example Chapter 5 17 /Úvod

pjak zlepšit efektivitu CSP? /Úvod

pjak zlepšit efektivitu CSP? 1. kterou proměnnou první nasytit? /Úvod

pjak zlepšit efektivitu CSP? 1. kterou proměnnou první nasytit? Minimum Remaining Value heuristic (MRV), vybereme takovou proměnnou, která nejvíce omezuje zbylé proměnné /Úvod

pjak zlepšit efektivitu CSP? 1. kterou proměnnou první nasytit? Minimum Remaining Value heuristic (MRV), vybereme takovou proměnnou, která nejvíce omezuje zbylé proměnné 2. v jakém pořadí zkusit hodnot? /Úvod

pjak zlepšit efektivitu CSP? 1. kterou proměnnou první nasytit? Minimum Remaining Value heuristic (MRV), vybereme takovou proměnnou, která nejvíce omezuje zbylé proměnné 2. v jakém pořadí zkusit hodnot? Least Constraining Value heuristic (LCV), vybereme takovou hodnotu, která nejméně omezí hodnoty pro zbylé proměnné /Úvod

pjak zlepšit efektivitu CSP? 1. kterou proměnnou první nasytit? Minimum Remaining Value heuristic (MRV), vybereme takovou proměnnou, která nejvíce omezuje zbylé proměnné 2. v jakém pořadí zkusit hodnot? Least Constraining Value heuristic (LCV), vybereme takovou hodnotu, která nejméně omezí hodnoty pro zbylé proměnné 3. můžeme dopředu odhadnout spor? /Úvod

pjak zlepšit efektivitu CSP? 1. kterou proměnnou první nasytit? Minimum Remaining Value heuristic (MRV), vybereme takovou proměnnou, která nejvíce omezuje zbylé proměnné 2. v jakém pořadí zkusit hodnot? Least Constraining Value heuristic (LCV), vybereme takovou hodnotu, která nejméně omezí hodnoty pro zbylé proměnné 3. můžeme dopředu odhadnout spor? Forward Checking udržuje znalost o zbylých možných hodnotách pro nepřiřazené proměnné /Úvod

pjak zlepšit efektivituforward CSP? checking Idea: Keep track of remaining legal values for unassigned variables Terminate search when any variable has no legal values WA NT Q NSW V SA T Chapter 5 22 /Úvod

pjak zlepšit efektivituforward CSP? checking Idea: Keep track of remaining legal values for unassigned variables Terminate search when any variable has no legal values WA NT Q NSW V SA T Chapter 5 23 /Úvod

pjak zlepšit efektivituforward CSP? checking Idea: Keep track of remaining legal values for unassigned variables Terminate search when any variable has no legal values WA NT Q NSW V SA T Chapter 5 24 /Úvod

pjak zlepšit efektivituforward CSP? checking Idea: Keep track of remaining legal values for unassigned variables Terminate search when any variable has no legal values WA NT Q NSW V SA T Chapter 5 25 /Úvod

pjak zlepšit efektivitu CSP? Constraint propagation Forward checking propagates information from assigned to unassigned variables, but doesn t provide early detection for all Řešení: failures: WA NT Q NSW V SA T NT and SA cannot both be blue! Constraint propagation repeatedly enforces constraints locally Chapter /Úvod 5 26

pjak zlepšit efektivitu CSP? Constraint propagation Forward checking propagates information from assigned to unassigned variables, but doesn t provide early detection for all Řešení: failures: WA NT Q NSW V SA T NT and SA cannot both be blue! Porovnání: Constraint problem propagation backtracking repeatedly BT+MRV enforces Forward Checking constraints FC+MRV locally MAP (US) (>1,000k) (>1,000k) 2k 60 nquueens(2-50) (>40,000k) 13,500k (>40,000k) 817k Chapter /Úvod 5 26