Emergence chování robotických agentů: neuroevoluce



Podobné dokumenty
Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma

Genetické algoritmy. Informační a komunikační technologie ve zdravotnictví

Jak se matematika poučila v biologii

Úvod do optimalizace, metody hladké optimalizace

Využití neuronové sítě pro identifikaci realného systému

Rozpoznávání písmen. Jiří Šejnoha Rudolf Kadlec (c) 2005

Vytěžování znalostí z dat

2. RBF neuronové sítě

Evoluční algoritmy. Podmínka zastavení počet iterací kvalita nejlepšího jedince v populaci změna kvality nejlepšího jedince mezi iteracemi

Přírodou inspirované metody umělé inteligence

Testování neuronových sítí pro prostorovou interpolaci v softwaru GRASS GIS

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Evoluční výpočetní techniky (EVT)

Algoritmy a struktury neuropočítačů ASN - P11

Algoritmy a struktury neuropočítačů ASN P4. Vícevrstvé sítě dopředné a Elmanovy MLNN s učením zpětného šíření chyby

Evoluční algoritmy a umělý život

Architektura - struktura sítě výkonných prvků, jejich vzájemné propojení.

3. Vícevrstvé dopředné sítě

Umělé neuronové sítě

NG C Implementace plně rekurentní

Úvod Příklad Výpočty a grafické znázornění. Filip Habr. České vysoké učení technické v Praze Fakulta jaderná a fyzikálně inženýrská

Rosenblattův perceptron

NEURONOVÉ SÍTĚ A EVOLUČNÍ ALGORITMY NEURAL NETWORKS AND EVOLUTIONARY ALGORITHMS

ÚKOLOVÝ LIST. Aktivita projektu Obloha na dlani - Laboratoř vědomostí ROBOT NA PÁSOVÉM PODVOZKU

TECHNICKÁ UNIVERZITA V LIBERCI


ití empirických modelů při i optimalizaci procesu mokré granulace léčivl ková SVK ÚOT

Zápočtový projekt předmětu Robotizace a řízení procesů

Využití metod strojového učení v bioinformatice David Hoksza

Popis zobrazení pomocí fuzzy logiky

Fiala P., Karhan P., Ptáček J. Oddělení lékařské fyziky a radiační ochrany Fakultní nemocnice Olomouc

5. Umělé neuronové sítě. Neuronové sítě

Zpětnovazební učení Michaela Walterová Jednoocí slepým,

ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT. Institut biostatistiky a analýz

UITS / ISY. Ústav inteligentních systémů Fakulta informačních technologií VUT v Brně. ISY: Výzkumná skupina inteligentních systémů 1 / 14

PREDIKCE VÝROBY FV SYSTÉMŮ

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

Použití technik UI v algoritmickém obchodování II

Seminář z umělé inteligence. Otakar Trunda

Neuronové sítě Ladislav Horký Karel Břinda

Ambasadoři přírodovědných a technických oborů. Ing. Michal Řepka Březen - duben 2013

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

5. Umělé neuronové sítě. neuronové sítě. Umělé Ondřej Valenta, Václav Matoušek. 5-1 Umělá inteligence a rozpoznávání, LS 2015

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Státnice odborné č. 20

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář,

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Masarykova univerzita. Fakulta informatiky. Evoluce pohybu

Umělá inteligence a rozpoznávání

Neuronové sítě. 1 Úvod. 2 Historie. 3 Modely neuronu

Pokročilé operace s obrazem

K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami. Josef Keder

Národní informační středisko pro podporu kvality

Úvod do mobilní robotiky AIL028

Moderní systémy pro získávání znalostí z informací a dat

Obsah. Obsah. Předmluva Úvod Část I: Genetické algoritmy Genetický algoritmus krok za krokem...19

PV021: Neuronové sítě. Tomáš Brázdil

Robotika. Reaktivní agenty (nová AI) Deliberativní agenty (klasická AI)

Ukázka knihy z internetového knihkupectví

Neuronové sítě AIL002. Iveta Mrázová 1 František Mráz 2. Neuronové sítě. 1 Katedra softwarového inženýrství. 2 Kabinet software a výuky informatiky

Obsah. Obsah. Předmluva Úvod Část I: Genetické algoritmy Genetický algoritmus krok za krokem...19

Algoritmy a struktury neuropočítačů ASN - P1

Teorie (ještě teoretičtější)

Trénování sítě pomocí učení s učitelem

Gramatická evoluce a softwarový projekt AGE

Neuronové sítě v DPZ

LOKALIZACE ZDROJŮ AE NEURONOVÝMI SÍTĚMI NEZÁVISLE NA ZMĚNÁCH MATERIÁLU A MĚŘÍTKA

Lekce 11 Měření vzdálenosti a rychlosti

FAKULTA STROJNÍHO INŽENÝRSTVÍ ÚSTAV AUTOMATIZACE A INFORMATIKY

Navrženy v 60. letech jako experimentální optimalizační metoda. Velice rychlá s dobrou podporou teorie

NP-ÚPLNÉ PROBLÉMY. Doc. RNDr. Josef Kolář, CSc. Katedra teoretické informatiky, FIT České vysoké učení technické v Praze

Genetické algoritmy a jejich praktické využití

Univerzita Karlova v Praze Matematicko-fyzikální fakulta. Diplomová práce. Pracovní verze. Jan Kratochvíl. Systém na vývoj robotů s vizuálním vnímáním

Neuronové sítě Učení bipolárního perceptronu

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Kalibrační proces ve 3D

Umělá inteligence aneb co už není sci -fi

Struktury a vazebné energie iontových klastrů helia

State Space Search Step Run Editace úloh Task1 Task2 Init Clear Node Goal Add Shift Remove Add Node Goal Node Shift Remove, Add Node

Už bylo: Učení bez učitele (unsupervised learning) Kompetitivní modely

Analytické metody v motorsportu

ŘEŠENÍ PROJEKTOVÝCH ÚLOH S MODELOVÁNÍM A SIMULACÍ ZAŘÍZENÍ A PROCESŮ VE VÝUCE

Biologicky inspirované výpočty. Schématické rozdělení problematiky a výuky

Automatizační a měřicí technika (B-AMT)

Hardy-Weinbergův zákon - cvičení

OSA. maximalizace minimalizace 1/22

Učící se klasifikátory obrazu v průmyslu

Václav Matoušek KIV. Umělá inteligence a rozpoznávání. Václav Matoušek / KIV

Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE. Antonín Wimberský. Katedra softwarového inženýrství

IBM SPSS Neural Networks

Modelové řešení revitalizace průmyslových regionů a území po těžbě uhlí na příkladu Podkrušnohoří

Třídy složitosti P a NP, NP-úplnost

1. Úvod do genetických algoritmů (GA)

Agent pracující v částečně pozorovatelném prostředí udržuje na základě senzorického modelu odhaduje, jak se svět může vyvíjet.

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

GENETICKÝ NÁVRH KLASIFIKÁTORU S VYUŽITÍM NEURONOVÝCH SÍTÍ NEURAL NETWORKS CLASSIFIER DESIGN USING GENETIC ALGORITHM

PV021 Vícevrstvá neuronová síť pro rozeznávání mikroteček. Matúš Goljer, Maroš Kucbel, Michal Novotný, Karel Štěpka 2011

Algoritmy I. Číselné soustavy přečíst!!! ALGI 2018/19

Ústav automatizace a měřicí techniky.

Transkript:

Emergence chování robotických agentů: neuroevoluce Petra Vidnerová, Stanislav Slušný, Roman Neruda Ústav Informatiky, AV ČR Kognice a umělý život VIII Praha 28. 5. 2008

Evoluční robotika: EA & neuronové sítě evoluční robotika - evoluční algoritmy + neuronové sítě návrh inteligentního agenta samoorganizačním procesem vtělený agent (robot) neuronová sít : vstupy hodnoty senzorů výstup efektory (kolečka) reaktivní agent - nemá pamět, akce závisí pouze na aktuálním vstupu (t.j. na stejný vstup reaguje vždy stejně)

Laboratorní roboti: Khepera a E-Puck malý, krátkozraký, pomalý robot Khepera - 70 mm, 80g 8 infračervených čidel, 2 kola senzory dávají odhad vzdálenosti od překážek robot může detekovat bílý papír na vzdálenost 5 cm

Použité neuronové sítě Vícevrstvý perceptron (MLP) dopředná neuronová sít sigmoidální přenosová funkce Elmanova sít rekuretní sít - pamět aktivace skrytých neuronů na základě vstupů a předchozího kroku Copy Copy Copy Copy Copy RBF sít dopředná sít, jedna skrytá vrstva lokální jednotky

Evoluční algoritmy Základní principy univerzální stochastická optimalizační metoda malé nároky na znalosti o řešené úloze přirozená a efektivní paralelizace robustnost evolučního hledání Algoritmus populace jedinců: (binárně) zakódované řešení úlohy fitness-účelová funkce: ohodnocení jedince iterativně vytváří nové generace genetické operace: selekce, křížení, mutace

Evoluční učení Jedinec (genom) zakódování vah neuronové sítě reálné kódování - posloupnost parametrů I = {w 11,...,w hm } RBF sítě I RBF = {B 1,...,B h }, h počet skrytých jednotek B k = {c k1,...,c kn, b k, w k1,...,w km } kombinace třífázového učení a EA středy RBF jednotek a šířky samoorganizací (shlukování) evolučně učíme jen váhy B k = {w k1,...,w km }

Účelová funkce (fitness) ohodnocení jedince, míra kvality řešení vždy záleží na konkrétní úloze Výpočet ohodnocení inicializuj prostředí umísti robota na náhodně zvolenou počáteční pozici spust simulaci (na požadovaný počet kroků nebo dokud robot nenarazí) ohodnot chování robota opakujeme vícekrát a průměrujeme

Experimenty Motivace a cíle ověřit schopnost zvládnout základní úlohy: vyhýbání se překážkám rozlišení stěn a hledaných objektů pohyb v bludišti srovnat různé architektury neuronových sítí Metodologie použit simulátor YAKS (Khepera), WEBOTS (E-puck) více běhů evolučního učení jiné prostředí pro učení a testování ověření mimo simulátor

Bludiště Úloha robot je umístěn do bludiště, úkolem je najít cíl ( zónu ) aréna 60x30cm Učení použito malé bludiště fitness: 250 simulačních kroků, 4 pokusy

Bludiště Výpočet fitness pohyb a vyhýbání se překážkám: T k,j = V k,j (1 V k,j )(1 i k,j ) průměrné ohodnocení za jeden krok S j = 250 T k,j k=1 250 bonus za nalezení zóny j Fitness = 4 j=1 (S j + j ) V k,j : suma absolutních rychlostí motorů (V kj = v l + v r, V k,j < 0, 1 >) i k,j : hodnota { nejaktivnějšího senzoru (i k,j < 0, 1 >) 1 robot navštívil zónu j = 0 jinak

Průběh genetického algoritmu 5 4.5 Fitness function: MLP and RBF network RBF MLP 4 3.5 fitness value 3 2.5 2 1.5 1 0.5 0 50 100 150 200 generations

Srovnání Typ sítě Výsledná fitness mean std min max MLP 10 neuronů 4.32 0.07 4.24 4.46 MLP 5 neuronů 4.29 0.08 4.20 4.44 ELM 5 neuronů 4.24 0.06 4.14 4.33 RBF 10 neuronů 4.00 0.97 1.23 4.38 ELM 10 neuronů 3.97 0.70 2.24 4.34 RBF 5 neuronů 3.98 0.90 1.42 4.36

RBF sítě - extrakce pravidel zjednodušená úloha, tři vstupy (nalevo, vpředu, napravo) Senzor Šířka Motor vlevo vpředu vpravo levý pravý VERYNEAR NEAR VERYFAR 1.56 500-100 FEEL NOWHERE NOWHERE 1.93-500 500 NEAR NEAR NOWHERE 0.75 500-500 FEEL NOWHERE NEAR 0.29 500-500 VERYFAR NOWHERE NOWHERE 0.16 500 500

Naučený robot ve velkém bludišti (video)

Závěr Shrnutí ověřili jsme schopnost evolučních neuronových sítí řešit základní jednoduché robotické úlohy vtělení robotičtí agenti jsou si schopni osvojit požadované chování na základě vhodných odměn pouze první krok na dlouhé cestě Budoucí práce komplexnější úlohy, kombinovaná chování inkrementální evoluce, hybridní architektury Reklama Čtvrtek 10. 00 : Stanislav Slušný - učení posilováním