Strojové učení se zaměřením na vliv vstupních dat



Podobné dokumenty
Aplikace obrazové fúze pro hledání vad

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Využití metod strojového učení v bioinformatice David Hoksza

Rozpoznávání písmen. Jiří Šejnoha Rudolf Kadlec (c) 2005

Moderní systémy pro získávání znalostí z informací a dat

Algoritmy a struktury neuropočítačů ASN - P11

Vytěžování znalostí z dat

Fakulta informačních technologií VUT Brno. Předmět: Srovnání klasifikátorů Autor : Jakub Mahdal Login: xmahda03 Datum:

Neuronové sítě (11. přednáška)

Využití strojového učení k identifikaci protein-ligand aktivních míst

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha

Rosenblattův perceptron

Fiala P., Karhan P., Ptáček J. Oddělení lékařské fyziky a radiační ochrany Fakultní nemocnice Olomouc

Lineární diskriminační funkce. Perceptronový algoritmus.

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně

Stromové struktury v relační databázi

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Přednáška 13 Redukce dimenzionality

Lineární klasifikátory

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

Ambasadoři přírodovědných a technických oborů. Ing. Michal Řepka Březen - duben 2013

Daniel Beneš Slezská univerzita v Opavě Filozoficko-přírodovědecká fakulta Ústav informatiky

Úloha - rozpoznávání číslic

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT. Institut biostatistiky a analýz

Whale detection Brainstorming session. Jiří Dutkevič Lenka Kovářová Milan Le

Strojové učení Marta Vomlelová

Obsah přednášky Jaká asi bude chyba modelu na nových datech?

5. Umělé neuronové sítě. Neuronové sítě

Rozvoj tepla v betonových konstrukcích

Pokročilé neparametrické metody. Klára Kubošová

PV021: Neuronové sítě. Tomáš Brázdil

Neuronové sítě Ladislav Horký Karel Břinda

Rozpoznávání v obraze

Optimální rozdělující nadplocha 4. Support vector machine. Adaboost.

Reprezentace geometrických objektů pro 3D fotografii

Učící se klasifikátory obrazu v průmyslu

přetrénování = ztráta schopnosti generalizovat vlivem přílišného zaměření klasifikátorů na rozeznávání pouze konkrétních trénovacích dat

Fuzzy logika a reálný svět, aneb jsou všechny hromady skutečně malé?

ABBYY Automatizované zpracování dokumentů

Automatické vyhledávání informace a znalosti v elektronických textových datech

PŘEDMLUVA 11 FORMÁLNÍ UJEDNÁNÍ 13

Hammingův odhad. perfektní kódy. koule, objem koule perfektní kód. triviální, Hammingův, Golayův váhový polynom. výpočet. příklad

3. Vícevrstvé dopředné sítě

Automatické rozpoznávání dopravních značek

Simulace (nejen) fyzikálních jevů na počítači

1 Popis předmětu plnění projektu implementace MIS

Optimalizace & soft omezení: algoritmy

NG C Implementace plně rekurentní

1. Znalostní systémy a znalostní inženýrství - úvod. Znalostní systémy. úvodní úvahy a předpoklady. 26. září 2017

Úvod do optimalizace, metody hladké optimalizace

Následující text je součástí učebních textů předmětu Bi0034 Analýza a klasifikace dat a je určen

OSA. maximalizace minimalizace 1/22

Deep learning v jazyku Python

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Multirobotická kooperativní inspekce

Dobývání znalostí z textů text mining

7. Rozdělení pravděpodobnosti ve statistice

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář,

Kon K e on kc k ion i i on s i m s u m s u PSY 481

Datová kvalita. RNDr. Ondřej Zýka

Seminář z umělé inteligence. Otakar Trunda

Digitální učební materiál

UMÍ POČÍTAČE POČÍTAT?

Analytické metody v motorsportu

Úvod do expertních systémů

Popis zobrazení pomocí fuzzy logiky

Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma

Operace s obrazem II

ROZ1 CVIČENÍ VI. Geometrická registrace (matching) obrazů

Usuzování za neurčitosti

PŘEDMLUVA ODDÍL I 1. MANAŽEŘI A JEJICH KOMPETENCE

Vojtěch Franc. Biometrie ZS Poděkování Janu Šochmanovi za slajdy vysvětlující AdaBoost

ANALÝZA A KLASIFIKACE DAT

Modely vyhledávání informací 4 podle technologie. 1) Booleovský model. George Boole Aplikace booleovské logiky

Kybernetika a umělá inteligence, cvičení 10/11

Trénování sítě pomocí učení s učitelem

základní vlastnosti, používané struktury návrhové prostředky MATLAB problém kvantování koeficientů

Dnes budeme učit agenty, jak zlepšit svůj

Distribuované systémy a výpočty

Hledání kořenů rovnic jedné reálné proměnné metoda sečen Michal Čihák 23. října 2012

ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ /14

Pokročilé operace s obrazem

Pravděpodobně skoro správné. PAC učení 1

VYUŽITÍ FUZZY MODELŮ PŘI HODNOCENÍ OBTÍŽNOSTI CYKLOTRAS

Algoritmy I, složitost

a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:

DOKUMENTACE Identifikace pomocí otisků prstů

Datové struktury 2: Rozptylovací tabulky

GRR. získávání znalostí v geografických datech Autoři. Knowledge Discovery Group Faculty of Informatics Masaryk Univerzity Brno, Czech Republic

Statistická teorie učení

Pokročilé neparametrické metody. Klára Kubošová

Dolování asociačních pravidel

Algoritmy a struktury neuropočítačů ASN P4. Vícevrstvé sítě dopředné a Elmanovy MLNN s učením zpětného šíření chyby

Odečítání pozadí a sledování lidí z nehybné kamery. Ondřej Šerý

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY. MRBT Robotika

Modernizace a inovace výpočetní kapacity laboratoří ITE pro účely strojového učení. Jiří Málek

Umělá inteligence a rozpoznávání

Transkript:

Strojové učení se zaměřením na vliv vstupních dat Irina Perfilieva, Petr Hurtík, Marek Vajgl Centre of excellence IT4Innovations Division of the University of Ostrava Institute for Research and Applications of Fuzzy Modeling Ostrava, Czech Republic 2014-09-24

Učení Obecné učení chápáno jako proces s cílem detekce a uložení významných rysů nad daným zdrojem S využitím rysů probíhá rozpoznání nového objektu na základě nějak definované podobnosti V našem případě detekce typu vady kamene na základě vzorů daných vad

Historický vývoj učících algoritmů 1952: Eliza, simulace rozhovoru s psychoterapeutem 1957: Neuronové sítě, rozpoznávání písmen 1995: Support vector machines 2003: Logistic regression

Neuronové sítě Představeno 1943, ispirováno lidským mozkem Základní jednotka: neuron Problém: XOR. Vyřešení: síť s více vrstvami neuronů Problém: Black box K učení vyžadováno velké množství vzorků Aktuální téma: deep learning. Klasifikace objektů ve scéně za použití desetitisíců neuronů a urychlení na GPU.

Separační stromy Rozdělení problému na dva podproblémy (binární strom), nebo n tici (nární strom) Použití především v indexaci dat a vyhledávání v nich (databáze) Výhoda: rychlost zpracování Nevýhoda: automatizované budování stromu. Při rozdělení se minimalizuje chyba, nemusí ale konvergovat k nule

Učení II Více formálně: detekce počtu n a klasifikace charakteristik k 1,..., k n množiny objektů s cílem jejich klasifikace na disjunktní třídy T 1,..., T n Snažíme se dosáhnout: úplnosti robustnosti

Úplnost Klasifikace na 2 třídy Hledání (minimální) množiny charakteristik umožňující nalezení (lineární) separability Pokud můžeme provézt klasifikaci, pak lze říci, že množina je konzistentní vzhledem k požadované klasifikaci Při nenalezení řešení je nutné zvětšení dimenze

Úplnost II n = 2, tedy máme dvě charakteristiky α {0, 1}

Úplnost III Může nastat situace neseparovatelnosti množiny

Úplnost III Může nastat situace neseparovatelnosti množiny

Úplnost IV Při nenalezení řešení je nutné zvětšit dimenzi, tj. počet charakteristik n

Robustnost Odolnost algoritmu vůči vstupním hodnotám Charakteristiky nabývají hodnot α 0, 1

Úplnost a konzistence Nalezení separace vstupní množiny je podmíněné její konzistencí Vznik nekonzistentní množiny vstupů vůči zvoleným charakteristikám klasifikace vede k nemožnosti provedení klasifikace Nekonzistence vzniká rozporem v množině vstupních dat, tj. blízkých objektů z různých klasifikačních tříd (V teoretické oblasti) lze pouze zvětšit dimenzi úlohy (tj. zvětšit množinu zvolených charakteristik)

Strojové učení se zaměřením na vliv vstupních dat Projevy různých typů poškození

Chyby při učení prakticky Neúplnost vstupních dat Separovatelnost vad Kvalita vstupu (kontrast, rozmazanost) Malý počet vstupů

Neúplnost vstupních dat Množina vstupních dat nepokrývá souvisle celou škálu projevů vady

Separovatelnost vad I Odlišné vady se projevují se stejnými artefakty Výsledkem je špatná kategorizace daného kamene Artefakty se nedají popsat triviálním způsobem Hodnota charakteristiky nemá přímou funkční závislost na míře poškození kamene

Separovatelnost vad II Separace na základě vhodně zvolené charakteristiky Máme n-dimenzionální prostor Objekt je popsán n charakteristikami Cílem je nalezení techniky založené na matematickém modelu, která provede nejlepší možné rozdělení prostoru

Separovatelnost vad III Implementace spočívá v rozdělení na podprostory Následně je každý podprostor rozdělen zvlášť Problém: Jak rozdělit podprostor s ohledem na přesnost s ohledem na časovou náročnost v našem případě nalezení prahových hodnot

Separovatelnost vad IV

Kvalita vstupu (kontrast, rozmazanost) Kvalita vstupu má výrazný dopad na výpočet charakteristik

Malý počet vstupů Lidský prvek řešení vyžaduje minimalizaci velikosti množiny vstupních dat učící sady nutnost vyrobit data reprezentující vady časová náročnost nového učení

Srovnání a výsledky

Srovnání a výsledky

Závěr Řešena netriviální úloha separace kamenů Zjištěn různý projev totožné vady Navržen učící algoritmus s ohledem na rychlost a přesnost Provedeno srovnání s existujícímí algoritmy