Vytěžování znalostí z dat



Podobné dokumenty
Vytěžování znalostí z dat

Vytěžování znalostí z dat

Vytěžování znalostí z dat

Vytěžování znalostí z dat

Vytěžování znalostí z dat

Vytěžování znalostí z dat

Vytěžování znalostí z dat

Vytěžování znalostí z dat

Vytěžování znalostí z dat

Předzpracování dat. Pavel Kordík. Department of Computer Systems Faculty of Information Technology Czech Technical University in Prague

Vytěžování znalostí z dat

Předzpracování dat. Pavel Kordík. Department of Computer Systems Faculty of Information Technology Czech Technical University in Prague

Vytěžování znalostí z dat

Vytěžování znalostí z dat

Úvod do RapidMineru. Praha & EU: Investujeme do vaší budoucnosti. 1 / 23 Úvod do RapidMineru

Vytěžování znalostí z dat

Vytěžování znalostí z dat

Dopravní plánování a modelování (11 DOPM )

Předzpracování dat. Pavel Kordík. Department of Computer Systems Faculty of Information Technology Czech Technical University in Prague

Cvičení 11. Klasifikace. Jan Přikryl. 14. března 2018 ČVUT FD

Cvičení 1,2 Osnova studie strategie ICT

Polovodičový usměrňovač

Whale detection Brainstorming session. Jiří Dutkevič Lenka Kovářová Milan Le

Cvičení 4 komplexní zpracování dat. Analýza povodí řeky Kongo

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

NG C Implementace plně rekurentní

Úvod do Matlabu. Praha & EU: Investujeme do vaší budoucnosti. 1 / 24 Úvod do Matlabu

Přednáška 13 Redukce dimenzionality

Normal mission real time system

Ochutnávka strojového učení

Neuronové časové řady (ANN-TS)

Miroslav Čepek. Fakulta Elektrotechnická, ČVUT. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Základy vytěžování dat

Martin Flusser. Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague. December 7, 2016

Mission ctitical real time system

Lineární diskriminační funkce. Perceptronový algoritmus.

PV021 Vícevrstvá neuronová síť pro rozeznávání mikroteček. Matúš Goljer, Maroš Kucbel, Michal Novotný, Karel Štěpka 2011

ORGANIZAČNÍ ŘÁD ČVUT FD

Rezonance v obvodu RLC

ORGANIZAČNÍ ŘÁD ČVUT FD

Objektové modelování BI-OMO 4. cvičení

Fakulta chemicko-technologická Faculty of Chemical Technology

DATA MINING KLASIFIKACE DMINA LS 2009/2010

Cvičení z logiky II.

Rezonance v obvodu RLC

Teorie: Voltampérovou charakteristiku měříme v propustném i závěrném směru.

Uživatelský manuál pro lektora e-learningového portálu MAFIDIS+

Obsah přednášky. 1. Principy Meta-learningu 2. Bumping 3. Bagging 4. Stacking 5. Boosting 6. Shrnutí

ISU Cvičení 1. Marta Čudová

Self Organizing Map. Michael Anděl. Praha & EU: Investujeme do vaší budoucnosti. 1 / 10 Slef Organizing Map

Měření vlastností stejnosměrných tranzistorových zesilovačů

Název: Polovodičový usměrňovač Pomůcky: Teorie: Vypracování:

Historie matematiky a informatiky Cvičení 2

SOFTWARE PRO ANALÝZU LABORATORNÍCH MĚŘENÍ Z FYZIKY

Testování modelů a jejich výsledků. Jak moc můžeme věřit tomu, co jsme se naučili?

Správa barev pro digitální fotografii

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

ANALÝZA A KLASIFIKACE DAT

4. Rekurze. BI-EP1 Efektivní programování Martin Kačer

Martin Flusser. December 15, 2016

Soubory. Hung Hoang Dieu. Department of Mathematics Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague 1 / 7

MS Word Ing. Pavel BOHANES. Hromadná korespondence

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Curriculum Vitae Pavel Kopecký, Ph.D.

Předzpracování dat. Cvičení 2: Import a příprava dat v Matlabu MI-PDD, 09/2011. Pavel Kordík MI-POA

Změkčování hranic v klasifikačních stromech

Obsah: 1. Úvod Architektura Instalace Hardwarové požadavky Softwarové požadavky Data...

6. cvičení: Základní kroky v programu ArcGIS GIS1 tvorba map

Testování a spolehlivost. 4. Laboratoř Spolehlivostní modely 1

PREDIKCE POČTU UCHAZEČŮ O STUDIUM S VYUŽITÍM NEURONOVÝCH SÍTÍ

Analýza dat pomocí systému Weka, Rapid miner a Enterprise miner

Mnohorozměrná statistika

Návrh - návrhové třídy a vzory

Navrženy v 60. letech jako experimentální optimalizační metoda. Velice rychlá s dobrou podporou teorie

Stabiliz atory napˇet ı v nap ajec ıch zdroj ıch - mˇeˇren ı z akladn ıch parametr u Ondˇrej ˇ Sika

Local Interconnect Network - LIN

Vojtěch Franc Centrum strojového vnímání, Katedra kybernetiky, FEL ČVUT v Praze Eyedea Recognition s.r.o MLMU

Testování modelů a jejich výsledků. tomu, co jsme se naučili?

Obsah: 1. Úvod Architektura Instalace Hardwarové požadavky Softwarové požadavky Data...

- funkce, které integrujete aproximujte jejich Taylorovými řadami a ty následně zintegrujte. V obou případech vyzkoušejte Taylorovy řady

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Neuronové sítě v DPZ

Problémové domény a jejich charakteristiky

ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT. Institut biostatistiky a analýz

Předzpracování dat. Lenka Vysloužilová

Evoluční algoritmy. Podmínka zastavení počet iterací kvalita nejlepšího jedince v populaci změna kvality nejlepšího jedince mezi iteracemi

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Profilová část maturitní zkoušky 2013/2014

PROHLEDÁVÁNÍ GRAFŮ. Doc. RNDr. Josef Kolář, CSc. Katedra teoretické informatiky, FIT České vysoké učení technické v Praze

Uživatelem řízená navigace v univerzitním informačním systému

Název: Tranzistorový zesilovač praktické zapojení, měření zesílení

Strojové učení Marta Vomlelová

Postupy řešení příkladů z EKO/GKE. Vytvořte DEM o rozlišení 10m

Neřízené usměrňovače reálné vlastnosti

TURINGOVY STROJE. Doc. RNDr. Josef Kolář, CSc. Katedra teoretické informatiky, FIT České vysoké učení technické v Praze

3. Vícevrstvé dopředné sítě

Trénování sítě pomocí učení s učitelem

Úvod do softwarového inženýrství a týmového vývoje

( ) ( ) ( ) ( ) Logaritmické rovnice III. Předpoklady: Př. 1: Vyřeš rovnici. Podmínky: Vnitřky logaritmů: x > 0.

Manažerská informatika projektové řízení

Transkript:

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 9 1/16 Vytěžování znalostí z dat Pavel Kordík, Josef Borkovec Department of Computer Systems Faculty of Information Technology Czech Technical University in Prague Cvičení 9: Učení neuronových sítí BI-VZD, 09/2011 MI-POA Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 9 2/16 Osnova cvičení Práce s MLP v Rapidmineru Nominální atributy Learning rate a počet iterací

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 9 3/16 MLP v Rapidmineru Načteme si iris data MLP v Rapidmineru Přidáme operátor NeuralNet Zapojíme

MLP v Rapidmineru Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 9 4/16 Prohlédneme si strukturu sítě Síť má 3 neurony ve výstupní vrstvě (klasifikace do 3 tříd) 4 neurony ve vstupní vrstvě (data mají 4 atributy) +1 Threshold node (výstupem je vždy 1) V defaultním nastavení má síť jednu skrytou vrstvu počet neuronů ve skryté vrstvě se určí automaticky z počtu atributů a výstupních tříd

MLP v Rapidmineru Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 9 5/16 Zkusíme upravit parametry operátoru: přidáme 2 skryté vrstvy s 5 neurony

MLP v Rapidmineru Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 9 6/16 X -Validace Zapojíme hodnocení klasifikace cross validací Přidáme X-Validation Building block Edit -> New BuidlingBlock-> NominalX- Validation Vyměníme operátor Decisiontreeza NeuralNet

MLP v Rapidmineru Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 9 7/16 Zapojíme a prohlédneme si výsledek

Nominální atributy Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 9 8/16 Nominální atributy Nyní zkusíme použít jiná data: o Labor-Negotiations Data obsahují nominální atributy a chybějící hodnoty

Nominální atributy Neuronové sítě pracují pouze s numerickými atributy Nominální atributy musíme převést na numerické Zkuste dva způsoby převodu atributů na numerické a porovnejte úspěšnost klasifikace x-validací Operátor Nominal to Numerical zakóduje každou možnou hodnotu atributu unikátním integerem Operátor Nominal to Binomial + Nominal to numerical pro každou možnou hodnotu atributu vytvoří nový booleovský atribut Který je lepší a proč? Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 9 9/16

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 9 10/16 Nominální atributy Nominal to Numerical Výsledky Nominal to Binomial Správné zakódování vstupů je důležité

Learning rate a počet iterací Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 9 11/16 Learningratea počet iterací Pomocí operátorů Loopparametersa Log zobrazte závislost trénovací a testovací chyby na počtu iterací

Learning rate a počet iterací Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 9 12/16 Začneme s Iris daty Přidáme operátor Loop parameters Do něj přidáme X-Validaci, hodnocení modelu a Log A do X-Validace Neuronovou síť

Learning rate a počet iterací Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 9 13/16 Nastavíme parametry u Loop parameters: a Log:

Learning rate a počet iterací Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 9 14/16 u Performance nastavíme, že nás zajímá classification error spustíme pro zobrazení použijeme graf Series poznámka: pokud jediným výsledkem procesu je záznam v logu, tak musíme sami překliknout workspace na výsledky

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 9 15/16 Výsledek Learning rate a počet iterací

Learning rate a počet iterací Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 9 16/16 Pozorujte, jak se změní graf při různých nastaveních learning rate u neuronové sítě zkuste napřlearningrate0,9 a 0,1