1. Data mining. Strojové učení. Základní úlohy.
|
|
- Iva Urbanová
- před 9 lety
- Počet zobrazení:
Transkript
1 1... Základní úlohy. Učení s učitelem a bez učitele. Petr Pošík Katedra kybernetiky ČVUT FEL P. Pošík c 2010 Aplikace umělé inteligence 1 / 36
2 Obsah P. Pošík c 2010 Aplikace umělé inteligence 2 / 36
3 Co bylo v ZUI? Co bude v AUI? P. Pošík c 2010 Aplikace umělé inteligence 3 / 36
4 Co bylo v ZUI? Prohledávání st. prostoru, učení z příkladů konstruktivní neinformované a informované metody Induktivní učení popisu konceptu v predikátové logice generativní metody, deterministické a stochastické Splňování omezujících podmínek Evoluční algoritmy Posilované učení Plánování Plánování jako prohledávání stavového prostoru Reprezentace, fitness, křížení, mutace, selekce Aplikace Znalosti, reprezentace, výroková logika Predikátová logika, Prolog Neurčitost, pravděpodobnost, Bayesovské sítě popis úloh v jazyce STRIPS partially ordered plans Neuronové sítě Typy NN, úlohy pro NN (s učitelem, bez učitele) Trénovací, validační, testovací Učení NN, error backpropagation Aplikace P. Pošík c 2010 Aplikace umělé inteligence 4 / 36
5 Co bude v AUI? Co bylo v ZUI? Co bude v AUI? Předběžný plán přednášek: 1., základní úlohy, učení s učitelem a bez učitele 2. Lineární diskriminační funkce, perceptronový algoritmus, rozšíření báze 3. Optimální rozdělující nadplocha, SVM 4. Neuronové sítě, zpětné šíření chyby 5. Učení bez učitele, hierarchické shlukování, k-means a EM algoritmus. 6. Neuronové sítě - RBF, Kohonenova sít, autoasociativní sít 7. Generativní metody prohledávání stavového prostoru, EA s reálnou reprezentací 8. Alternativní přírodou inspirované techniky ACO, PSO 9. Základní techniky UI pro plánování 10. Úvod do multiagentních systémů a agentních technologií 11. Plánování ve výrobě a v logistice (ukázky systému) 12. Simulace, diagnostika a inteligentní robotika (ukázky systému) P. Pošík c 2010 Aplikace umělé inteligence 5 / 36
6 Definice Rozdílné pohledy na data Účel DM Zdroje DM Úlohy pro DM CRISP-DM P. Pošík c 2010 Aplikace umělé inteligence 6 / 36
7 Definice Definice Rozdílné pohledy na data Účel DM Zdroje DM Úlohy pro DM CRISP-DM je netriviální dobývání skrytých, předem neznámých a potenciálně užitečných informací z dat. Při jejich objevování se využívají expertní systémy, metody umělé inteligence a strojového učení, statistické, grafické a vizualizační techniky a prezentují se způsobem srozumitelným lidem. [FSM92] Český překlad Dolování dat Vytěžování dat Dobývání znalostí z databází (překlad KDD - knowledge discovery in databases) Co má data mining společného s aplikacemi umělé inteligence? DM: obsáhlý proces zahrnující mnoho fází orientovaný na praktický přínos, na aplikace Metody umělé inteligence, strojového učení a rozpoznávání se uplatňují především ve fázi modelování, ale také v několika dalších fázích procesu DM. P. Pošík c 2010 Aplikace umělé inteligence 7 / 36
8 Rozdílné pohledy na data Definice Rozdílné pohledy na data Účel DM Zdroje DM Úlohy pro DM CRISP-DM Exploratorní analýza dat Průzkum dat, první seznámení s daty, formulujeme hypotézy. Hojně se využívají grafické techniky. P. Pošík c 2010 Aplikace umělé inteligence 8 / 36
9 Rozdílné pohledy na data Definice Rozdílné pohledy na data Účel DM Zdroje DM Úlohy pro DM CRISP-DM Exploratorní analýza dat Průzkum dat, první seznámení s daty, formulujeme hypotézy. Hojně se využívají grafické techniky. Konfirmatorní analýza dat Máme hypotézy, data slouží jako prostředek pro jejich ověření. Využívají se statistické metody (ANOVA, regrese, χ-kvadrát testy,... ) P. Pošík c 2010 Aplikace umělé inteligence 8 / 36
10 Rozdílné pohledy na data Definice Rozdílné pohledy na data Účel DM Zdroje DM Úlohy pro DM CRISP-DM Exploratorní analýza dat Průzkum dat, první seznámení s daty, formulujeme hypotézy. Hojně se využívají grafické techniky. Konfirmatorní analýza dat Máme hypotézy, data slouží jako prostředek pro jejich ověření. Využívají se statistické metody (ANOVA, regrese, χ-kvadrát testy,... ) Máme data a chceme vytvořit modely, které fungují a jsou použitelné pro predikce. 1 Využití metod umělé inteligence, strojového učení,... 1 V obchodních a marketingových aplikacích bývá druhořadé, zda tyto modely popisují skutečné závislosti a děje. Při aplikaci metod strojového učení např. na biologické a medicinské aplikace je správnost vyžadována mnohem více. P. Pošík c 2010 Aplikace umělé inteligence 8 / 36
11 Účel DM Definice Rozdílné pohledy na data Účel DM Zdroje DM Úlohy pro DM CRISP-DM DM je orientován na praktickou využitelnost výsledků, hlavně ve formě predikcí (exploratorní analýza dat naproti tomu slouží spíše k popisu dat, výzkumníky při ní napadají souvislosti, které stojí za ověření) Jde hlavně o vytvoření, který přináší užitek, tj., jehož prognózy budou trefné, klasifikace použitelné (a zisky a úspory z něj plynoucí znatelné) Příklady otázek, na něž DM umí dát (přibližnou) odpověd : Kolik člověkohodin bude třeba příští měsíc odpracovat na ARO? Kolik asi bude stát pozemek 20 km severně od Prahy? Odpoví konkrétní člověk z naší databáze na nabídku, kterou bychom mu zaslali? Které produkty se prodávají společně? Které produkty si lidé kupují poté, co si koupili jiné? P. Pošík c 2010 Aplikace umělé inteligence 9 / 36
12 Zdroje DM Definice Rozdílné pohledy na data Účel DM Zdroje DM Úlohy pro DM CRISP-DM P. Pošík c 2010 Aplikace umělé inteligence 10 / 36
13 Typy úloh řešených pomocí DM Definice Rozdílné pohledy na data Účel DM Zdroje DM Úlohy pro DM CRISP-DM Popis dat Vizualizace Sumarizace Hledání nugetů Dominantní struktury, asociační pravidla Segmentace, shluková analýza, popis rozdělení dat Predikce Klasifikace (predikce kategoriální proměnné) Regrese (predikce spojité proměnné) Časové řady (predikce závislé na čase) P. Pošík c 2010 Aplikace umělé inteligence 11 / 36
14 DM jako proces: CRISP-DM Definice Rozdílné pohledy na data Účel DM Zdroje DM Úlohy pro DM CRISP-DM Cross-Industry Standard Process for Data Mining P. Pošík c 2010 Aplikace umělé inteligence 12 / 36
15 AI, ML, PR Rozpoznávání Učení jako indukce Učení s učitelem a bez učitele Druhy úloh P. Pošík c 2010 Aplikace umělé inteligence 13 / 36
16 AI, ML, PR AI, ML, PR Rozpoznávání Učení jako indukce Učení s učitelem a bez učitele Druhy úloh Umělá inteligence (Artificial Intelligence, AI) [McC04]: Věda o sestavování inteligentních strojů. AI studuje: inteligentní chování, učení, adaptaci ve strojích a počítačích AI zahrnuje: řízení, plánování a rozhodování, expertní systémy, rozpoznávání ručně psaných znaků, přirozeného jazyka, mluvené řeči, obličejů,... P. Pošík c 2010 Aplikace umělé inteligence 14 / 36
17 AI, ML, PR AI, ML, PR Rozpoznávání Učení jako indukce Učení s učitelem a bez učitele Druhy úloh Umělá inteligence (Artificial Intelligence, AI) [McC04]: Věda o sestavování inteligentních strojů. AI studuje: inteligentní chování, učení, adaptaci ve strojích a počítačích AI zahrnuje: řízení, plánování a rozhodování, expertní systémy, rozpoznávání ručně psaných znaků, přirozeného jazyka, mluvené řeči, obličejů,... (Machine Learning, ML) studuje algoritmy umožňující strojům učit se. ML zahrnuje: syntaktické rozpoznávání, diagnostické systémy, bioinformatika, detekce zneužití kreditních karet, analýza akciového trhu, klasifikace DNA sekvencí, rozpoznávání ručně psaných znaků, přirozeného jazyka, mluvené řeči, obličejů, navigace robota,... P. Pošík c 2010 Aplikace umělé inteligence 14 / 36
18 AI, ML, PR AI, ML, PR Rozpoznávání Učení jako indukce Učení s učitelem a bez učitele Druhy úloh Umělá inteligence (Artificial Intelligence, AI) [McC04]: Věda o sestavování inteligentních strojů. AI studuje: inteligentní chování, učení, adaptaci ve strojích a počítačích AI zahrnuje: řízení, plánování a rozhodování, expertní systémy, rozpoznávání ručně psaných znaků, přirozeného jazyka, mluvené řeči, obličejů,... (Machine Learning, ML) studuje algoritmy umožňující strojům učit se. ML zahrnuje: syntaktické rozpoznávání, diagnostické systémy, bioinformatika, detekce zneužití kreditních karet, analýza akciového trhu, klasifikace DNA sekvencí, rozpoznávání ručně psaných znaků, přirozeného jazyka, mluvené řeči, obličejů, navigace robota,... Rozpoznávání (Pattern Recognition, PR) je proces, na jehož vstupu jsou surová data a na výstupu je nějaká akce závislá na kategorii pozorovaných dat. Klasifikace dat založená na apriorních znalostech nebo na statistických informacích extrahovaných z dat. PR zahrnuje: syntaktické rozpoznávání, detekce zneužití kreditních karet, analýza akciového trhu, klasifikace DNA sekvencí, rozpoznávání ručně psaných znaků, přirozeného jazyka, mluvené řeči, obličejů, navigace robota,... P. Pošík c 2010 Aplikace umělé inteligence 14 / 36
19 Rozpoznávání AI, ML, PR Rozpoznávání Učení jako indukce Učení s učitelem a bez učitele Druhy úloh Rozpoznávání: Statistické, příznakové usuzování podle spojitých či diskrétních znaků měřených na objektu Strukturální usuzování podle vztahů mezi jednotlivými prvky objektu (často: struktura objektu odvozené příznaky příznakové rozpoznávání) Druhy veličin (pro příznakové rozpoznávání): Spojité vs. diskrétní Nezávislé (vstupy) vs. závislé (výstupy) P. Pošík c 2010 Aplikace umělé inteligence 15 / 36
20 Rozpoznávání AI, ML, PR Rozpoznávání Učení jako indukce Učení s učitelem a bez učitele Druhy úloh Rozpoznávání: Statistické, příznakové usuzování podle spojitých či diskrétních znaků měřených na objektu Strukturální usuzování podle vztahů mezi jednotlivými prvky objektu (často: struktura objektu odvozené příznaky příznakové rozpoznávání) Druhy veličin (pro příznakové rozpoznávání): Spojité vs. diskrétní Nezávislé (vstupy) vs. závislé (výstupy) Znak Škála Možné operace Příklady Kval. Nominální Ordinální Kvant. Intervalová Poměrová P. Pošík c 2010 Aplikace umělé inteligence 15 / 36
21 Rozpoznávání AI, ML, PR Rozpoznávání Učení jako indukce Učení s učitelem a bez učitele Druhy úloh Rozpoznávání: Statistické, příznakové usuzování podle spojitých či diskrétních znaků měřených na objektu Strukturální usuzování podle vztahů mezi jednotlivými prvky objektu (často: struktura objektu odvozené příznaky příznakové rozpoznávání) Druhy veličin (pro příznakové rozpoznávání): Spojité vs. diskrétní Nezávislé (vstupy) vs. závislé (výstupy) Znak Škála Možné operace Příklady Kval. Nominální Popsat příslušnost Ordinální Kvant. Intervalová Poměrová P. Pošík c 2010 Aplikace umělé inteligence 15 / 36
22 Rozpoznávání AI, ML, PR Rozpoznávání Učení jako indukce Učení s učitelem a bez učitele Druhy úloh Rozpoznávání: Statistické, příznakové usuzování podle spojitých či diskrétních znaků měřených na objektu Strukturální usuzování podle vztahů mezi jednotlivými prvky objektu (často: struktura objektu odvozené příznaky příznakové rozpoznávání) Druhy veličin (pro příznakové rozpoznávání): Spojité vs. diskrétní Nezávislé (vstupy) vs. závislé (výstupy) Znak Škála Možné operace Příklady Kval. Nominální Popsat příslušnost Barva očí, národnost, pohlaví, místo narození Ordinální Kvant. Intervalová Poměrová P. Pošík c 2010 Aplikace umělé inteligence 15 / 36
23 Rozpoznávání AI, ML, PR Rozpoznávání Učení jako indukce Učení s učitelem a bez učitele Druhy úloh Rozpoznávání: Statistické, příznakové usuzování podle spojitých či diskrétních znaků měřených na objektu Strukturální usuzování podle vztahů mezi jednotlivými prvky objektu (často: struktura objektu odvozené příznaky příznakové rozpoznávání) Druhy veličin (pro příznakové rozpoznávání): Spojité vs. diskrétní Nezávislé (vstupy) vs. závislé (výstupy) Znak Škála Možné operace Příklady Kval. Nominální Popsat příslušnost Barva očí, národnost, pohlaví, místo narození Ordinální Seřadit Kvant. Intervalová Poměrová P. Pošík c 2010 Aplikace umělé inteligence 15 / 36
24 Rozpoznávání AI, ML, PR Rozpoznávání Učení jako indukce Učení s učitelem a bez učitele Druhy úloh Rozpoznávání: Statistické, příznakové usuzování podle spojitých či diskrétních znaků měřených na objektu Strukturální usuzování podle vztahů mezi jednotlivými prvky objektu (často: struktura objektu odvozené příznaky příznakové rozpoznávání) Druhy veličin (pro příznakové rozpoznávání): Spojité vs. diskrétní Nezávislé (vstupy) vs. závislé (výstupy) Znak Škála Možné operace Příklady Kval. Nominální Popsat příslušnost Barva očí, národnost, pohlaví, místo narození Ordinální Seřadit Popis velikosti (S,M,L,XL,XXL), vzdělání (ZŠ, SŠ, VŠ) Kvant. Intervalová Poměrová P. Pošík c 2010 Aplikace umělé inteligence 15 / 36
25 Rozpoznávání AI, ML, PR Rozpoznávání Učení jako indukce Učení s učitelem a bez učitele Druhy úloh Rozpoznávání: Statistické, příznakové usuzování podle spojitých či diskrétních znaků měřených na objektu Strukturální usuzování podle vztahů mezi jednotlivými prvky objektu (často: struktura objektu odvozené příznaky příznakové rozpoznávání) Druhy veličin (pro příznakové rozpoznávání): Spojité vs. diskrétní Nezávislé (vstupy) vs. závislé (výstupy) Znak Škála Možné operace Příklady Kval. Nominální Popsat příslušnost Barva očí, národnost, pohlaví, místo narození Ordinální Seřadit Popis velikosti (S,M,L,XL,XXL), vzdělání (ZŠ, SŠ, VŠ) Kvant. Intervalová Porovnat vzdálenosti Poměrová P. Pošík c 2010 Aplikace umělé inteligence 15 / 36
26 Rozpoznávání AI, ML, PR Rozpoznávání Učení jako indukce Učení s učitelem a bez učitele Druhy úloh Rozpoznávání: Statistické, příznakové usuzování podle spojitých či diskrétních znaků měřených na objektu Strukturální usuzování podle vztahů mezi jednotlivými prvky objektu (často: struktura objektu odvozené příznaky příznakové rozpoznávání) Druhy veličin (pro příznakové rozpoznávání): Spojité vs. diskrétní Nezávislé (vstupy) vs. závislé (výstupy) Znak Škála Možné operace Příklady Kval. Nominální Popsat příslušnost Barva očí, národnost, pohlaví, místo narození Ordinální Seřadit Popis velikosti (S,M,L,XL,XXL), vzdělání (ZŠ, SŠ, VŠ) Kvant. Intervalová Porovnat vzdálenosti Kalendářní datum, teplota, úhel, vzrůst zadlužení státu Poměrová P. Pošík c 2010 Aplikace umělé inteligence 15 / 36
27 Rozpoznávání AI, ML, PR Rozpoznávání Učení jako indukce Učení s učitelem a bez učitele Druhy úloh Rozpoznávání: Statistické, příznakové usuzování podle spojitých či diskrétních znaků měřených na objektu Strukturální usuzování podle vztahů mezi jednotlivými prvky objektu (často: struktura objektu odvozené příznaky příznakové rozpoznávání) Druhy veličin (pro příznakové rozpoznávání): Spojité vs. diskrétní Nezávislé (vstupy) vs. závislé (výstupy) Znak Škála Možné operace Příklady Kval. Nominální Popsat příslušnost Barva očí, národnost, pohlaví, místo narození Ordinální Seřadit Popis velikosti (S,M,L,XL,XXL), vzdělání (ZŠ, SŠ, VŠ) Kvant. Intervalová Porovnat vzdálenosti Kalendářní datum, teplota, úhel, vzrůst zadlužení státu Poměrová Porovnat velikosti P. Pošík c 2010 Aplikace umělé inteligence 15 / 36
28 Rozpoznávání AI, ML, PR Rozpoznávání Učení jako indukce Učení s učitelem a bez učitele Druhy úloh Rozpoznávání: Statistické, příznakové usuzování podle spojitých či diskrétních znaků měřených na objektu Strukturální usuzování podle vztahů mezi jednotlivými prvky objektu (často: struktura objektu odvozené příznaky příznakové rozpoznávání) Druhy veličin (pro příznakové rozpoznávání): Spojité vs. diskrétní Nezávislé (vstupy) vs. závislé (výstupy) Znak Škála Možné operace Příklady Kval. Nominální Popsat příslušnost Barva očí, národnost, pohlaví, místo narození Ordinální Seřadit Popis velikosti (S,M,L,XL,XXL), vzdělání (ZŠ, SŠ, VŠ) Kvant. Intervalová Porovnat vzdálenosti Kalendářní datum, teplota, úhel, vzrůst zadlužení státu Poměrová Porovnat velikosti Objem prodeje, průměr hřídele, hmotnost, ph P. Pošík c 2010 Aplikace umělé inteligence 15 / 36
29 Učení jako indukce AI, ML, PR Rozpoznávání Učení jako indukce Učení s učitelem a bez učitele Druhy úloh Dvě fáze: 1. Učení z příkladů (trénovací data) učícímu algoritmu jsou předkládány příklady (a protipříklady) konceptu, který se má naučit rozpoznávat 2. Vybavování, rozpoznávání (testovací data) naučenému jsou předkládány neznámé příklady k ohodnocení (a) Model se učí. Trénovací data (dvojice x, y) jsou předkládány algoritmu učení, který tvoří strukturu a ladí jeho parametry. (b) Model si vybavuje. Testovací data (objekty x) procházejí naučeným modelem, který poskytuje odhady hodnot závislého znaku y. Předpoklad (běžný ve strojovém učení): trénovací a testovací data jsou nezávislá a pocházejí ze stejného pravděpodobnostního rozdělení (IID: Independent and Identically Distributed) P. Pošík c 2010 Aplikace umělé inteligence 16 / 36
30 Učení s učitelem a bez učitele AI, ML, PR Rozpoznávání Učení jako indukce Učení s učitelem a bez učitele Druhy úloh Objekty jsou popsány vektorem příznaků x Učení bez učitele žádné další informace nejsou známy snaží se najít v datech přirozenou strukturu (a zakódovat ji v ) Učení s učitelem každý objekt má přiřazen i štítek y (informaci od učitele) snaží se naučit relaci x y (zakódovat ji v ) P. Pošík c 2010 Aplikace umělé inteligence 17 / 36
31 Druhy úloh AI, ML, PR Rozpoznávání Učení jako indukce Učení s učitelem a bez učitele Druhy úloh Klasifikace štítek je kategoriální proměnná Regrese štítek je spojitá proměnná Časové řady významným vstupem (někdy i jediným) je čas Shlukování štítek není dán Predikce je výrok o jisté události v budoucnosti (předpověd, časové řady). V ML se hojně používá i ve smyslu aplikace naučeného na nová data, nebo hodnoty poskytnuté modelem pro nová data. Další často řešenou úlohou je analýza nákupního koše, která dala vzniknout asociačním a sekvenčním pravidlům. P. Pošík c 2010 Aplikace umělé inteligence 18 / 36
32 Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí P. Pošík c 2010 Aplikace umělé inteligence 19 / 36
33 Existuje dokonalý model? Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí Dokonalý model, jehož struktura by umožňovala popsat jakýkoli koncept, jakoukoli relaci,..., neexistuje. Je možné hledat správný model v prostoru všech možných myslitelných modelů? Velikost prostoru modelů roste exponenciálně, často je nekonečný výpočetně neúnosné. Obrovské nároky na počet trénovacích dat. Obvyklý přístup: Zvolíme omezenou třídu modelů (omezený prostor hypotéz). V této třídě hledáme nejlepší model. Tento model je ale už z principu zaujatý (inductive bias). Co je nejlepší model? Dvě (obvykle protichůdná) kritéria: správnost (přesnost, minimální chyba) a jednoduchost. Jak je vyvážit??? P. Pošík c 2010 Aplikace umělé inteligence 20 / 36
34 Základní otázka Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí Co je dobrým ukazatelem kvality z hlediska DM? Při regresních úlohách se často aplikuje tzv. střední kvadratická chyba (mean squared error): MSE = 1 N N (y i f(x i )) 2, (1) i=1 kde f je pro nás modelem, f(x i ) je predikce pro i. objekt x (zde reálné číslo). Je tato veličina (měřená na datech, která máme k dispozici na trénovacích datech) dobrým ukazatelem kvality? P. Pošík c 2010 Aplikace umělé inteligence 21 / 36
35 Který model je lepší? Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí f(x) = x f(x) = x 3 3x 2 +3x P. Pošík c 2010 Aplikace umělé inteligence 22 / 36
36 Který model je lepší? Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí f(x) = x f(x) = x 3 3x 2 +3x Z hlediska MSE jsou oba modely ekvivalentní!!! Je tedy jedno, který použijeme? P. Pošík c 2010 Aplikace umělé inteligence 22 / 36
37 Který model je lepší? Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí f(x) = x f(x) = x 3 3x 2 +3x Z hlediska MSE jsou oba modely ekvivalentní!!! Je tedy jedno, který použijeme? Lineární model je jednodušší! P. Pošík c 2010 Aplikace umělé inteligence 22 / 36
38 Který model je lepší? Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí f(x) = x f(x) = ( 0.31x) + (1.67x 2 ) + ( 0.51x 3 ) P. Pošík c 2010 Aplikace umělé inteligence 23 / 36
39 Který model je lepší? Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí f(x) = x f(x) = ( 0.31x) + (1.67x 2 ) + ( 0.51x 3 ) Z hlediska MSE je kubický model lepší než lineární!!! P. Pošík c 2010 Aplikace umělé inteligence 23 / 36
40 Který model je lepší? Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí f(x) = x f(x) = ( 0.31x) + (1.67x 2 ) + ( 0.51x 3 ) Z hlediska MSE je kubický model lepší než lineární!!! Přesto může být lepší použít jednodušší lineární model. Máme ovšem málo dat, těžko soudit. P. Pošík c 2010 Aplikace umělé inteligence 23 / 36
41 Požadavky na model z hlediska ML Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí Specifika procesu učení s ohledem na využití ML, např. v DM: Model musí být užitečný při predikci Schopnost generalizace: model musí nalézt obecně platné závislosti v datech Nesmí být přeučený: nesmí se naučit na zdánlivé závislosti v datech nebo na šum Základní metodou pro omezení přeučení je ověření na nezávislých, tzv. testovacích datech P. Pošík c 2010 Aplikace umělé inteligence 24 / 36
42 Testovací data Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí X U(0, 10) Y (X 3) 2 + N(0, 6 2 ) Trenovaci MSE: Testovaci MSE: Polynom 0 teho stupne P. Pošík c 2010 Aplikace umělé inteligence 25 / 36
43 Testovací data Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí X U(0, 10) Y (X 3) 2 + N(0, 6 2 ) Trenovaci MSE: Testovaci MSE: Polynom 1 teho stupne P. Pošík c 2010 Aplikace umělé inteligence 26 / 36
44 Testovací data Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí X U(0, 10) Y (X 3) 2 + N(0, 6 2 ) Trenovaci MSE: Testovaci MSE: Polynom 2 teho stupne P. Pošík c 2010 Aplikace umělé inteligence 27 / 36
45 Testovací data Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí X U(0, 10) Y (X 3) 2 + N(0, 6 2 ) Trenovaci MSE: Testovaci MSE: Polynom 3 teho stupne P. Pošík c 2010 Aplikace umělé inteligence 28 / 36
46 Testovací data Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí X U(0, 10) Y (X 3) 2 + N(0, 6 2 ) Trenovaci MSE: Testovaci MSE: Polynom 4 teho stupne P. Pošík c 2010 Aplikace umělé inteligence 29 / 36
47 Testovací data Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí X U(0, 10) Y (X 3) 2 + N(0, 6 2 ) Trenovaci MSE: Testovaci MSE: Polynom 5 teho stupne P. Pošík c 2010 Aplikace umělé inteligence 30 / 36
48 Testovací data Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí X U(0, 10) Y (X 3) 2 + N(0, 6 2 ) Trenovaci MSE: Testovaci MSE: Polynom 6 teho stupne P. Pošík c 2010 Aplikace umělé inteligence 31 / 36
49 Chyba na trénovacích a testovacích datech Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí MSE Trenovaci MSE Testovaci MSE Slozitost Chyba na trénovacích datech se snižuje se vzrůstající flexibilitou Chyba na testovacích datech je pro určitou flexibilitu minimální P. Pošík c 2010 Aplikace umělé inteligence 32 / 36
50 Shrnutí Existuje dokonalý model? Základní otázka Požadavky na model z hlediska ML Testovací data Chyba na trénovacích a testovacích datech Shrnutí Dva extrémy flexibility 1. Málo flexibilní model (jednoduchý model) Model je silně vychýlen, zaujat (biased) Model je stabilní (vzhledem ke změně trénovací množiny) 2. Moc flexibilní model (složitý model) Velice přesný model (trénovacích dat) Model je velice citlivý (na změnu trénovací množiny) Model, který je nejblíž skutečnosti, se nachází někde mezi nimi Chybu, kterou model bude dělat na nových neznámých datech (pocházejících ze stejného zdroje), lze odhadnout chybou na testovacích datech Chybu na testovacích datech lze využít i pro volbu vhodné struktury P. Pošík c 2010 Aplikace umělé inteligence 33 / 36
51 Shrnutí Reference P. Pošík c 2010 Aplikace umělé inteligence 34 / 36
52 Shrnutí Shrnutí Reference DM (či KDD) se dá chápat jako mnohastupňový proces tvorby modelů strojového učení a jejich nasazování do praxe. Umělá inteligence se zabývá tvorbou umělých entit s inteligentním chováním. je podobor umělé inteligence, který studuje algoritmy umožňující strojům učit se. Rozpoznávání je podoblast strojového učení, kde se studují modely umožňující rozeznat určitou situaci nebo jev a zareagovat na ni. Mezi hlavní úlohy řešené v rámci strojového učení patří klasifikace, regrese, shlukování a odhad pravděpodobnostního rozdělení. Základní metodou pro zajištění kvality naučeného je ověření jeho funkce na nových, tzv. testovacích datech. P. Pošík c 2010 Aplikace umělé inteligence 35 / 36
53 Reference Shrnutí Reference [FSM92] [McC04] W. J. Frawley, Piatetsky G. Shapiro, and C. J. Matheus. Knowledge discovery in databases - an overview. AI Magazine, 13:57 70, John McCarthy. What is Artificial Intelligence P. Pošík c 2010 Aplikace umělé inteligence 36 / 36
Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group
Vytěžování dat Miroslav Čepek, Filip Železný Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Evropský sociální fond Praha & EU: Investujeme
Moderní systémy pro získávání znalostí z informací a dat
Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:
Kybernetika a umělá inteligence, cvičení 10/11
Kybernetika a umělá inteligence, cvičení 10/11 Program 1. seminární cvičení: základní typy klasifikátorů a jejich princip 2. počítačové cvičení: procvičení na problému rozpoznávání číslic... body za aktivitu
Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence
APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.
Úvod do optimalizace, metody hladké optimalizace
Evropský sociální fond Investujeme do vaší budoucnosti Úvod do optimalizace, metody hladké optimalizace Matematika pro informatiky, FIT ČVUT Martin Holeňa, 13. týden LS 2010/2011 O čem to bude? Příklady
UČENÍ BEZ UČITELE. Václav Hlaváč
UČENÍ BEZ UČITELE Václav Hlaváč Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz, http://cmp.felk.cvut.cz/~hlavac 1/22 OBSAH PŘEDNÁŠKY ÚVOD Učení
DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ
DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ Úvod a oblasti aplikací Martin Plchút plchut@e-globals.net DEFINICE A POJMY Netriviální extrakce implicitních, ch, dříve d neznámých a potenciáln lně užitečných informací z
Získávání dat z databází 1 DMINA 2010
Získávání dat z databází 1 DMINA 2010 Získávání dat z databází Motto Kde je moudrost? Ztracena ve znalostech. Kde jsou znalosti? Ztraceny v informacích. Kde jsou informace? Ztraceny v datech. Kde jsou
ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ
metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných
ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ
Metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných
Lineární diskriminační funkce. Perceptronový algoritmus.
Lineární. Perceptronový algoritmus. Petr Pošík Czech Technical University in Prague Faculty of Electrical Engineering Dept. of Cybernetics P. Pošík c 2012 Artificial Intelligence 1 / 12 Binární klasifikace
Katedra kybernetiky, FEL, ČVUT v Praze.
Strojové učení a dolování dat přehled Jiří Kléma Katedra kybernetiky, FEL, ČVUT v Praze http://ida.felk.cvut.cz posnova přednášek Přednáška Učitel Obsah 1. J. Kléma Úvod do předmětu, učení s a bez učitele.
Strojové učení Marta Vomlelová
Strojové učení Marta Vomlelová marta@ktiml.mff.cuni.cz KTIML, S303 Literatura 1.T. Hastie, R. Tishirani, and J. Friedman. The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz LITERATURA Holčík, J.: přednáškové prezentace Holčík, J.: Analýza a klasifikace signálů.
StatSoft Úvod do neuronových sítí
StatSoft Úvod do neuronových sítí Vzhledem k vzrůstající popularitě neuronových sítí jsme se rozhodli Vám je v tomto článku představit a říci si něco o jejich využití. Co si tedy představit pod pojmem
Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma
Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění Jan Klíma Obsah Motivace & cíle práce Evoluční algoritmy Náhradní modelování Stromové regresní metody Implementace a výsledky
Úvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
Využití metod strojového učení v bioinformatice David Hoksza
Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace
Popis zobrazení pomocí fuzzy logiky
Popis zobrazení pomocí fuzzy logiky diplomová práce Ján Fröhlich KM, FJFI, ČVUT 23. dubna 2009 Ján Fröhlich ( KM, FJFI, ČVUT ) Popis zobrazení pomocí fuzzy logiky 23. dubna 2009 1 / 25 Obsah 1 Úvod Základy
Optimální rozdělující nadplocha 4. Support vector machine. Adaboost.
Optimální rozdělující nadplocha. Support vector machine. Adaboost. Petr Pošík Czech Technical University in Prague Faculty of Electrical Engineering Dept. of Cybernetics Opakování Lineární diskriminační
Neuronové sítě Ladislav Horký Karel Břinda
Neuronové sítě Ladislav Horký Karel Břinda Obsah Úvod, historie Modely neuronu, aktivační funkce Topologie sítí Principy učení Konkrétní typy sítí s ukázkami v prostředí Wolfram Mathematica Praktické aplikace
Umělá inteligence a rozpoznávání
Václav Matoušek KIV e-mail: matousek@kiv.zcu.cz 0-1 Sylabus předmětu: Datum Náplň přednášky 11. 2. Úvod, historie a vývoj UI, základní problémové oblasti a typy úloh, aplikace UI, příklady inteligentních
K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami. Josef Keder
K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami Josef Keder Motivace Předpověď budoucí úrovně znečištění ovzduší s předstihem v řádu alespoň několika hodin má význam
Úloha - rozpoznávání číslic
Úloha - rozpoznávání číslic Vojtěch Franc, Tomáš Pajdla a Tomáš Svoboda http://cmp.felk.cvut.cz 27. listopadu 26 Abstrakt Podpůrný text pro cvičení předmětu X33KUI. Vysvětluje tři způsoby rozpoznávání
Přednáška 13 Redukce dimenzionality
Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,
Učící se klasifikátory obrazu v průmyslu
Učící se klasifikátory obrazu v průmyslu FCC průmyslové systémy s.r.o. FCC průmyslové systémy je technicko obchodní společností, působící v oblasti průmyslové automatizace. Tvoří ji dvě základní divize:
Automatizační a měřicí technika (B-AMT)
Ústav automatizace a měřicí techniky Bakalářský studijní program Automatizační a měřicí technika () Specializace oboru Řídicí technika Měřicí technika Průmyslová automatizace Robotika a umělá inteligence
Základy umělé inteligence
Základy umělé inteligence Úvod Základy umělé inteligence - úvod. Vlasta Radová, ZČU, katedra kybernetiky 1 Zavedení pojmu umělá inteligence Inteligence je schopnost získávat a aplikovat vědomosti a tedy
Vytěžování znalostí z dat
Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 8 1/26 Vytěžování znalostí z dat Pavel Kordík, Josef Borkovec Department of Computer Systems Faculty of Information
Výpočetní teorie učení. PAC učení. VC dimenze.
Výpočetní teorie učení. PAC učení. VC dimenze. Petr Pošík Czech Technical University in Prague Faculty of Electrical Engineering Dept. of Cybernetics COLT 2 Koncept...........................................................................................................
Emergence chování robotických agentů: neuroevoluce
Emergence chování robotických agentů: neuroevoluce Petra Vidnerová, Stanislav Slušný, Roman Neruda Ústav Informatiky, AV ČR Kognice a umělý život VIII Praha 28. 5. 2008 Evoluční robotika: EA & neuronové
Pokročilé neparametrické metody. Klára Kubošová
Pokročilé neparametrické metody Klára Kubošová Pokročilé neparametrické metody Výuka 13 přednášek doplněných o praktické cvičení v SW Úvod do neparametrických metod + princip rozhodovacích stromů Klasifikační
Ústav automatizace a měřicí techniky.
www.feec.vutbr.cz Specializace studijního oboru Automatizační a Měřicí Technika: Řídicí technika Moderní algoritmy řízení, teorie řízení Modelování a identifikace parametrů řízených systémů Pokročilé metody
Využití strojového učení k identifikaci protein-ligand aktivních míst
Využití strojového učení k identifikaci protein-ligand aktivních míst David Hoksza, Radoslav Krivák SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita
Pokročilé operace s obrazem
Získávání a analýza obrazové informace Pokročilé operace s obrazem Biofyzikální ústav Lékařské fakulty Masarykovy univerzity Brno prezentace je součástí projektu FRVŠ č.2487/2011 (BFÚ LF MU) Získávání
Usuzování za neurčitosti
Usuzování za neurčitosti 25.11.2014 8-1 Usuzování za neurčitosti Hypotetické usuzování a zpětná indukce Míry postačitelnosti a nezbytnosti Kombinace důkazů Šíření pravděpodobnosti v inferenčních sítích
Vytěžování znalostí z dat
Pavel Kordík, Jan Motl (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 7 1/27 Vytěžování znalostí z dat Pavel Kordík, Jan Motl Department of Computer Systems Faculty of Information Technology
METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1
METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 DOLOVÁNÍ V DATECH (DATA MINING) OBJEVUJE SE JIŽ OD 60. LET 20. ST. S ROZVOJEM POČÍTAČOVÉ TECHNIKY DEFINICE PROCES VÝBĚRU, PROHLEDÁVÁNÍ A MODELOVÁNÍ
2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat
2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi,
Neuronové sítě (11. přednáška)
Neuronové sítě (11. přednáška) Machine Learning Naučit stroje se učit O co jde? Máme model výpočtu (t.j. výpočetní postup jednoznačně daný vstupy a nějakými parametry), chceme najít vhodné nastavení parametrů,
MATEMATICKÁ TEORIE ROZHODOVÁNÍ
MATEMATICKÁ metodický list č. 1 Řešení úloh Cílem tohoto tematického celku je vysvětlení vybraných pojmů z oblasti řešení úloh. Tématický celek je rozdělen do těchto dílčích témat: 1. Řešení úloh ve stavovém
O kurzu MSTU Témata probíraná v MSTU
O kurzu MSTU Témata probíraná v MSTU 1.: Úvod do STU. Základní dělení, paradigmata. 2.: Základy statistiky. Charakteristiky, rozložení, testy. 3.: Modely: rozhodovací stromy. 4.: Modely: učení založené
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Bayesovské modely Doc. RNDr. Iveta Mrázová, CSc.
Dobývání a vizualizace znalostí
Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu 1. Dobývání znalostí - popis a metodika procesu a objasnění základních pojmů 2. Nástroje pro modelování klasifikovaných dat a jejich
Odhady Parametrů Lineární Regrese
Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké
Analýza dat pomocí systému Weka, Rapid miner a Enterprise miner
Vysoká škola ekonomická v Praze Analýza dat pomocí systému Weka, Rapid miner a Enterprise miner Dobývání znalostí z databází 4IZ450 XXXXXXXXXXX Přidělená data a jejich popis Data určená pro zpracování
Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup
Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009
Algoritmy a struktury neuropočítačů ASN - P11
Aplikace UNS při rozpoznání obrazů Základní úloha segmentace obrazu rozdělení obrazu do několika významných oblastí klasifikační úloha, clusterová analýza target Metody Kohonenova metoda KSOM Kohonenova
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní
Získávání znalostí z dat
Získávání znalostí z dat Informační a komunikační technologie ve zdravotnictví Získávání znalostí z dat Definice: proces netriviálního získávání implicitní, dříve neznámé a potencionálně užitečné informace
UITS / ISY. Ústav inteligentních systémů Fakulta informačních technologií VUT v Brně. ISY: Výzkumná skupina inteligentních systémů 1 / 14
UITS / ISY Výzkumná skupina inteligentních systémů Ústav inteligentních systémů Fakulta informačních technologií VUT v Brně ISY: Výzkumná skupina inteligentních systémů 1 / 14 Obsah Představení skupiny
MATEMATICKÁ TEORIE ROZHODOVÁNÍ
MATEMATICKÁ TEORIE ROZHODOVÁNÍ Metodický list č. 1 Název tématického celku: Řešení úloh Cílem tohoto tematického celku je vysvětlení vybraných pojmů z oblasti řešení úloh. Tématický celek je rozdělen do
Následující text je součástí učebních textů předmětu Bi0034 Analýza a klasifikace dat a je určen
11. Klasifikace V této kapitole se seznámíme s účelem, principy a jednotlivými metodami klasifikace dat, jež tvoří samostatnou rozsáhlou oblast analýzy dat. Klasifikace umožňuje určit, do které skupiny
Umělé neuronové sítě
Umělé neuronové sítě 17. 3. 2018 5-1 Model umělého neuronu y výstup neuronu u vnitřní potenciál neuronu w i váhy neuronu x i vstupy neuronu Θ práh neuronu f neuronová aktivační funkce 5-2 Neuronové aktivační
ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ 2014 7.4 13/14
ZÁKLADY PROGRAMOVÁNÍ Mgr. Vladislav BEDNÁŘ 2014 7.4 13/14 Co je vhodné vědět, než si vybereme programovací jazyk a začneme programovat roboty. 1 / 13 0:40 Implementace Umělá inteligence (UI) Umělá inteligence
Numerická stabilita algoritmů
Numerická stabilita algoritmů Petr Tichý 9. října 2013 1 Numerická stabilita algoritmů Pravidla v konečné aritmetice Pro počítání v konečné aritmetice počítače platí určitá pravidla, která jsou důležitá
Rozpoznávání písmen. Jiří Šejnoha Rudolf Kadlec (c) 2005
Rozpoznávání písmen Jiří Šejnoha Rudolf Kadlec (c) 2005 Osnova Motivace Popis problému Povaha dat Neuronová síť Architektura Výsledky Zhodnocení a závěr Popis problému Jedná se o praktický problém, kdy
1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15
Úvodní poznámky... 11 1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15 1.1 Základní pojmy... 15 1.2 Aplikační oblasti a etapy zpracování signálů... 17 1.3 Klasifikace diskretních
Ambasadoři přírodovědných a technických oborů. Ing. Michal Řepka Březen - duben 2013
Ambasadoři přírodovědných a technických oborů Ing. Michal Řepka Březen - duben 2013 Umělé neuronové sítě Proč právě Neuronové sítě? K čemu je to dobré? Používá se to někde v praxi? Úvod Umělé neuronové
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných
Václav Matoušek KIV. Umělá inteligence a rozpoznávání. Václav Matoušek / KIV
Umělá inteligence a rozpoznávání Václav Matoušek KIV e-mail: matousek@kiv.zcu.cz 0-1 Sylabus předmětu: Datum Náplň přednášky 16. 2. (3h) 2. 3. (4h) 17. 3. (5h) 14. 4. (3h) Úvod, historie a vývoj UI, základní
Měření závislosti statistických dat
5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě
1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,
KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce
BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni
BAYESOVSKÉ ODHADY V NĚKTERÝCH MODELECH Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Slunce Řidiči IQ Regrese Přežití Obvyklý model Pozorování X = (X 1,..., X
5. Umělé neuronové sítě. Neuronové sítě
Neuronové sítě Přesný algoritmus práce přírodních neuronových systémů není doposud znám. Přesto experimentální výsledky na modelech těchto systémů dávají dnes velmi slibné výsledky. Tyto systémy, včetně
Neuronové sítě. 1 Úvod. 2 Historie. 3 Modely neuronu
Neuronové sítě L. Horký*, K. Břinda** Fakulta jaderná a fyzikálně inženýrská, Břehová 7, 115 19 Praha 1 *horkyladislav@seznam.cz, **brinda@fjfi.cvut.cz Abstrakt Cílem našeho příspěvku je získat uživatelský
1. Znalostní systémy a znalostní inženýrství - úvod. Znalostní systémy. úvodní úvahy a předpoklady. 26. září 2017
Znalostní systémy úvodní úvahy a předpoklady 26. září 2017 1-1 Znalostní systém Definice ZS (Feigenbaum): Znalostní (původně expertní) systémy jsou počítačové programy simulující rozhodovací činnost experta
Neuronové časové řady (ANN-TS)
Neuronové časové řady (ANN-TS) Menu: QCExpert Prediktivní metody Neuronové časové řady Tento modul (Artificial Neural Network Time Series ANN-TS) využívá modelovacího potenciálu neuronové sítě k predikci
Úvod do zpracování signálů
1 / 25 Úvod do zpracování signálů Karel Horák Rozvrh přednášky: 1. Spojitý a diskrétní signál. 2. Spektrum signálu. 3. Vzorkovací věta. 4. Konvoluce signálů. 5. Korelace signálů. 2 / 25 Úvod do zpracování
Strukturální regresní modely. určitý nadhled nad rozličnými typy modelů
Strukturální regresní modely určitý nadhled nad rozličnými typy modelů Jde zlepšit odhad k-nn? Odhad k-nn konverguje pro slušné k očekávané hodnotě. ALE POMALU! Jiné přístupy přidají předpoklad o funkci
DATA MINING KLASIFIKACE DMINA LS 2009/2010
DATA MINING KLASIFIKACE DMINA LS 2009/2010 Osnova co je to klasifikace typy klasifikátoru typy výstupu jednoduchý klasifikátor (1R) rozhodovací stromy Klasifikace (ohodnocení) zařazuje data do předdefinovaných
Elektronická podpora výuky na ÚBMI
Závěrečná zpráva rozvojového projektu Elektronická podpora výuky na ÚBMI MŠMT č. 645 Odpovědný řešitel: Prof. Ing. Jiří Holčík, CSc. ČVUT v Praze - FBMI Kladno, leden 2006 Vyhodnocení splněných cílů a
Dobývání a vizualizace znalostí
Dobývání a vizualizace znalostí Olga Štěpánková, Lenka Vysloužilová, et al. https://cw.fel.cvut.cz/wiki/courses/a6m33dvz/start 1 Osnova přednášky Úvod: data, objem, reprezentace a základní terminologie
PREDIKCE POČTU UCHAZEČŮ O STUDIUM S VYUŽITÍM NEURONOVÝCH SÍTÍ
PREDIKCE POČTU UCHAZEČŮ O STUDIUM S VYUŽITÍM NEURONOVÝCH SÍTÍ P. Matušík Evropský polytechnický institut, s.r.o, Osvobození 699, 686 04 Kunovice Abstract Neuronové sítě se v době využívají v řadě vědních
Téma 48 (dříve 47) Martin Staviař, staviarm@centrum.cz. 16. srpna 2006
Téma 48 (dříve 47) Martin Staviař, staviarm@centrum.cz 16. srpna 2006 Rozpoznávání a vnímání. Statistický (příznakový) a strukturní přístup. Klasifikátory a jejich učení. Cíle umělé inteligence. Reprezentace
ÚVOD DO ROZHODOVÁNÍ PŘEDNÁŠKA. OPTIMALIZACE A ROZHODOVÁNÍ V DOPRAVĚ Přednáška 1. Zuzana Bělinová
PŘEDNÁŠKA 1 ÚVOD DO ROZHODOVÁNÍ Organizační Vyučující Ing., Ph.D. email: belinova@k620.fd.cvut.cz Doporučená literatura Dudorkin J. Operační výzkum. Požadavky zápočtu docházka zápočtový test (21.5.2015)
Markovovy modely v Bioinformatice
Markovovy modely v Bioinformatice Outline Markovovy modely obecně Profilové HMM Další použití HMM v Bioinformatice Analýza biologických sekvencí Biologické sekvence: DNA,RNA,protein prim.str. Sekvenování
Vytěžování dat přednáška I
České vysoké učení technické v Praze Fakulta elektrotechnická Katedra kybernetiky Katedra počítačů Vytěžování dat přednáška I Úvod do vytěžování dat Filip Železný: zelezny@fel.cvut.cz Pavel Kordík: kordikp@fel.cvut.cz
BA_EM Electronic Marketing. Pavel
BA_EM Electronic Marketing Pavel Kotyza @VŠFS Agenda Efektivní data mining jako zdroj relevantních dat o potřebách zákazníků Co je data mining? Je absolutní Je předem neznámý Je užitečný Co jsou data?
NG C Implementace plně rekurentní
NG C Implementace plně rekurentní neuronové sítě v systému Mathematica Zdeněk Buk, Miroslav Šnorek {bukz1 snorek}@fel.cvut.cz Neural Computing Group Department of Computer Science and Engineering, Faculty
Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou
Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................
Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod
PSY117/454 Statistická analýza dat v psychologii Přednáška 12 Vícerozměrné metody Schematický úvod Co je na slově statistika tak divného, že jeho vyslovení tak často způsobuje napjaté ticho? William Kruskal
Obsah. Seznam obrázků. Seznam tabulek. Petr Berka, 2011
Petr Berka, 2011 Obsah... 1... 1 1 Obsah 1... 1 Dobývání znalostí z databází 1 Dobývání znalostí z databází O dobývání znalostí z databází (Knowledge Discovery in Databases, KDD) se začíná ve vědeckých
Statistická analýza dat
Statistická analýza dat Jméno: Podpis: Cvičení Zkouška (písemná + ústní) 25 Celkem 50 Známka Pokyny k vypracování: doba řešení je 120min, jasně zodpovězte pokud možno všechny otázky ze zadání, pracujte
8-9. Pravděpodobnostní rozhodování a predikce. Gerstnerova laboratoř katedra kybernetiky fakulta elektrotechnická ČVUT v Praze
KYBERNETIKA A UMĚLÁ INTELIGENCE 8-9. Pravděpodobnostní rozhodování a predikce laboratory Gerstner Gerstnerova laboratoř katedra kybernetiky fakulta elektrotechnická ČVUT v Praze Rozhodování za neurčitosti
Úvod do expertních systémů
Úvod do expertních systémů Expertní systém Definice ES (Feigenbaum): expertní systémy jsou počítačové programy, simulující rozhodovací činnost experta při řešení složitých úloh a využívající vhodně zakódovaných,
ANALÝZA BIOLOGICKÝCH A KLINICKÝCH DAT V MEZIOBOROVÉM POJETÍ
ANALÝZA BIOLOGICKÝCH A KLINICKÝCH DAT V MEZIOBOROVÉM POJETÍ INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz 5. LETNÍ ŠKOLA MATEMATICKÉ BIOLOGIE ANALÝZA BIOLOGICKÝCH A KLINICKÝCH DAT V MEZIOBOROVÉM
Rozdělování dat do trénovacích a testovacích množin
Rozdělování dat do trénovacích a testovacích množin Marcel Jiřina Rozpoznávání je důležitou metodou při zpracování reálných úloh. Rozpoznávání je definováno dvěma kroky a to pořízením dat o reálném rozpoznávaném
Získávání znalostí z databází. Alois Kužela
Získávání znalostí z databází Alois Kužela Obsah související pojmy datové sklady, získávání znalostí asocianí pravidla 2/37 Úvod získávání znalostí z dat, dolování (z) dat, data mining proces netriviálního
i=1 Přímka a úsečka. Body, které leží na přímce procházející body a a b můžeme zapsat pomocí parametrické rovnice
I. Funkce dvou a více reálných proměnných 1. Úvod Značení: V textu budeme používat označení: N pro množinu všech přirozených čísel; R pro množinu všech reálných čísel; R n pro množinu všech uspořádaných
Vybrané přístupy řešení neurčitosti
Vybrané přístupy řešení neurčitosti Úvod do znalostního inženýrství, ZS 2015/16 8-1 Faktory jistoty Jedná se o přístup založený na ad hoc modelech Hlavním důvodem vzniku tohoto přístupu je omezení slabin
Klasifikace a rozpoznávání. Lineární klasifikátory
Klasifikace a rozpoznávání Lineární klasifikátory Opakování - Skalární součin x = x1 x 2 w = w T x = w 1 w 2 x 1 x 2 w1 w 2 = w 1 x 1 + w 2 x 2 x. w w T x w Lineární klasifikátor y(x) = w T x + w 0 Vyber
Jak se matematika poučila v biologii
Jak se matematika poučila v biologii René Kalus IT4Innovations, VŠB TUO Role matematiky v (nejen) přírodních vědách Matematika inspirující a sloužící jazyk pro komunikaci s přírodou V 4 3 r 3 Matematika
Dobývání a vizualizace znalostí. Olga Štěpánková et al.
Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu Dobývání znalostí - popis a metodika procesu CRISP a objasnění základních pojmů Nástroje pro modelování klasifikovaných dat a jejich
Uživatelská podpora v prostředí WWW
Uživatelská podpora v prostředí WWW Jiří Jelínek Katedra managementu informací Fakulta managementu Jindřichův Hradec Vysoká škola ekonomická Praha Úvod WWW obsáhlost obsahová i formátová pestrost dokumenty,
7. Rozdělení pravděpodobnosti ve statistice
7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,
NÁVRH A REALIZACE TRADING STRATEGIÍ NA BÁZI STROJOVÉHO UČENÍ S POMOCÍ MATLABU
NÁVRH A REALIZACE TRADING STRATEGIÍ NA BÁZI STROJOVÉHO UČENÍ S POMOCÍ MATLABU RNDr. Miroslav Pavelka, PhD m.pavelka@sh.cvut.cz Ing. Jan Hovad jan@hovad.cz OBSAH Obchodování a strojové učení Specifika prediktivního
Fakulta informačních technologií VUT Brno. Předmět: Srovnání klasifikátorů Autor : Jakub Mahdal Login: xmahda03 Datum:
Fakulta informačních technologií VUT Brno Předmět: Projekt: SRE Srovnání klasifikátorů Autor : Jakub Mahdal Login: xmahda03 Datum: 9.12.2006 Zadání Vyberte si jakékoliv 2 klasifikátory, např. GMM vs. neuronová