Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence



Podobné dokumenty
ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Moderní systémy pro získávání znalostí z informací a dat

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Dobývání a vizualizace znalostí

Využití metod strojového učení v bioinformatice David Hoksza

Učící se klasifikátory obrazu v průmyslu

Dolování z textu. Martin Vítek

Strojové učení Marta Vomlelová

GRR. získávání znalostí v geografických datech Autoři. Knowledge Discovery Group Faculty of Informatics Masaryk Univerzity Brno, Czech Republic

Dobývání a vizualizace znalostí

2. RBF neuronové sítě

Získávání dat z databází 1 DMINA 2010

Získávání znalostí z databází. Alois Kužela

Dobývání a vizualizace znalostí

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně

Dobývání a vizualizace znalostí. Olga Štěpánková et al.

Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma

Obsah přednášky Jaká asi bude chyba modelu na nových datech?

vzorek vzorek

Vytěžování znalostí z dat

Fiala P., Karhan P., Ptáček J. Oddělení lékařské fyziky a radiační ochrany Fakultní nemocnice Olomouc

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Uživatelská podpora v prostředí WWW

Fakulta informačních technologií VUT Brno. Předmět: Srovnání klasifikátorů Autor : Jakub Mahdal Login: xmahda03 Datum:

Emergence chování robotických agentů: neuroevoluce

Přednáška 13 Redukce dimenzionality

ANALÝZA BIOLOGICKÝCH A KLINICKÝCH DAT V MEZIOBOROVÉM POJETÍ

Dolování asociačních pravidel

Testování neuronových sítí pro prostorovou interpolaci v softwaru GRASS GIS

IBM SPSS Neural Networks

Neuronové sítě Ladislav Horký Karel Břinda

Návrh a vyhodnocení experimentu

Lineární diskriminační funkce. Perceptronový algoritmus.

Univerzita Pardubice 8. licenční studium chemometrie

VŠB Technická univerzita Ostrava BIOSTATISTIKA

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje

Umělé neuronové sítě

Sémantický web a extrakce

1. Data mining. Strojové učení. Základní úlohy.

Automatické vyhledávání informace a znalosti v elektronických textových datech

Design of Experiment (DOE) Petr Misák. Brno 2017

Národní informační středisko pro podporu kvality

Katedra kybernetiky, FEL, ČVUT v Praze.

Využití strojového učení k identifikaci protein-ligand aktivních míst

Algoritmy a struktury neuropočítačů ASN - P11

Rozpoznávání písmen. Jiří Šejnoha Rudolf Kadlec (c) 2005

Optimální rozdělující nadplocha 4. Support vector machine. Adaboost.

Strojové učení se zaměřením na vliv vstupních dat

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Analytické procedury v systému LISp-Miner

5. Umělé neuronové sítě. neuronové sítě. Umělé Ondřej Valenta, Václav Matoušek. 5-1 Umělá inteligence a rozpoznávání, LS 2015

Dolování dat z dotazníků. Ondřej Takács

Získávání znalostí z dat

ANALÝZA A KLASIFIKACE DAT

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

VŠB Technická univerzita Ostrava

Ochutnávka strojového učení

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

ZÁKLADY STATISTICKÉHO ZPRACOVÁNÍ ÚDAJŮ 5. hodina , zapsala Veronika Vinklátová Revize zápisu Martin Holub,

Identifikace. Jiří Jelínek. Katedra managementu informací Fakulta managementu J. Hradec Vysoká škola ekonomická Praha

3. Vícevrstvé dopředné sítě

Cvičná bakalářská zkouška, 1. varianta

KLASIFIKÁTOR MODULACÍ S VYUŽITÍM UMĚLÉ NEURONOVÉ SÍTĚ

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

Vytěžování dat přednáška I

Algoritmy pro shlukování prostorových dat

prekrocena mez ukazatele kvality.

ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT. Institut biostatistiky a analýz

Kybernetika a umělá inteligence, cvičení 10/11

pracovní list studenta

K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami. Josef Keder

Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat při managementu jakosti. Semestrální práce:

Datová věda (Data Science) akademický navazující magisterský program

MODELOVÁNÍ BONITY OBCÍ POMOCÍ KOHONENOVÝCH SAMOORGANIZUJÍCÍCH SE MAP A LVQ NEURONOVÝCH SÍTÍ

Spojení OntoUML a GLIKREM ve znalostním rozhodování

Úvodem Dříve les než stromy 3 Operace s maticemi

Umělá inteligence a rozpoznávání

Dolování znalostí z rozsáhlých statistických souborů lékařských dat

Neuronové časové řady (ANN-TS)

Ambasadoři přírodovědných a technických oborů. Ing. Michal Řepka Březen - duben 2013

Úvod do RapidMineru. Praha & EU: Investujeme do vaší budoucnosti. 1 / 23 Úvod do RapidMineru

HODNOCENÍ VÝUKY STUDENTY PEDF UK ZS 2016/2017

Statistická teorie učení

Vytěžování znalostí z dat

Obsah. Předmluva 13. O autorovi 15. Poděkování 16. O odborných korektorech 17. Úvod 19

Dobývání dat a strojové učení

Úloha - rozpoznávání číslic

PREDIKCE VÝROBY FV SYSTÉMŮ

Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi. Geografický seminář 30. března 2011 Pavel Bednář

1 Tabulky Příklad 3 Access 2010

Metoda Monte Carlo a její aplikace v problematice oceňování technologií. Manuál k programu

Návrh a vyhodnocení experimentu

Pokročilé operace s obrazem

Informace pro výběr bakalářského oboru

IBM SPSS Decision Trees

Daniel Beneš Slezská univerzita v Opavě Filozoficko-přírodovědecká fakulta Ústav informatiky

Transkript:

APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY FAKULTA EKONOMICKO-SPRÁVNÍ UNIVERZITA PARDUBICE PETR.HAJEK@UPCE.CZ

Objevování znalostí a strojové učení I Objevování znalostí (Knowledge Discovery) je možné definovat jako proces netriviálního dolování implicitních, dosud neznámých a potenciálně užitečných informací z dat. Příkladem znalosti je následující vzorek: IF věk < 25 AND kurs_výchovy_řidičů = Ne THEN nehoda = Ano s_pravděpodobností = 0.2. Tato znalost je ihned srozumitelná a použitelná. Zároveň ji lze vložit do jiného programu (např. ř expertního systému). Málokdy platí objevená znalost pro všechna data. Proto je používána míra určitosti C, která určuje míru důvěry, kterou má mít systém nebo uživatel v objevenou znalost. Bez dostatečné míry určitosti jsou vzorky neopodstatněné a nemohou proto být znalostmi.

Objevování znalostí a strojové učení II Cílem strojového učeníč je vypočítat t takovou funkci f, pomocí které bude možné správně klasifikovat jak data použitá pro její výpočet (tzv. trénovací data), tak i další data mimo množinu trénovacích dat (tzv. testovací data). Metody objevování znalostí mají za úkol jednak identifikovat zajímavé vzorky v datech a jednak je výstižně a smysluplně popsat. p Proces identifikace spočívá ve shlukování záznamů do tříd, které reprezentují vzorky vpůvodních datech. Proces popisu shrnuje důležité vlastnosti identifikovaných tříd. Ve strojovém učení se tyto procesy nazývají učení bez učitele (identifikace) a učení s učitelem (popis).

Systém na objevování znalostí v databázích

Úkoly I Načtěte data German credit do programového prostředí Weka. http://www.uloz.to/9320007/credit-g-cesky-arff Znázorněte histogramy všech atributů. Znázorněte závislosti mezi vybranými atributy t (použijte zvětšení grafu a symbolů). Proveďte selekci atributů (pomocí filtrů např. založenou na korelacích, Chí-kvadrát testu, atd. a wrapperů pomocí zvoleného klasifikátoru) a extrakci nových atributů pomocí metody hlavních komponent. Odstraňte z původní množiny atributů ty, které se ukázaly jako statisticky nevýznamné (např. na základě selekce založené na korelacích s vyhledáváním pomocí genetických algoritmů). Proveďte shlukování vzorků (znázorněte také směrodatné odchylky a porovnejte výsledek se skutečnou klasifikací).

Úkoly II Nastavte t matici i nákladů pro klasifikaci. i Nechte na výstupu zobrazit také predikované hodnoty. Vyzkoušejte rozdělení na trénovací a testovací data v % poměru a 10-násobnou křížovou validaci. Použijte rozhodovací strom SimpleCart, jaké budou výsledky při prořezávání stromu a bez něj? Co když použijete jen trénovací data? Jaké informace dává predikce jednotlivých vzorků? P žijt l áh d ý h h d í h t ů J ký Použijte les náhodných rozhodovacích stromů. Jaký počet stromů je pro daný problém optimální?

Úkoly III Pro dopřednou neuronovou síť typu Perceptron použijte grafické uživatelské prostředí. Vyzkoušejte experimenty pro různé počty neuronů ve skryté vrstvě ě a různé ů rychlosti učení. č U RBF neuronové sítě měňte počet neuronů ve skryté vrstvě. U SVM měňte parametr komplexnosti, popř. typ jádrové funkce (polynomická, RBF). Odstraňte z množiny atributů kvantitativní atributy a vyzkoušejte si tvorbu asociačních pravidel pomocí apriori algoritmu. Jaké budou výsledky, když se změní parametr podpory a parametr určitosti. Jaký počet pravidel je potřeba nastavit?

Načtení dat

Četnosti atributů

Vizualizace závislostí

Datový slovník

Struktura datového souboru

Identifikace tříd

Klasifikační strom

Výsledek klasifikace

Objevování znalostí pomocí oc asociačních ač c pravidel

Neuronové sítě

Dopředná neuronová síť

RBF neuronová o síť ť a Support VectorMachines es

Děkuji za pozornost