ANALÝZA A KLASIFIKACE DAT

Podobné dokumenty
ANALÝZA A KLASIFIKACE DAT

ANALÝZA A KLASIFIKACE DAT

Strukturální rozpoznávání

Regulární výrazy. Definice Množina regulárních výrazů nad abecedou Σ, označovaná RE(Σ), je definována induktivně takto:

Množinu všech slov nad abecedou Σ značíme Σ * Množinu všech neprázdných slov Σ + Jazyk nad abecedou Σ je libovolná množina slov nad Σ

Euklidovský prostor. Funkce dvou proměnných: základní pojmy, limita a spojitost.

Vícerozměrné statistické metody

Turingovy stroje. Teoretická informatika Tomáš Foltýnek

Automaty a gramatiky(bi-aag) Motivace. 1. Základní pojmy. 2 domácí úkoly po 6 bodech 3 testy za bodů celkem 40 bodů

METRICKÉ A NORMOVANÉ PROSTORY

Teoretická informatika - Úkol č.1

ANALÝZA A KLASIFIKACE DAT

doplněk, zřetězení, Kleeneho operaci a reverzi. Ukážeme ještě další operace s jazyky, na které je

Následující text je součástí učebních textů předmětu Bi0034 Analýza a klasifikace dat a je určen

TGH02 - teorie grafů, základní pojmy

Matematika B101MA1, B101MA2

Formální jazyky a gramatiky Teorie programovacích jazyků

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT. Institut biostatistiky a analýz

Vlastnosti regulárních jazyků

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Projekty - Úvod do funkcionální analýzy

Grafy. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 13.

Výpočetní modely pro rozpoznávání bezkontextových jazyků zásobníkové automaty LL(k) a LR(k) analyzátory

1 Základní pojmy 2. 2 Měření vzdálenosti, metrický prostor 2. 3 Okolí v metrickém prostoru 3. 4 Zobecněná koule 3

TGH02 - teorie grafů, základní pojmy

Definice 1.1. Nechť je M množina. Funkci ρ : M M R nazveme metrikou, jestliže má následující vlastnosti:

1. přednáška 1. října Kapitola 1. Metrické prostory.

MATEMATIKA A 3 Metodický list č. 1

Statistika. pro žáky 8. ročníku. úterý, 26. března 13

SIGNÁLY A LINEÁRNÍ SYSTÉMY

Cílem kapitoly je opakování a rozšíření středoškolských znalostí v oblasti teorie množin.

Jan Pavĺık. FSI VUT v Brně

TGH02 - teorie grafů, základní pojmy

Syntaxí řízený překlad

Vícerozměrné statistické metody

Teorie množin. Čekají nás základní množinové operace kartézské součiny, relace zobrazení, operace. Teoretické základy informatiky.

AUTOMATY A GRAMATIKY. Pavel Surynek. Kontextové uzávěrové vlastnosti Turingův stroj Rekurzivně spočetné jazyky Kódování, enumerace

i=1 λ ix i,λ i T,x i M}.Množinuvektorů

Úvod do informatiky. Miroslav Kolařík. Zpracováno dle učebního textu prof. Bělohlávka: Úvod do informatiky, KMI UPOL, Olomouc 2008.

Výroková logika. Teoretická informatika Tomáš Foltýnek

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Pracovní list žáka (SŠ)

prof. RNDr. Čestmír Burdík DrCs. prof. Ing. Edita Pelantová CSc. BI-ZMA ZS 2009/2010

2 Formální jazyky a gramatiky

Zobrazování těles. problematika geometrického modelování. základní typy modelů. datové reprezentace modelů základní metody geometrického modelování

Úvod do teorie grafů

Množiny, základní číselné množiny, množinové operace

Automaty a gramatiky(bi-aag) Formální překlady. 5. Překladové konečné automaty. h(ε) = ε, h(xa) = h(x)h(a), x, x T, a T.

B i n á r n í r e l a c e. Patrik Kavecký, Radomír Hamřík

Gymnázium, Brno, Elgartova 3

Úvod do informatiky. Miroslav Kolařík

AJ FolI. ČJ ReiR. Tv BraD. M ReiR

Základy teoretické informatiky Formální jazyky a automaty

Grafové algoritmy. Programovací techniky

Grafové algoritmy. Programovací techniky

Algoritmizace prostorových úloh

SIGNÁLY A LINEÁRNÍ SYSTÉMY

NÁHODNÝ VEKTOR. 4. cvičení

Konečný automat Teorie programovacích jazyků

Matematika I (KMI/PMATE)

0. ÚVOD - matematické symboly, značení,

Poslední aktualizace: 14. října 2011

PROGRAMOVACÍ JAZYKY A PŘEKLADAČE FORMALISMY PRO SYNTAXÍ ŘÍZENÝ PŘEKLAD: PŘEKLADOVÉ A ATRIBUTOVÉ GRAMATIKY.

Formální systém výrokové logiky

1 Vektorové prostory a podprostory

Algebra - druhý díl. Lenka Zalabová. zima Ústav matematiky a biomatematiky, Přírodovědecká fakulta, Jihočeská univerzita

Algoritmizace prostorových úloh

Lineární rovnice pro učební obory

Metody analýzy dat I. Míry a metriky - pokračování

Základy tvorby výpočtového modelu

Domény. Petr Štěpánek. S využitím materialu Krysztofa R. Apta

TGH08 - Optimální kostry

Syntaxí řízený překlad

Teorie systémů TES 1. Úvod

Voronoiův diagram. RNDr. Petra Surynková, Ph.D. Univerzita Karlova v Praze Matematicko-fyzikální fakulta

Grafy. RNDr. Petra Surynková, Ph.D. Univerzita Karlova v Praze Matematicko-fyzikální fakulta.

OSTRAVSKÁ UNIVERZITA V OSTRAVĚ PŘÍRODOVĚDECKÁ FAKULTA

Vztah jazyků Chomskeho hierarchie a jazyků TS

Základní vztahy v elektrických

Algoritmus. Přesné znění definice algoritmu zní: Algoritmus je procedura proveditelná Turingovým strojem.

MATEMATICKÁ BIOLOGIE

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Téma 22. Ondřej Nývlt

Generování sítě konečných prvků

10. Techniky formální verifikace a validace

0.1 Úvod do matematické analýzy

IB112 Základy matematiky

Pumping lemma - podstata problému. Automaty a gramatiky(bi-aag) Pumping lemma - problem resolution. Pumping lemma - podstata problému

Naproti tomu gramatika je vlastně soupis pravidel, jak

Kapitola 6. LL gramatiky. 6.1 Definice LL(k) gramatik. Definice 6.3. Necht G = (N, Σ, P, S) je CFG, k 1 je celé číslo.

Cvičné texty ke státní maturitě z matematiky

6.1 Vektorový prostor

Formální jazyky a automaty Petr Šimeček

Aritmetika s didaktikou I.

Metrické prostory a kompaktnost

2.6. VLASTNÍ ČÍSLA A VEKTORY MATIC

Řešení 5. série kategorie Student

ANALÝZA BIOLOGICKÝCH A KLINICKÝCH DAT V MEZIOBOROVÉM POJETÍ

Dynamické programování

Transkript:

ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz

II. STRUKTURÁLNÍ KLASIFIKACE

STRUKTURÁLNÍ POPIS relační struktura je vytvořena z určitých elementárních popisných částí dat, tzv. primitiv a vzájemných vztahů mezi nimi relacemi; relační struktury zpravidla vyjadřujeme pomocí grafů;

STRUKTURÁLNÍ POPIS

STRUKTURÁLNÍ POPIS

TYPY RELAČNÍCH STRUKTUR řetězce (uvuuyzuvw) pole (především pro reprezentaci 2D obrazů) stromy (relační struktura neobsahující cykly a paralelní cesty) obecné grafy

STRUKTURÁLNÍ POPIS

STRUKTURÁLNÍ POPIS

KOMBINOVANÝ STRUKTURÁLNÍ POPIS

REPREZENTACE KLASIFIKAČNÍ TŘÍDY výčtem relačních struktur (může být bohužel velký až nekonečný)

REPREZENTACE KLASIFIKAČNÍ TŘÍDY výčtem relačních struktur (může být bohužel velký až nekonečný) generátorem relačních struktur gramatika Gramatika je čtveřice G = (V n, V t, P, S), kde V n a V t jsou konečné disjunktní množiny (abecedy), přičemž prvky množiny V n nazývají neteminální pomocné symboly a prvky V t terminální symboly, S V n je tzv. axiom gramatiky nebo také počáteční symbol a P je množina substitučních pravidel tvaru, které definují způsob náhrady dílčí relační struktury novou strukturou.

REPREZENTACE KLASIFIKAČNÍ TŘÍDY výčtem relačních struktur (může být bohužel velký až nekonečný) generátorem relačních struktur gramatika Příklad gramatiky: G = ((A,B), (0,1), P, A), P = (A 0B1, 0B 00B, B e ). Příklad generování řetezce: A 0B1 00B1 000B1 0001

REPREZENTACE KLASIFIKAČNÍ TŘÍDY výčtem relačních struktur (může být bohužel velký až nekonečný) generátorem relačních struktur gramatika příjemcem relačních struktur automat různé typy automatů podle charakteru relační struktury a substitučních pravidel nejjednodušší konečný automat Konečný stavový automat A je pětice A = (X, S, s 0, S c, Ꮄ), kde X je konečná vstupní abeceda, S je množina vnitřních stavů, s 0 je počáteční stav automatu, S c je množina cílových stavů automatu a Ꮄ: X x S S je přechodová funkce.

REPREZENTACE KLASIFIKAČNÍ TŘÍDY výčtem relačních struktur (může být bohužel velký až nekonečný) generátorem relačních struktur gramatika příjemcem relačních struktur automat Příklad konečného stavového automatu

REPREZENTACE KLASIFIKAČNÍ TŘÍDY výčtem relačních struktur (může být bohužel velký až nekonečný) generátorem relačních struktur gramatika příjemcem relačních struktur automat ekvivalence gramatiky a automatu gramatika a automat jsou ekvivalentní, pokud množina relačních struktur generovaná gramatikou a množina akceptovaná automatem jsou stejné

STRUKTURÁLNÍ KLASIFIKACE nedeformované relační struktury ztotožnění s reprezentativními relačními strukturami; přijetí automatem

STRUKTURÁLNÍ KLASIFIKACE deformované relační struktury

STRUKTURÁLNÍ POPIS

STRUKTURÁLNÍ KLASIFIKACE deformované relační struktury podle vzdálenosti od etalonu jak vzdálenost určíme?

STRUKTURÁLNÍ KLASIFIKACE deformované relační struktury podle vzdálenosti od etalonu jak vzdálenost určíme? vzdálenost vs. metrika?

METRIKA - VZDÁLENOST Metrika ρ na X je funkce ρ: X X R, kde R je množina reálných čísel, taková, že: Když dále ρ 0 R: - < ρ 0 ρ(x,y) < +, x,y X ρ(x,x) = ρ 0, x X a ρ(x,y) = ρ(y,x), x,y X. (symetrie) ρ(x, y) = ρ 0 když a jen když x = y (totožnost) a ρ(x, z) ρ(x, y) + ρ(y, z), x,y,z X. ( nerovnost) Prostor X, ve kterém metrika ρ definována, nazýváme metrickým prostorem. Vzdálenost je hodnota určená podle metriky.

METRIKA PODOBNOSTI - PODOBNOST Metrická míra podobnosti s na X je funkce s: X X R, kde R je množina reálných čísel, taková, že: Když dále s 0 R: - < s(x,y) s 0 < +, x,y X s(x,x) = s 0, x X a s(x,y) = s(y,x), x,y X. (symetrie) s(x,y) = s 0 když a jen když x = y (totožnost) a s(x,y).s(x,y) [s(x,y) + s(y,z)].s(x,z), x,y,z X.

STRUKTURÁLNÍ VZDÁLENOST V případě řetězců lze deformační vlivy vyjádřit (na úrovni primitiv) trojicí tzv. elementárních deformačních transformací eliminací, substitucí a inzercí

VÁHOVANÁ LEVENŠTEJNOVA METRIKA

VÁHOVANÁ LEVENŠTEJNOVA METRIKA

DALŠÍ STRUKTURÁLNÍ METRIKY řetězce prostá (neváhovaná) Levenštejnova metrika Hammingova metrika stromy : :

KLASIFIKACE DEFORMOVANÝCH STRUKTUR výpočet vzdálenosti mezi reprezentativními strukturami (etalony) klasifikační třídy a klasifikovanou strukturou; začlenění deformačních pravidel do substitučních pravidel gramatiky (resp. automatu);

VYTVOŘENÍ STRUKTURÁLNÍHO ETALONU MNOŽINY PÍSMEN

VYTVOŘENÍ STRUKTURÁLNÍHO ETALONU MNOŽINY PÍSMEN

SHRNUTÍ POKUD MOŽNO CO NEJOBECNĚJI základní klasifikační úloha je zatřídit (z hlediska prostoru i času) (matematický, abstraktní) popis daného klasifikovaného objektu do odpovídající třídy/kategorie; děje se to na základě klasifikačního pravidla, pomocí kterého je definována klasifikační třída; klasifikační třída může být definována: výčtem prvků do ní patřících; vzdáleností/podobností (od) vzorů té které třídy; hranicemi, vymezujícími prostor dané třídy.

STRUKTURÁLNÍ KLASIFIKACE DALŠÍ PŘÍKLAD ZE ŽIVOTA

STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁLŮ

STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁLŮ

STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁLŮ

STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁLŮ index řetězec četnost výskytu index řetězec četnost výskytu 1 ABCJEF 6 10 ABCDDEL 1 2 ABCJE 3 11 ACJE 1 3 ACJEFF 1 12 ACDJE 1 4 GBCDDEF 3 13 ABCJFF 1 5 AIDDE 2 14 ABIDDF 2 6 GBCDDE 1 15 ACDDK 1 7 ABCJ 2 16 ABCDDKF 1 8 ACJEF 2 17 9 ABCJF 1

STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁLŮ

STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁLŮ

STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁLŮ

STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁLŮ Minimální kostra (minimum spanning tree) graf, který spojuje všechny objekty tak, že se zde nevyskytují žádné smyčky nebo kružnice a zároveň součet délky spojnic mezi uzly (objekty) je minimální

STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁLŮ

STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁLŮ etalonové řetězce pro jednotlivé shluky určené iteračními algoritmy jsou: Ia ABCJEF Va ACDDK Ib ABCJEF IIa ACJEF VIa ABIDDF IIb ACDDE IIIa AIDDE VIIa GBCDDEF IIIb ABCDDE IVa GCDDF

Příprava nových učebních materiálů oboru Matematická biologie je podporována projektem ESF č. CZ.1.07/2.2.00/07.0318 VÍCEOBOROVÁ INOVACE STUDIA MATEMATICKÉ BIOLOGIE INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ