ANALÝZA A KLASIFIKACE DAT

Podobné dokumenty
ANALÝZA A KLASIFIKACE DAT. Institut biostatistiky a analýz

ANALÝZA A KLASIFIKACE DAT

ANALÝZA A KLASIFIKACE DAT

Úvod do optimalizace, metody hladké optimalizace

SIGNÁLY A LINEÁRNÍ SYSTÉMY

Parametrická rovnice přímky v rovině

Drsná matematika III 1. přednáška Funkce více proměnných: křivky, směrové derivace, diferenciál

11 Vzdálenost podprostorů

Kybernetika a umělá inteligence, cvičení 10/11

6.1 Vektorový prostor

Lineární klasifikátory

Aplikovaná numerická matematika

Úloha - rozpoznávání číslic

Matematika I 12a Euklidovská geometrie

Zavedeme-li souřadnicový systém {0, x, y, z}, pak můžeme křivku definovat pomocí vektorové funkce.

Učební texty k státní bakalářské zkoušce Matematika Skalární součin. študenti MFF 15. augusta 2008

Lineární algebra : Skalární součin a ortogonalita

6. Vektorový počet Studijní text. 6. Vektorový počet

ANALYTICKÁ GEOMETRIE LINEÁRNÍCH ÚTVARŮ V ROVINĚ

Drsná matematika I 13. přednáška Kvadriky a projektivní rozšíření

prof. RNDr. Čestmír Burdík DrCs. prof. Ing. Edita Pelantová CSc. BI-ZMA ZS 2009/2010

Trénování sítě pomocí učení s učitelem

Projekt OPVK - CZ.1.07/1.1.00/ Matematika pro všechny. Univerzita Palackého v Olomouci

ICT podporuje moderní způsoby výuky CZ.1.07/1.5.00/ Matematika analytická geometrie. Mgr. Pavel Liška

ANALÝZA A KLASIFIKACE DAT

Úvodní informace. 17. února 2018

Optimální rozdělující nadplocha 4. Support vector machine. Adaboost.

Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy

X = A + tu. Obr x = a 1 + tu 1 y = a 2 + tu 2, t R, y = kx + q, k, q R (6.1)

Teorie systémů TES 1. Úvod

Poznámka. V některých literaturách se pro označení vektoru také používá symbolu u.

Euklidovské prostory. Euklidovský prostor dimense 3

A[a 1 ; a 2 ; a 3 ] souřadnice bodu A v kartézské soustavě souřadnic O xyz

Cyklografie. Cyklický průmět bodu

14. přednáška. Přímka

Diferenciál funkce dvou proměnných. Má-li funkce f = f(x, y) spojité parciální derivace v bodě a, pak lineární formu (funkci)

Interpolace pomocí splajnu

Gymnázium Jiřího Ortena, Kutná Hora. Průřezová témata Poznámky. Téma Školní výstupy Učivo (pojmy) volné rovnoběžné promítání průmětna

Eukleidovský prostor a KSS Eukleidovský prostor je bodový prostor, ve kterém je definována vzdálenost dvou bodů (metrika)

Diferenciální počet 1 1. f(x) = ln arcsin 1 + x 1 x. 1 x 1 a x 1 0. f(x) = (cos x) cosh x + 3x. x 0 je derivace funkce f(x) v bodě x0.

Drsná matematika III 3. přednáška Funkce více proměnných: Inverzní a implicitně definovaná zobrazení, vázané extrémy

Funkce v ıce promˇ enn ych Extr emy Pˇredn aˇska p at a 12.bˇrezna 2018

Elementární křivky a plochy

U Úvod do modelování a simulace systémů

Matematika B101MA1, B101MA2

Vektorový prostor. Př.1. R 2 ; R 3 ; R n Dvě operace v R n : u + v = (u 1 + v 1,...u n + v n ), V (E 3 )...množina vektorů v E 3,

19 Eukleidovský bodový prostor

Matematická funkce. Kartézský součin. Zobrazení. Uspořádanou dvojici prvků x, y označujeme [x, y] Uspořádané dvojice jsou si rovny, pokud platí:

Matematika pro informatiky

EUKLIDOVSKÉ PROSTORY

1 Připomenutí vybraných pojmů

Následující text je součástí učebních textů předmětu Bi0034 Analýza a klasifikace dat a je určen

3.2. ANALYTICKÁ GEOMETRIE ROVINY

Gyrační poloměr jako invariant relativistického pohybu. 2 Nerovnoměrný pohyb po kružnici v R 2

Analytická geometrie lineárních útvarů

I. Diferenciální rovnice. 3. Rovnici y = x+y+1. převeďte vhodnou transformací na rovnici homogenní (vzniklou

Funkce - pro třídu 1EB

Hammingův odhad. perfektní kódy. koule, objem koule perfektní kód. triviální, Hammingův, Golayův váhový polynom. výpočet. příklad

Kótované promítání. Úvod. Zobrazení bodu

Matematika II, úroveň A ukázkový test č. 1 (2018) 1. a) Napište postačující podmínku pro diferencovatelnost funkce n-proměnných v otevřené

VEKTORY. Obrázek 1: Jediný vektor. Souřadnice vektoru jsou jeho průměty do souřadných os x a y u dvojrozměrného vektoru, AB = B A

Matematika B101MA1, B101MA2

Rovnice přímky. s = AB = B A. X A = t s tj. X = A + t s, kde t R. t je parametr. x = a 1 + ts 1 y = a 2 + ts 2 z = a 3 + ts 3. t R

1 Báze a dimenze vektorového prostoru 1

1. Parametrické vyjádření přímky Přímku v prostoru můžeme vyjádřit jen parametricky, protože obecná rovnice přímky v prostoru neexistuje.

Dodatek 2: Funkce dvou proměnných 1/9

Vlastní čísla a vlastní vektory

ZÁKLADY AUTOMATICKÉHO ŘÍZENÍ

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

FUNKCE POJEM, VLASTNOSTI, GRAF

AB = 3 CB B A = 3 (B C) C = 1 (4B A) C = 4; k ]

VZOROVÝ TEST PRO 3. ROČNÍK (3. A, 5. C)

1 Analytická geometrie

Pokročilé neparametrické metody. Klára Kubošová

Matematika II, úroveň A ukázkový test č. 1 (2017) 1. a) Napište postačující podmínku pro diferencovatelnost funkce n-proměnných v otevřené

19 Hilbertovy prostory

1 Topologie roviny a prostoru

Matematika 1 MA1. 1 Analytická geometrie v prostoru - základní pojmy. 4 Vzdálenosti. 12. přednáška ( ) Matematika 1 1 / 32

Klasifikace a rozpoznávání. Extrakce příznaků

PŘÍMKA A JEJÍ VYJÁDŘENÍ V ANALYTICKÉ GEOMETRII

Mgr. Tomáš Kotler. I. Cvičný test 2 II. Autorské řešení 6 III. Klíč 15 IV. Záznamový list 17

Základní vlastnosti eukleidovského prostoru

f(x) = arccotg x 2 x lim f(x). Určete všechny asymptoty grafu x 2 2 =

Necht L je lineární prostor nad R. Operaci : L L R nazýváme

y = 2x2 + 10xy + 5. (a) = 7. y Úloha 2.: Určete rovnici tečné roviny a normály ke grafu funkce f = f(x, y) v bodě (a, f(a)). f(x, y) = x, a = (1, 1).

DERIVACE FUKNCÍ VÍCE PROMĚNNÝCH

Matematika II, úroveň A ukázkový test č. 1 (2016) 1. a) Napište postačující podmínku pro diferencovatelnost funkce n-proměnných v otevřené

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

12. Křivkové integrály

i=1 Přímka a úsečka. Body, které leží na přímce procházející body a a b můžeme zapsat pomocí parametrické rovnice

Úvodem Dříve les než stromy 3 Operace s maticemi

Mgr. Tomáš Kotler. I. Cvičný test 2 II. Autorské řešení 7 III. Klíč 15 IV. Záznamový list 17

7 Analytická geometrie v rovině

Nejprve si uděláme malé opakování z kurzu Množiny obecně.

Ambasadoři přírodovědných a technických oborů. Ing. Michal Řepka Březen - duben 2013

Úvod do modelování a simulace. Ing. Michal Dorda, Ph.D.

Požadavky ke zkoušce

α β ) právě tehdy, když pro jednotlivé hodnoty platí β1 αn βn. Danou relaci nazýváme relace

Rosenblattův perceptron

Vlastní číslo, vektor

Transkript:

ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz

III. PŘÍZNAKOVÁ KLASIFIKACE - ÚVOD

PŘÍZNAKOVÝ POPIS Příznakový obraz x zpracovávaných dat je vyjádřen n-rozměrným (sloupcovým) vektorem hodnot x i, i=1,2,,n příznakových proměnných (veličin) charakterizujících vlastnosti těchto dat, tj. platí x=(x 1,x 2,,x n ) T.

PŘÍZNAKOVÝ POPIS Příznakové proměnné mohou popisovat kvantitativní i kvalitativní vlastnosti souboru dat. Jejich hodnoty nazýváme příznaky. Podle definičního oboru rozlišujeme proměnné: spojité nespojité, diskrétní, vyjmenovatelné logické, binární, alternativní, dichotomické

PŘÍZNAKOVÝ POPIS Vrchol každého příznakového vektoru (obrazu) představuje bod n-rozměrného prostoru X n, který nazýváme obrazovým prostorem. Obrazový prostor je definován kartézským součinem definičních oborů všech příznakovým proměnných, tzn. že jej tvoří všechny možné obrazy zpracovávaného souboru dat.

PŘÍZNAKOVÝ POPIS Při vhodném výběru příznakových veličin je podobnost signálů jedné klasifikační třídy vyjádřena blízkostí jejich obrazů v obrazovém prostoru. Vymezení klasifikační třídy: etalony - charakteristické reprezentativní obrazy hranice diskriminační funkce

PŘÍZNAKOVÝ KLASIFIKÁTOR Příznakový klasifikátor je stroj s tolika vstupy, kolik je příznaků a s jedním diskrétním výstupem, který udává třídu, do které klasifikátor zařadil rozpoznávaný obraz. ω r = d(x) d(x) je skalární funkce vektorového argumentu x, kterou nazýváme rozhodovací pravidlo klasifikátoru; ω r je identifikátor klasifikační třídy

PŘÍZNAKOVÝ KLASIFIKÁTOR deterministický a nedeterministický s pevným a proměnným počtem příznaků bez učení a s učením

PŘÍZNAKOVÝ KLASIFIKÁTOR deterministický a nedeterministický s pevným a proměnným počtem příznaků bez učení a s učením Nadále se nějaký čas věnujme deterministickým klasifikátorům s pevným počtem příznaků.

PŘÍZNAKOVÝ KLASIFIKÁTOR Obrazový prostor je rozhodovacím pravidlem rozdělen na R disjunktních prostorů R r, r=1,,r, přičemž každá podmnožina R r obsahuje ty obrazy x, pro které je ω r = d(x). Návrh rozhodovacího pravidla je základním problémem návrhu klasifikátoru.

KLASIFIKACE PODLE DISKRIMINAČNÍCH FUNKCÍ hranice klasifikačních tříd definujeme pomocí R skalárních funkcí g 1 (x), g 2 (x),, g R (x) takových, že pro obraz x z podmnožiny R r pro všechna r platí g r (x) > g s (x), pro s =1,2,,R a r s funkce g r (x) mohou vyjadřovat např. míru výskytu obrazu x patřícího do r-té klasifikační třídy v daném místě obrazového prostoru nazýváme je diskriminační funkce

KLASIFIKACE PODLE DISKRIMINAČNÍCH FUNKCÍ hranice mezi dvěma sousedními podmnožinami R r a R s je určena průmětem průsečíku funkcí g r (x) a g s (x), definovaného rovnicí g r (x) = g s (x), do obrazového prostoru.

BLOKOVÉ SCHÉMA KLASIFIKÁTORU POMOCÍ DISKRIMINAČNÍCH FUNKCÍ

BLOKOVÉ SCHÉMA KLASIFIKÁTORU POMOCÍ DISKRIMINAČNÍCH FUNKCÍ u dichotomického klasifikátoru (dvě třídy) je ω = sign (g 1 (x) g 2 (x))

KLASIFIKACE PODLE DISKRIMINAČNÍCH FUNKCÍ nejjednodušším tvarem diskriminační funkce je funkce lineární, která má tvar g r (x) = a r0 + a r1 x 1 + a r2 x 2 + + a rn x n kde a r0 je práh diskriminační funkce posouvající počátek souřadného systému a a ri jsou váhové koeficienty i-tého příznaku x i lineárně separabilní třídy

KLASIFIKACE PODLE DISKRIMINAČNÍCH FUNKCÍ nejjednodušším tvarem diskriminační funkce je funkce lineární, která má tvar g r (x) = a r0 + a r1 x 1 + a r2 x 2 + + a rn x n kde a r0 je práh diskriminační funkce posouvající počátek souřadného systému a a ri jsou váhové koeficienty i-tého příznaku x i lineárně separabilní třídy

KLASIFIKACE PODLE DISKRIMINAČNÍCH FUNKCÍ nejjednodušším tvarem diskriminační funkce je funkce lineární, která má tvar g r (x) = a r0 + a r1 x 1 + a r2 x 2 + + a rn x n kde a r0 je práh diskriminační funkce posouvající počátek souřadného systému a a ri jsou váhové koeficienty i-tého příznaku x i lineárně separabilní třídy

KLASIFIKACE PODLE DISKRIMINAČNÍCH FUNKCÍ nejjednodušším tvarem diskriminační funkce je funkce lineární, která má tvar g r (x) = a r0 + a r1 x 1 + a r2 x 2 + + a rn x n kde a r0 je práh diskriminační funkce posouvající počátek souřadného systému a a ri jsou váhové koeficienty i-tého příznaku x i lineárně separabilní třídy

KLASIFIKACE PODLE DISKRIMINAČNÍCH FUNKCÍ LINEÁRNĚ NESEPARABILNÍ TŘÍDY zachováme původní obrazový prostor a zvolíme nelineární diskriminační funkci definovanou obecně složenou po částech z lineárních úseků zobrazíme původní n-rozměrný obrazový prostor X n nelineární transformací Φ: X n X m do nového m-rozměrného prostoru X m, obecně je m n, tak, aby v novém prostoru byly klasifikační třídy lineárně separabilní a v novém prostoru použijeme lineární klasifikátor (Φ převodník)

KLASIFIKACE PODLE MINIMÁLN LNÍ VZDÁLENOSTI reprezentativní obrazy klasifikačních tříd - etalony je-li v obrazovém prostoru zadáno R poloh etalonů vektory x 1E, x 2E,, x RE, zařadí klasifikátor podle minimální vzdálenosti klasifikovaný obraz x do té třídy, jejíž etalon má od bodu x minimální vzdálenost. Rozhodovací pravidlo je určeno vztahem d( x) = x re x = min s x se x

KLASIFIKACE PODLE MINIMÁLN LNÍ VZDÁLENOSTI uvažme případ dvou tříd reprezentovaných etalony x 1E = (x 11E, x 12E ) a x 2E = (x 21E, x 22E ) ve dvoupříznakovém euklidovském prostoru; vzdálenost mezi obrazem x = (x 1,x 2 ) a libovolným z obou etalonů je pak definována v( x 2 2 se, x) = xse x = (xs1e x1) + (xs2e x2 ) hledáme menší z obou vzdáleností, tj. min s=1,2 v(x se,x), ale také min s=1,2 v 2 (x se,x); min v( x s se min x s, x) min v ( x min (x ( ) 2 2 x ) + (x x ) ( ) 2 2 2 2 + x 2[x x + x x (x + x )/ 2] 1 s 2 2 se s1e, x) = 1 s s2e 2 s1e 1 s1e s2e s1e 1 =

KLASIFIKACE PODLE MINIMÁLN LNÍ VZDÁLENOSTI

KLASIFIKACE PODLE MINIMÁLN LNÍ VZDÁLENOSTI diskriminační kuželové plochy se protínají v parabole a její průmět do obrazové roviny je přímka definovaná vztahem x 1 (x 11E -x 21E ) + x 2 (x 12E -x 22E ) - (x 2 12E + x2 11E -x2 21E -x2 22E )/2 = 0 Tato hraniční přímka mezi klasifikačními třídami je vždy kolmá na spojnici obou etalonů a tuto spojnici půlí klasifikátor pracující na základě kritéria minimální vzdálenosti je ekvivalentní lineárnímu klasifikátoru s diskriminačními funkcemi.

KLASIFIKACE PODLE MINIMÁLN LNÍ VZDÁLENOSTI Klasifikace podle minimální vzdálenosti s třídami reprezentovanými více etalony je ekvivalentní klasifikaci podle diskriminační funkce s po částech lineární hraniční plochou